专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果452627个,建议您升级VIP下载更多相关专利
  • [发明专利]基于阵列水听器的声音识别方法和装置-CN202111356702.X在审
  • 申和平;张海兵;冯权胜 - 武汉普惠海洋光电技术有限公司
  • 2021-11-16 - 2022-03-22 - G10L25/51
  • 本发明提供一种基于阵列水听器的声音识别方法和装置,该方法包括:基于阵列水听器的多个基元,对目标声音进行采集,得到多个基元的目标音频信号;对各基元的目标音频信号进行多种特征提取,并对多种特征进行特征融合;将各基元的目标音频信号的融合特征输入分类模型中,得到各基元的目标音频信号对应的目标声音的预测类别;对多个基元的目标音频信号对应的预测类别进行融合,得到目标声音的最终类别。本发明实现基于目标音频信号融合特征和多阵元信号进行分类,获取目标声音的最终类别,有效提高分类结果的准确性和鲁棒性;并且在分类过程中,对多种目标音频信号进行同步学习,有效增强分类模型的判断能力,进一步提高分类结果的准确性
  • 基于阵列水听器声音识别方法装置
  • [发明专利]从单音音频信号分离音频信源的神经网络分类-CN200680041405.3无效
  • D·V·施穆克 - DTS公司
  • 2006-10-03 - 2009-02-11 - G10L19/00
  • 本发明提供了一种神经网络分类器,其可以对下混合到单一单音音频信号的多个任意且预先未知的音频信源进行分离和分类。这是通过将该单音音频信号分离成多个基线帧(可能交叠),对这些帧加窗,提取每帧内的多个描述性特征,以及采用预训练的非线性神经网络作为分类器来实现的。每个神经网络输出表明单音音频信号的每个基线帧内的预定类型的音频信源的存在。神经网络分类器非常适于广泛变化的信号和信源参数、信源的时域和频域交叠以及实际生活信号中的回响和遮挡。分类器输出能够用作前端以形成多个音频信道用于源分离算法(例如,ICA)或用作后处理算法的参数(例如,对音乐进行分类,跟踪信源,为导航目的产生音频索引,以及重新混合安全性和监控、电话和无线通信以及电视会议
  • 单音音频信号分离信源神经网络分类
  • [发明专利]一种音频类别的确定方法、装置、电子设备及存储介质-CN202311182243.7在审
  • 张德俊;王秋明 - 北京远鉴信息技术有限公司
  • 2023-09-14 - 2023-10-24 - G10L25/30
  • 本申请提供了一种音频类别的确定方法、装置、电子设备及存储介质,确定方法包括:对待检测音频进行处理,对傅里叶变换处理后的待检测音频进行音频特征提取;将音频特征输入至音频类别检测模型的扩散网络层之中,确定出待检测音频音频特征相对应的视频特征;将视频特征以及音频特征输入至分类网络层之中,对视频特征以及音频特征进行特征融合,并确定出融合后的特征,并对融合后的特征进行分类,输出待检测音频音频类别信息。通过利用扩散网络层确定出音频特征相对应的视频特征,将音频特征以及视频特征进行融合,利用融合后的特征进行音频类别分类,确定出待检测音频音频类别信息,从而提高了音频类别确定的准确性。
  • 一种音频类别确定方法装置电子设备存储介质
  • [发明专利]音频分类方法和装置、电子设备及存储介质-CN202310568337.1在审
  • 张旭龙;王健宗;程宁;孙一夫 - 平安科技(深圳)有限公司
  • 2023-05-19 - 2023-08-25 - G06F16/65
  • 本申请实施例提供了一种音频分类方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取样本视频数据;对样本视频数据进行特征提取,得到样本图像数据、样本文本数据、样本音频数据;通过预设的初始匹配模型对样本音频数据、样本文本数据进行语义匹配,得到第一匹配数据;通过初始匹配模型对样本音频数据、样本图像数据进行语义匹配,得到第二匹配数据;根据第一匹配数据、第二匹配数据对初始匹配模型进行参数调整,得到目标匹配模型;根据目标匹配模型和预设的初始分类模型构建目标分类模型;通过目标分类模型对目标音频数据进行分类本申请实施例能够提高音频数据分类的准确性。
  • 音频分类方法装置电子设备存储介质
  • [发明专利]音频处理方法、设备和计算机程序产品-CN202210192079.7在审
  • 郑炜乔 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2022-02-28 - 2022-06-07 - G10L17/02
  • 本申请涉及音频处理技术领域,提供了一种音频处理方法、计算机设备和计算机程序产品。本申请能够提高对音频中说话人属性信息的识别效率及准确性。该方法包括:针对待处理音频中每一帧提取各自对应的初级特征得到多个第一音频帧特征,通过说话人特征提取网络中特征提取层进一步获取多个第一音频帧特征分别对应的多个高级的第二音频帧特征,通过说话人特征提取网络中池化层将多个第二音频帧特征统一转化为待处理音频音频特征,以将帧级别特征统一转化为音频级别特征且其能表征音频中说话人身份特性,将该音频特征同时输入到多个说话人属性分类器,根据各说话人属性分类器分别输出的分类标签同时得到待处理音频中说话人在多种属性下的分类结果
  • 音频处理方法设备计算机程序产品
  • [发明专利]基于知识蒸馏的肺音分类方法、系统、终端及存储介质-CN202011070732.X在审
  • 李坚强;陈杰;明仲;梁中明;王成 - 深圳大学
  • 2020-10-09 - 2020-11-13 - G10L25/51
  • 本发明公开了一种基于知识蒸馏的肺音分类方法、系统、终端及存储介质,所述方法包括:获取肺音音频,并基于所述肺音音频提取所述肺音音频的梅尔频谱特征,得到肺音数据集;基于所述肺音数据集对多个教师模型进行训练,得到已训练的多个教师模型;根据所述已训练的多个教师模型分别计算所述肺音数据集的软标签,并经转换后,得到多分类软标签;基于所述多分类软标签和肺音数据集训练学生模型,得到已训练的学生模型,并利用所述已训练的学生模型对所述肺音音频进行分类本发明可以基于知识蒸馏,通过利用多个教师模型的知识,指导学生模型学习,从而充分利用多方肺音音频,并准确对所述肺音音频进行分类
  • 基于知识蒸馏音分方法系统终端存储介质
  • [发明专利]视频分类方法、装置、电子设备及存储介质-CN202210247508.6在审
  • 赵波;胡郡郡;唐大闰 - 北京明略昭辉科技有限公司
  • 2022-03-14 - 2022-06-21 - G06F16/75
  • 本发明提供了一种视频分类方法、装置、电子设备及存储介质,该方法包括:获取待处理的目标视频;通过人工智能模型从所述目标视频中识别出目标音频特征和视频帧特征;将所述目标音频特征作为预训练的特征分类模型的输入,得到多种音频特征;其中,所述特征分类模型包括多个并行分支模型,每个分支模型由携带有一种标签类型的音频特征样本训练卷积神经网络得到;根据所述多种音频特征和所述视频帧特征确定所述目标视频的视频类别。本发明通过对目标视频中的音频特征进行细粒度划分,将得到的分类结果结合目标视频的视频帧特征确定视频的视频类别,提高了视频分类的准确率。
  • 视频分类方法装置电子设备存储介质
  • [发明专利]一种基于时域信息增强的多模态微视频分类方法-CN202310378403.9在审
  • 张博;张伟;朱志良;于海 - 东北大学
  • 2023-04-11 - 2023-07-21 - G06F16/75
  • 本发明提供一种基于时域信息增强的多模态微视频分类方法,涉及视频分类技术领域。该方法首先将待分类微视频切分成多个视频片段;再分离视频片段中的视觉模态、音频模态和文本模态信息,并提取视觉模态特征、音频模态特征和文本模态特征;然后基于各视频片段的视觉模态特征和音频模态特征,选取最具表达力的视频片段;捕捉最具表达力的视频片段的视觉模态和音频模态的时间域相关信息,得到时域信息增强的特征矩阵;最后将时域信息增强的视觉模态特征、音频模态特征与原始的文本模态特征进行融合,得到最终的分类结果。该方法充分的利用了视频的音频和文本模态,对图像信息进行了补充,进一步的提高了分类精度。
  • 一种基于时域信息增强多模态微视频分类方法
  • [发明专利]多通道语音检测的系统和方法-CN202280003961.0在审
  • 艾隆·阿尔瓦雷斯·大卫;郑诣;谭欢 - 深圳市优必选科技股份有限公司
  • 2022-03-25 - 2023-01-13 - G10L15/02
  • 本发明提供了一种多通道语音检测的系统和方法,该方法包括:接收包括一组音频信号的多通道音频输入;使用一神经网络分类器处理该多声道音频输入,以在该多声道音频输入的一系列时间窗口中生成一系列分类结果,其中,该神经网络分类器包括因果时间卷积网络(TCN),其被配置为基于该多通道音频输入在对应时间窗口中和该对应时间窗口之前的一个或多个时间窗口中的部分确定每个时间窗口的分类结果;以及基于所述一系列分类结果确定该多声道音频输入在该一系列时间窗口中是否包括一个或多个语音片段
  • 通道语音检测系统方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top