专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果3055603个,建议您升级VIP下载更多相关专利
  • [发明专利]一种野生动物声音识别方法和装置-CN202310903052.9有效
  • 马国学;冯占林 - 志成信科(北京)科技有限公司
  • 2023-07-21 - 2023-09-12 - G10L17/26
  • 本发明提供一种野生动物声音识别方法和装置,通过将不同发声机制的音频特征提取识别划分为不同子任务,每个子任务对应一个多标签分类任务,用于同一发声机制的多种类型动物的声音识别,以解决难以兼顾众多不同类型声音的音频特征的学习和提取的问题,具体通过通用特征提取子模型对输入的音频信号进行全局特征提取,得到该音频信号中尽可能完整、全面的音频特征,利用多个多标签分类子模型对通用特征提取子模型提取音频特征进行针对性筛选,从全面却欠缺针对性的音频特征中提炼出更具代表性、针对当前多标签分类子模型对应的多种动物类型更具区分性的音频特征,从而提升各个多标签分类子模型的识别精度,进而提升多动物混杂的声音识别精度。
  • 一种野生动物声音识别方法装置
  • [发明专利]一种哼唱识别方法、设备及介质-CN202310249583.0在审
  • 苏斌 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2023-03-15 - 2023-06-30 - G10L25/69
  • 本申请公开了一种哼唱识别方法、设备及介质,包括:利用特征提取模型提取待识别哼唱音频的第一音频特征特征提取模型为利用哼唱音频样本以及标签训练得到的模型,标签为与哼唱音频样本匹配的MIDI样本文件对应的音高序列,所述第一音频特征为所述特征提取模型中输出层的前一隐藏层输出的特征;将所述第一音频特征与曲谱库中MIDI文件对应的第二音频特征进行匹配;所述第二音频特征为将所述MIDI文件对应的音高序列输入概率扩散模型得到的音频特征,所述第二音频特征为所述概率扩散模型中输出层的前一隐藏层输出的特征;若匹配到第二音频特征,则基于该第二音频特征确定所述待识别哼唱音频的哼唱识别结果。
  • 一种哼唱识别方法设备介质
  • [发明专利]语音动画生成方法、装置、电子设备和介质-CN202310847814.8有效
  • 廖家聪;丘国辰;付星辉;孙钟前 - 腾讯科技(深圳)有限公司
  • 2023-07-12 - 2023-09-08 - G10L21/10
  • 本申请实施例公开了一种语音动画生成方法、装置、电子设备和介质,可以应用于语音技术等人工智能领域;本申请实施例获取特征提取网络和视素生成网络;通过第一音频数据、以及第一音频数据对应的口型标签,训练特征提取网络,得到训练后的特征提取网络;由训练后的特征提取网络,从第二音频数据中提取音素特征;由视素生成网络,生成音素特征对应的视素特征;通过视素特征、以及第二音频数据对应的音素标签,训练视素生成网络,得到训练后的视素生成网络,以便将训练后的特征提取网络以及训练后的视素生成网络用于生成语音动画。本申请中采用两种不同的音频数据和标签,进行有监督的两阶段训练过程,可以提高生成语音动画的准确性。
  • 语音动画生成方法装置电子设备介质
  • [发明专利]基于预训练模型的多模态情感识别方法及装置-CN202311083710.0在审
  • 陶建华 - 清华大学
  • 2023-08-28 - 2023-09-19 - G10L25/63
  • 本公开涉及一种基于预训练模型的多模态情感识别方法及装置,所述方法包括:将待识别音频的语音数据和文本数据分别输入语音编码器和文本编码器,将语音编码器的输出输入语音情感特征提取模块,并将语音情感特征输入语音跨模态情感特征提取模块;将文本编码器的输出输入文本情感特征提取模块,并将文本情感特征输入文本跨模态情感特征提取模块;将语音情感特征提取模块、文本情感特征提取模块、语音跨模态情感特征提取模块和文本跨模态情感特征提取模块的输出,输入预先训练好的情感分类模块中,得到待识别音频的情感类别,编码器和多个模块的联合使用,能够提高情感识别准确率。
  • 基于训练模型多模态情感识别方法装置
  • [发明专利]一种音频场景识别方法、系统及装置-CN202111064395.8有效
  • 张鹏远;王猛;颜永红 - 中国科学院声学研究所
  • 2021-09-10 - 2023-08-29 - G10L25/18
  • 本发明涉及一种音频场景识别方法,方法包括:获取待识别音频;对待识别音频进行小波特征提取,以确定待识别音频对应的小波特征;将待识别音频对应的小波特征输入至具有残差网络结构的神经网络嵌入特征提取器中,以得到至少一个深度嵌入特征序列;将待识别音频对应的小波特征以及至少一个深度嵌入特征序列一并输入至神经网络分类器中,以确定出待识别音频所对应的音频场景。本发明提取待识别语音数据的小波特征,可以自适应时频信号分析的要求。同时结合具有残差网络结构的神经网络嵌入特征提取器可以在大量数据训练时,保障提取的深度嵌入特征在识别时具有更高的准确率,还可极大提升对短时音频的识别性能。
  • 一种音频场景识别方法系统装置
  • [发明专利]歌曲语义信息索引方法及其装置、设备、介质、产品-CN202111491602.8在审
  • 张超钢;肖纯智 - 广州酷狗计算机科技有限公司
  • 2021-12-08 - 2022-07-29 - G06F16/61
  • 本申请公开一种歌曲语义信息索引方法及其装置、设备、介质、产品,所述方法包括:对歌曲音频数据中的音频信息进行编码,获得相应的编码信息;采用已训练至收敛状态的特征提取模型的共享网络中的多个卷积块依次对所述编码信息进行多级特征提取,获得提取了所述歌曲音频数据的深层语义信息的中间特征信息;采用所述特征提取模型的全局分支网络对所述中间特征信息提取全局显著特征,获得全局输出特征向量;采用所述特征提取模型的局部分支网络对所述中间特征信息按通道等分割分别提取语义局部特征,获得通道输出特征向量;将所述全局输出特征向量与所述通道特征向量拼接为高维索引向量。本申请能实现对歌曲音频数据的深层语义信息的表示学习。
  • 歌曲语义信息索引方法及其装置设备介质产品
  • [发明专利]音频特征提取方法及装置-CN201810781268.1有效
  • 王辰龙 - 厦门美图之家科技有限公司
  • 2018-07-17 - 2021-01-26 - G10L25/03
  • 本申请实施例提供一种音频特征提取方法及装置。该方法包括:从目标音频数据中提取低层音频特征;将所述低层音频特征输入到预先训练的深度神经网络模型中,提取所述目标音频数据的高层深度特征;通过sigmoid函数对提取到的高层深度特征进行计算,得到所述目标音频数据的音频深度哈希编码,所述音频深度哈希编码作为所述目标音频数据的音频特征表示。由此,本申请提供的音频特征提取方法及装置能够从整体上理解音频语义信息,兼顾音频之间的关联性和差异性,同时提高了音频分类检索效率,支持海量数据的实时检索。
  • 音频特征提取方法装置
  • [发明专利]一种基于音频指纹的电视互动装置及方法-CN201310512978.1无效
  • 李学生;吴文杰 - 李学生
  • 2013-10-28 - 2014-02-05 - H04N21/422
  • 本发明公开了一种基于音频指纹的电视互动装置及方法,该装置包括手机客户单元,电视节目单元。手机客户单元通过广电网络连接电视节目单元。该方法包括电视互动方法和手机互动方法。电视互动方法工作流程为:节目打点,音频解码,音频预处理,音频特征分析,音频特征提取音频指纹生成,音频指纹入库;手机互动方法工作流程为:音频录音,音频预处理,音频特征分析,音频特征提取音频指纹生成,音频指纹上传搜索编码器把电视节目中计划互动时间段音频特征提取后放入音频指纹数据库。节目通过电视播出后,手机端软件采集数秒音频样本,提取特征通过搜索引擎搜索该段样本指纹在音频指纹数据库中位置,通过ID返回至手机。
  • 一种基于音频指纹电视互动装置方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top