专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果3055603个,建议您升级VIP下载更多相关专利
  • [发明专利]声音识别方法、装置、设备及存储介质-CN202111330096.4在审
  • 眭一帆 - 北京奇虎科技有限公司
  • 2021-11-10 - 2023-05-12 - G10L15/02
  • 本发明涉及互联网技术领域,公开了一种声音识别方法、装置、设备及存储介质,所述方法包括:对待验证声音数据进行特征提取,获得待验证音频特征信息;对多个标准声音数据进行特征提取,获得多个标准音频特征信息;根据待验证音频特征信息从多个标准音频特征信息中选取目标音频特征信息;根据目标音频特征信息确定待验证声音数据对应的用户身份信息。由于现有技术中,需要人工将待验证声音数据与多个预存声音数据一一比对,进而识别用户身份信息,而本发明中对待验证声音数据及多个标准声音数据分别进行特征提取,之后根据获得的待验证音频特征信息和多个标准音频特征信息确定用户身份信息,实现了精准获取声音识别结果,提高了音频验证效率。
  • 声音识别方法装置设备存储介质
  • [发明专利]一种音频场景分类方法、装置、电子设备和存储介质-CN202110304711.8有效
  • 白雪 - 北京达佳互联信息技术有限公司
  • 2021-03-23 - 2021-06-22 - G10L25/51
  • 本公开关于一种音频场景分类方法、装置、电子设备和存储介质获取音频信息,对音频信息进行声学特征提取,得到第一声学特征信息和第二声学特征信息,并将第一声学特征信息输入到音频场景特征提取模型中进行场景特征提取,得到场景特征信息,将第二声学特征信息输入到声学场景分割模型中进行声学场景分析,得到音频场景信息。将场景特征信息和音频场景信息输入到注意力模型中进行注意力学习,得到场景特征加权信息,再将场景特征加权信息输入到场景分类网络中进行分类,得到场景分类结果。该方法可以获取音频信息中有区分性的音频片段,从而提高音频场景分类的准确性和有效性。
  • 一种音频场景分类方法装置电子设备存储介质
  • [发明专利]视频特征提取方法、装置及电子设备-CN202210771422.3在审
  • 罗冠;魏久桐;李兵;胡卫明 - 中国科学院自动化研究所
  • 2022-06-30 - 2022-11-08 - G06V20/40
  • 本发明提供一种视频特征提取方法、装置及电子设备,涉及视频处理技术领域,可以应用于视频特征提取的场景。该视频特征提取方法包括:获取视频图像和视频图像对应的音频数据;将音频数据转换为声谱图,得到声谱图像;将视频图像和声谱图像输入至视频特征提取模型,得到视频特征提取模型输出的视频特征;其中,视频特征提取模型是基于样本视频数据和对偶式对比学习模型对基础神经网络模型进行预训练得到的,对偶式对比学习模型用于对样本视频数据经基础神经网络模型处理后输出的第一多模态样本特征矩阵分别进行行维度和列维度上的对比学习。本发明提供的技术方案可以提高视频特征提取的准确性和泛化性。
  • 视频特征提取方法装置电子设备
  • [发明专利]一种基于改进MFCC的非语音类音频特征提取方法-CN202210256684.6在审
  • 姜琦;董琦;李红;冯庆胜;丁伟 - 大连交通大学
  • 2022-03-16 - 2022-06-10 - G10L25/24
  • 本发明涉及音频特征提取技术领域,具体公开了一种基于改进MFCC的非语音类音频特征提取方法,包括如下步骤:采集声音信号并对采集到的声音信号进行预处理;将预处理后的声音信号进行MFCC特征提取;将预处理后的声音信号进行EMD分解获得IMF分量,提取IMF分量的时域特征向量和频域特征向量;将MFCC系数做一阶差分与二阶差分,得到组成MFCC的动态特征向量;将计算出的MFCC特征向量、时域特征向量、频域特征向量和MFCC动态特征向量进行特征融合,获得改进后的多尺度MFCC特征向量。本发明可以有效提取音频信号的高频部分,且声音信号特征信息更加丰富、全面,此外,本发明的方法不仅可以处理语音类音频,也可以处理非语音类型的音频如机械声等的音频信号。
  • 一种基于改进mfcc语音音频特征提取方法
  • [发明专利]歌曲索引方法及其装置、设备、介质、产品-CN202111494040.2在审
  • 肖纯智;张超钢 - 广州酷狗计算机科技有限公司
  • 2021-12-08 - 2022-08-02 - G06F16/61
  • 本申请公开一种歌曲索引方法及其装置、设备、介质、产品,所述方法包括:对歌曲音频数据中的音频信息进行编码,获得相应的编码信息;将所述编码信息输入已训练至收敛状态的特征提取模型的共用网络,经该共用网络中的多个卷积块依次对所述编码信息进行多级特征提取,获得中间特征信息;将所述中间特征信息输入所述特征提取模型的两个以上的分支网络,经每个分支网络中的多个卷积块对所述中间特征信息进行特征提取后,转换为相应的输出特征向量,各分支网络的输出特征向量所包含的深层语义信息各不相同;将所述输出特征向量作为表征所述歌曲音频数据的深层语义信息的高维索引向量。本申请提升了歌曲音频数据的深层语义信息的表示学习能力。
  • 歌曲索引方法及其装置设备介质产品
  • [发明专利]基于人工智能的在线服务反馈交互方法及大数据系统-CN202311141567.6在审
  • 王均;段延祥 - 宁波尚煦智能科技有限公司
  • 2023-09-06 - 2023-10-27 - G06F16/332
  • 本申请实施例实施例提供一种基于人工智能的在线服务反馈交互方法及大数据系统,通过基于范例基础对话音频数据以及范例情感对话音频数据,生成范例融合对话音频数据,利用对话音频特征训练网络获取范例融合对话音频数据的第一估计对话知识点数据以及第一估计情感类别数据,并且利用对话音频特征训练网络获取范例情感对话音频数据的第二估计对话知识点数据以及第二估计情感类别数据,由此生成对话音频特征提取网络,可以实现对话音频数据的音频情感特征扩展,减少网络训练过程中的标注工作量,有助于改善对话音频特征提取网络的特征提取性能,从而便于提高后续在线服务反馈的有效性。
  • 基于人工智能在线服务反馈交互方法数据系统
  • [发明专利]声学深度学习模型训练方法、语音生成方法及设备-CN202111310778.9有效
  • 陈栋 - 北京优幕科技有限责任公司
  • 2021-11-08 - 2022-02-15 - G10L15/00
  • 本申请提供一种声学深度学习模型训练方法、语音生成方法及设备,所述语音生成方法包括:获取文本数据和语种信息;根据所述语种信息将所述文本数据转换为音素,并为每个所述音素分别添加语种标签;利用深度学习模型生成音频数据,所述深度学习模型包括音频生成模块、文本特征提取模块、流映射模块和时长预测模块,其中所述文本特征提取模块用于对所述音素提取文本特征值,所述时长预测模块用于根据所述文本特征提取模块提取的文本特征生成时长信息,所述流映射模块用于根据所述文本特征值和所述时长信息计算潜在变量,并根据所述潜在变量生成频谱特征数据,所述音频生成模块根据所述频谱特征数据生成音频数据。
  • 声学深度学习模型训练方法语音生成设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top