专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果3055603个,建议您升级VIP下载更多相关专利
  • [发明专利]一种基于时间卷积与自注意力的情感预测方法及系统-CN202210086699.2在审
  • 孙涛;权志邦 - 齐鲁工业大学
  • 2022-01-25 - 2022-04-29 - G06F16/906
  • 本发明提供了一种基于时间卷积与自注意力的情感预测方法及系统,包括:获取文本模态数据、音频模态数据以及视频模态数据;利用预先训练好的自编码语言模型提取文本模态数据的文本特征向量;利用预先训练好的音频特征提取模型提取音频模态的音频特征向量;利用预先训练好的视频特征提取模型提取视频模态的视频特征向量;将文本特征向量、音频特征向量以及视频特征向量进行融合,得到最终的融合后的多模态特征向量。本发明将一种基于时间卷积与自注意力机制的多模态数据特征表示方法,旨在改进当前多模态数据特征表示效果,以更好的用于多模态情感分析。
  • 一种基于时间卷积注意力情感预测方法系统
  • [发明专利]基于深度学习的语音频带扩展方法、装置及编码方法-CN202210636744.7在审
  • 李强;王尧;叶东翔;朱勇 - 北京百瑞互联技术有限公司
  • 2022-06-07 - 2022-09-09 - G10L21/0388
  • 本申请公开了一种基于深度学习的语音频带扩展方法、装置及编码方法,属于音频编码技术领域,该方法包括:对音频数据进行编码至低延迟改进型离散余弦变换后,得到音频数据对应的谱系数,并进行特征提取,得到具有元音和摩擦音信息的第一特征参数;对音频数据进行重采样和长期后置滤波器处理,并对处理的结果进行特征提取,得到具有元音和摩擦音信息的第二特征参数;将第一特征参数和第二特征参数输入到预训练的神经网络模型中,生成音频数据对应的全带宽谱系数。本申请利用编码过程中的已有参数,并进行特征提取,获取音频数据中关于元音和摩擦音的特征,充分考虑原有音频数据中元音和摩擦音的不同,进行更加准确的频带扩展,提升用户体验。
  • 基于深度学习语音频带扩展方法装置编码
  • [发明专利]音频审核的处理方法、装置、设备及存储介质-CN202010840734.6在审
  • 付立 - 京东科技控股股份有限公司
  • 2020-08-20 - 2022-03-11 - G06F16/68
  • 本发明实施例提供一种音频审核的处理方法、装置、设备及存储介质,该方法包括:获取待处理音频数据;对所述待处理音频数据进行特征提取,获得所述待处理音频数据对应的频谱特征数据;将所述频谱特征数据输入到预先训练获得的音频审核模型,获得所述待处理音频数据的识别结果,所述音频审核模型至少包括卷积神经网络模块和自注意力模块;根据所述识别结果确定并输出所述待处理音频数据的审核结果。由于音频审核模型是基于卷积神经网络并结合自注意力机制,卷积神经网络可以实现对浅层特征提取,自注意力模块可以进行音频时序特征提取,从而有效提高音频特征提取性能,进而提高音频审核模型的审核准确率。
  • 音频审核处理方法装置设备存储介质
  • [发明专利]语音识别方法、装置、计算机设备及存储介质-CN202210587567.8在审
  • 丁超越;宗道明;李家魁;李宝祥 - 上海商汤智能科技有限公司
  • 2022-05-25 - 2022-07-29 - G10L15/02
  • 本公开提供了一种语音识别方法、装置、计算机设备及存储介质,其中,该方法包括:获取待识别的目标音频数据,并对所述目标音频数据进行音频特征提取,得到所述目标音频数据对应的音频提取特征;将所述音频提取特征输入至预先训练好的目标编码器中,得到所述目标编码器输出的与所述目标音频数据对应的音频编码特征;其中,所述目标编码器包含自注意力网络,所述自注意力网络在确定目标查询矩阵时采用池化处理操作;所述目标查询矩阵为所述自注意力网络在基于自注意力机制进行特征提取时确定的多个特征表示矩阵中的一个;基于所述音频编码特征,确定所述目标音频数据对应的语音识别结果。
  • 语音识别方法装置计算机设备存储介质
  • [发明专利]音频分类方法、电子设备以及存储介质-CN202110537040.X有效
  • 马路;杨嵩 - 北京世纪好未来教育科技有限公司
  • 2021-05-18 - 2021-07-30 - G06F16/65
  • 本发明公开了一种音频分类方法、电子设备以及存储介质,其中,该方法包括:确定待处理音频信号;将待处理音频信号输入至编码器;将编码器输出的音频信号输入至瓶颈层;将瓶颈层输出的音频信号输入至多尺度特征提取模块,提取输入尺度特征提取模块的音频信号的不同尺度特征;将不同尺度特征输入至分类器,获取对音频的分类结果。解决了现有技术中由于采用短时傅里叶变换将时域音频转换到时频域的二维语谱图进行音频分类,导致分类模型较大,且准确率和实时率不高的问题。在本发明中利用堆叠的一维膨胀卷积网络提取输入音频的多尺度特征,并利用不同尺度特征进行音频分类,模型结构小,且具有较高的准确率和实时率。
  • 音频分类方法电子设备以及存储介质
  • [发明专利]语音情绪波动分析方法及装置-CN201911341679.X在审
  • 朱锦祥;单以磊;臧磊 - 深圳壹账通智能科技有限公司
  • 2019-12-24 - 2020-04-28 - G10L25/63
  • 本发明实施例提供一种语音情绪波动分析方法,包括:获取待测语音数据的第一音频特征和第一文字特征;基于预先训练好的音频识别模型中的音频特征提取网络,提取第一音频特征中的第二音频特征;基于预先训练好的文字识别模型中的文字特征提取网络,提取第一文字特征中的第二文字特征;识别第二音频特征,获取音频情绪识别结果;识别第二文字特征,获取文字情绪识别结果;对音频情绪识别结果和文字情绪识别结果进行融合处理,得到情绪识别结果,并将所述情绪识别结果发送至关联终端
  • 语音情绪波动分析方法装置
  • [发明专利]语音合成、特征提取模型训练方法、装置、介质及设备-CN202010768365.4有效
  • 殷翔 - 北京字节跳动网络技术有限公司
  • 2020-08-03 - 2022-09-16 - G10L15/02
  • 本公开涉及一种语音合成、特征提取模型训练方法、装置、介质及设备,所述语音合成方法包括:获取待处理的唇动数据;通过声学特征提取模型对所述唇动数据进行处理,以得到所述唇动数据对应的声学特征信息;根据所述声学特征信息进行语音合成,以得到与所述唇动数据对应的音频信息;其中,所述声学特征提取模型是通过将样本唇动数据对应的目标文本信息作为模型约束条件进行训练得到的。由此,可以一定程度上保证确定出的音频信息中语义连续性和准确性。该声学特征提取模型是基于文本信息对模型进行约束训练获得的,可以通过增加文本学习的辅助任务以提高该声学特征提取模型对不同的测试数据的适用,提高该声学特征提取模型的准确性和适用范围。
  • 语音合成特征提取模型训练方法装置介质设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top