[发明专利]音频处理在审

专利信息
申请号: 201880072045.6 申请日: 2018-11-13
公开(公告)号: CN111344781A 公开(公告)日: 2020-06-26
发明(设计)人: J·P·莱索;G·R·麦克劳德 申请(专利权)人: 思睿逻辑国际半导体有限公司
主分类号: G10L17/02 分类号: G10L17/02
代理公司: 北京北翔知识产权代理有限公司 11285 代理人: 郑建晖;李星宇
地址: 英国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种音频处理的方法,包括接收音频信号。形成所接收的音频信号的多个组帧型式,所述组帧型式中的每一组帧型式具有相应的帧起始位置。选择所接收的音频信号的多个组帧型式中的一个组帧型式。在后续的过程中,使用所接收的音频信号的多个组帧型式中的选定的一个组帧型式。
搜索关键词: 音频 处理
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思睿逻辑国际半导体有限公司,未经思睿逻辑国际半导体有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201880072045.6/,转载请声明来源钻瓜专利网。

同类专利
  • 说话人识别-201780047190.4
  • J·P·莱索;J·梅兰森 - 思睿逻辑国际半导体有限公司
  • 2017-08-01 - 2023-06-09 - G10L17/02
  • 本申请描述了用于说话人识别的方法和装置。根据一个实施方案的装置具有一个分析器(202),用于分析与用户发出的言语声音对应的音频数据(AIN)的帧的序列中的每个帧,以确定该帧的言语声音的至少一个特性。一个评估模块(203),用于基于该言语声音的确定的特性为音频数据的每个帧确定音频数据的帧应被用于说话人识别处理的程度的贡献指标。以此方式,可以强调与对说话人区分最有用的言语声音对应的帧和/或可以不再强调与对说话人区分最没有用的言语声音对应的帧。
  • 用于识别说话者的方法-202180048655.4
  • N·罗塞洛 - 雷诺股份公司
  • 2021-03-02 - 2023-03-21 - G10L17/02
  • 本发明涉及一种用于通过包括计算机存储器的计算机从一组说话者中识别特定说话者的方法,该计算机存储器中存储有语音签名,每个语音签名与所述组中的说话者之一相关联,该方法包括以下步骤:‑获取由特定说话者产生的语音信号(S41),‑根据所述语音信号来构建新的语音签名,‑将所述新的语音签名与存储在计算机存储器中的语音签名中的至少一个进行比较,以及‑根据所述比较的结果来识别特定说话者。根据本发明,在构建步骤之前,规定了生成包括所述语音信号和至少一个预定扩展信号(S31,S32)的完整信号(S4)的步骤,并且在构建步骤中,规定了新的语音签名也是根据每个扩展信号来构建的。
  • 说话者验证-201780003481.3
  • I.L.莫雷诺;万力;王泉 - 谷歌有限责任公司
  • 2017-07-06 - 2021-11-23 - G10L17/02
  • 本发明公开了方法、系统和设备,其包括在计算机存储介质上编码的计算机程序,以促进语言无关性说话者验证。在一个方面,方法包括通过用户装置接收代表用户言辞的音频数据的动作。其他动作可以包括将从音频数据和语言识别符获得的输入数据提供到存储在用户装置上的神经网络。可以使用代表不同语言或方言的话语数据训练神经网络。方法可以包括额外动作:基于神经网络的输出产生说话者展示,和基于说话者展示和第二展示确定言辞是所述用户的言辞。方法可以基于确定言辞是所述用户的言辞而为用户提供对用户装置的访问。
  • 在包括多个设备的环境中的语音识别方法和设备-201980055917.2
  • 曹根硕;卢在英;邢知远;张东韩;李在原 - 三星电子株式会社
  • 2019-10-22 - 2021-04-09 - G10L17/02
  • 提供了一种利用机器学习算法(诸如深度学习等)的人工智能(AI)系统以及AI系统的应用。一种由语音识别设备执行的在存在多个语音识别设备的空间中执行语音识别的语音识别方法,包括:从输入音频信号中提取说话者的语音信号;获得指示所述语音信号与注册说话者的语音信号之间的相似度的第一说话者识别分数;以及基于从所述多个语音识别设备中的另一语音识别设备获得的第二说话者识别分数和第一说话者识别分数,输出针对所述语音信号的语音识别结果。
  • 用于远场和近场声音辅助应用的利用超短语音分段进行的说话者标识-201880083790.0
  • Z.沈;F.翁;G.贝;P.安基迪特拉库尔 - 罗伯特·博世有限公司
  • 2018-12-14 - 2020-08-21 - G10L17/02
  • 一种说话者识别设备包括存储器和处理器。存储器存储对应于由登记用户对关键短语的发声的所登记关键短语数据,以及登记用户的文本相关和文本无关声学说话者模型。处理器操作性地连接到存储器,并且执行指令以将说话者认证为登记用户,这包括检测对应于由说话者说出的关键短语的输入关键短语数据,使用登记用户的语音模型计算说话者的文本相关和文本无关分数,计算置信度分数,以及基于置信度分数是否指示输入关键短语数据对应于来自登记用户的语音而将说话者认证为登记用户或拒绝说话者作为登记用户。
  • 音频处理-201880072045.6
  • J·P·莱索;G·R·麦克劳德 - 思睿逻辑国际半导体有限公司
  • 2018-11-13 - 2020-06-26 - G10L17/02
  • 一种音频处理的方法,包括接收音频信号。形成所接收的音频信号的多个组帧型式,所述组帧型式中的每一组帧型式具有相应的帧起始位置。选择所接收的音频信号的多个组帧型式中的一个组帧型式。在后续的过程中,使用所接收的音频信号的多个组帧型式中的选定的一个组帧型式。
  • 说话人注册-201880073188.9
  • R·赛义迪 - 思睿逻辑国际半导体有限公司
  • 2018-11-20 - 2020-06-26 - G10L17/02
  • 一种用于说话人识别系统的说话人建模方法,包括:接收包括说话人的话语的信号;以及,针对所述信号的多个帧:获得所述说话人的话语的频谱;通过施加与相应的发声力度有关的影响来生成至少一个经修改的频谱;以及,从所述说话人的话语的频谱和所述至少一个经修改的频谱中提取特征。该方法还包括基于所提取的特征来形成至少一个话语模型。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top