[发明专利]音频处理在审

申请号：	201880072045.6	申请日：	2018-11-13
公开（公告）号：	CN111344781A	公开（公告）日：	2020-06-26
发明（设计）人：	J·P·莱索;G·R·麦克劳德	申请（专利权）人：	思睿逻辑国际半导体有限公司
主分类号：	G10L17/02	分类号：	G10L17/02
代理公司：	北京北翔知识产权代理有限公司 11285	代理人：	郑建晖;李星宇
地址：	英国***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种音频处理的方法，包括接收音频信号。形成所接收的音频信号的多个组帧型式，所述组帧型式中的每一组帧型式具有相应的帧起始位置。选择所接收的音频信号的多个组帧型式中的一个组帧型式。在后续的过程中，使用所接收的音频信号的多个组帧型式中的选定的一个组帧型式。
搜索关键词：	音频处理
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于思睿逻辑国际半导体有限公司，未经思睿逻辑国际半导体有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201880072045.6/，转载请声明来源钻瓜专利网。

同类专利

输出语音转录的方法、语音转录生成系统和计算机程序产品-202180003151.0
发明人：马会广;张阳阳 -专利权人：京东方科技集团股份有限公司
申请日： 2021-10-28 - 公布日： 2023-08-08 - 主分类号： G10L17/02
摘要：提供了一种用于输出语音转录的方法。方法包括：从候选音频流中提取候选声纹特征信息；对候选音频流执行语音识别，以生成候选语音转录；将候选声纹特征信息与至少一个目标对象的目标声纹特征信息进行比较；以及在确定候选声纹特征信息与目标对象的目标声纹特征信息匹配时，存储候选语音转录和目标对象的目标标识符，目标标识符对应于目标对象的目标声纹特征信息。

说话人识别-201780047190.4
发明人： J·P·莱索;J·梅兰森 -专利权人：思睿逻辑国际半导体有限公司
申请日： 2017-08-01 - 公布日： 2023-06-09 - 主分类号： G10L17/02
摘要：本申请描述了用于说话人识别的方法和装置。根据一个实施方案的装置具有一个分析器(202)，用于分析与用户发出的言语声音对应的音频数据(AIN)的帧的序列中的每个帧，以确定该帧的言语声音的至少一个特性。一个评估模块(203)，用于基于该言语声音的确定的特性为音频数据的每个帧确定音频数据的帧应被用于说话人识别处理的程度的贡献指标。以此方式，可以强调与对说话人区分最有用的言语声音对应的帧和/或可以不再强调与对说话人区分最没有用的言语声音对应的帧。

用于识别说话者的方法-202180048655.4
发明人： N·罗塞洛 -专利权人：雷诺股份公司
申请日： 2021-03-02 - 公布日： 2023-03-21 - 主分类号： G10L17/02
摘要：本发明涉及一种用于通过包括计算机存储器的计算机从一组说话者中识别特定说话者的方法，该计算机存储器中存储有语音签名，每个语音签名与所述组中的说话者之一相关联，该方法包括以下步骤：‑获取由特定说话者产生的语音信号(S41)，‑根据所述语音信号来构建新的语音签名，‑将所述新的语音签名与存储在计算机存储器中的语音签名中的至少一个进行比较，以及‑根据所述比较的结果来识别特定说话者。根据本发明，在构建步骤之前，规定了生成包括所述语音信号和至少一个预定扩展信号(S31，S32)的完整信号(S4)的步骤，并且在构建步骤中，规定了新的语音签名也是根据每个扩展信号来构建的。

说话者验证-201780003481.3
发明人： I.L.莫雷诺;万力;王泉 -专利权人：谷歌有限责任公司
申请日： 2017-07-06 - 公布日： 2021-11-23 - 主分类号： G10L17/02
摘要：本发明公开了方法、系统和设备，其包括在计算机存储介质上编码的计算机程序，以促进语言无关性说话者验证。在一个方面，方法包括通过用户装置接收代表用户言辞的音频数据的动作。其他动作可以包括将从音频数据和语言识别符获得的输入数据提供到存储在用户装置上的神经网络。可以使用代表不同语言或方言的话语数据训练神经网络。方法可以包括额外动作：基于神经网络的输出产生说话者展示，和基于说话者展示和第二展示确定言辞是所述用户的言辞。方法可以基于确定言辞是所述用户的言辞而为用户提供对用户装置的访问。

在包括多个设备的环境中的语音识别方法和设备-201980055917.2
发明人：曹根硕;卢在英;邢知远;张东韩;李在原 -专利权人：三星电子株式会社
申请日： 2019-10-22 - 公布日： 2021-04-09 - 主分类号： G10L17/02
摘要：提供了一种利用机器学习算法(诸如深度学习等)的人工智能(AI)系统以及AI系统的应用。一种由语音识别设备执行的在存在多个语音识别设备的空间中执行语音识别的语音识别方法，包括：从输入音频信号中提取说话者的语音信号；获得指示所述语音信号与注册说话者的语音信号之间的相似度的第一说话者识别分数；以及基于从所述多个语音识别设备中的另一语音识别设备获得的第二说话者识别分数和第一说话者识别分数，输出针对所述语音信号的语音识别结果。

用于说话者识别的处理语音信号方法及实现其的电子装置-201980011477.0
发明人：韩英浩;曹根硕;卢在英;金南勋;朴致衍;柳宗烨 -专利权人：三星电子株式会社
申请日： 2019-01-31 - 公布日： 2020-09-18 - 主分类号： G10L17/02
摘要：一种在电子装置中处理语音信号以用于说话者识别的方法，包括：获得第一用户的语音信号；从语音信号中提取包括特征值的语音特征；将从第一用户的语音信号中提取的语音特征与预定参考值进行比较；选择对应于与参考值进行比较的第一用户的语音特征的第一用户特征；基于第一用户特征生成用于说话者识别的推荐短语；以及输出推荐短语。

用于远场和近场声音辅助应用的利用超短语音分段进行的说话者标识-201880083790.0
发明人： Z.沈;F.翁;G.贝;P.安基迪特拉库尔 -专利权人：罗伯特·博世有限公司
申请日： 2018-12-14 - 公布日： 2020-08-21 - 主分类号： G10L17/02
摘要：一种说话者识别设备包括存储器和处理器。存储器存储对应于由登记用户对关键短语的发声的所登记关键短语数据，以及登记用户的文本相关和文本无关声学说话者模型。处理器操作性地连接到存储器，并且执行指令以将说话者认证为登记用户，这包括检测对应于由说话者说出的关键短语的输入关键短语数据，使用登记用户的语音模型计算说话者的文本相关和文本无关分数，计算置信度分数，以及基于置信度分数是否指示输入关键短语数据对应于来自登记用户的语音而将说话者认证为登记用户或拒绝说话者作为登记用户。

音频处理-201880072045.6
发明人： J·P·莱索;G·R·麦克劳德 -专利权人：思睿逻辑国际半导体有限公司
申请日： 2018-11-13 - 公布日： 2020-06-26 - 主分类号： G10L17/02
摘要：一种音频处理的方法，包括接收音频信号。形成所接收的音频信号的多个组帧型式，所述组帧型式中的每一组帧型式具有相应的帧起始位置。选择所接收的音频信号的多个组帧型式中的一个组帧型式。在后续的过程中，使用所接收的音频信号的多个组帧型式中的选定的一个组帧型式。

说话人注册-201880073188.9
发明人： R·赛义迪 -专利权人：思睿逻辑国际半导体有限公司
申请日： 2018-11-20 - 公布日： 2020-06-26 - 主分类号： G10L17/02
摘要：一种用于说话人识别系统的说话人建模方法，包括：接收包括说话人的话语的信号；以及，针对所述信号的多个帧：获得所述说话人的话语的频谱；通过施加与相应的发声力度有关的影响来生成至少一个经修改的频谱；以及，从所述说话人的话语的频谱和所述至少一个经修改的频谱中提取特征。该方法还包括基于所提取的特征来形成至少一个话语模型。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频处理在审

专利文献下载