[发明专利]语音识别方法及相关产品在审

申请号：	201710401787.6	申请日：	2017-05-31
公开（公告）号：	CN107316637A	公开（公告）日：	2017-11-03
发明（设计）人：	白剑	申请（专利权）人：	广东欧珀移动通信有限公司
主分类号：	G10L15/07	分类号：	G10L15/07;G10L15/22;G10L25/51
代理公司：	广州三环专利商标代理有限公司44202	代理人：	郝传鑫,熊永强
地址：	523860 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例公开了语音识别方法及相关产品，其中方法包括终端设备提示输入语音后，采集语音数据；使用至少一种识别算法获得至少两种识别结果，输出所述至少两种识别结果；获得所述至少两种识别结果中相对准确的识别结果，确定所述相对准确的识别结果所对应的识别算法作为所述终端设备后续进行语音识别使用的识别算法。通过提示用户输入语音后，采集用户输入的语音数据，然后采用一种或者多种算法得到了两种以上的识别结果，然后通过用户确认的更为准确的识别结果可以确定哪一种算法更好；该方案极为适合例如手机等较为私人或者口音类似的用户使用，可以在保证识别速度的前提下，提高非标准语音的识别的准确率。
搜索关键词：	语音识别方法相关产品
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种语音识别方法，其特征在于，包括：终端设备提示输入语音后，采集语音数据；使用至少一种识别算法获得至少两种识别结果，输出所述至少两种识别结果；获得所述至少两种识别结果中相对准确的识别结果，确定所述相对准确的识别结果所对应的识别算法作为所述终端设备后续进行语音识别使用的识别算法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司，未经广东欧珀移动通信有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710401787.6/，转载请声明来源钻瓜专利网。

上一篇：自动平衡源极驱动器多个输出信道间时间常数的方法
下一篇：基于场境的语音识别语法选择方法和系统

同类专利

声音识别方法及装置-201610772806.1
发明人：龙飞;陈志军;杨松 -专利权人：北京小米移动软件有限公司
申请日： 2016-08-30 - 公布日： 2019-09-17 - 主分类号： G10L15/07
摘要：本公开是关于声音识别方法及装置。涉及音频识别技术领域。该方法包括：获取待识别的声音以及预存的声音模板，根据所述预存的声音模板从所述待识别的声音中识别出目标声音。上述技术方案可以从待识别的声音中准确的识别出目标声音。

语音处理系统和方法-201410419320.0
发明人：陈浪舟 -专利权人：株式会社东芝
申请日： 2014-08-22 - 公布日： 2019-07-12 - 主分类号： G10L15/07
摘要：一种训练用于文本转语音系统的声学模型的方法，所述方法包括：接收语音数据，所述语音数据包括对应于第一语音因素的不同值的数据，并且其中所述语音数据未标记，从而对于给定的语音数据项，所述第一语音因素的值未知；根据所述第一语音因素的值将所述语音数据聚簇为第一聚类集；以及估计第一参数集以使得所述声学模型能够针对所述第一语音因素的不同值适应语音；其中所述聚簇和所述第一参数估计根据共同的最大似然性准则联合执行。

语音信息获取方法及装置-201811239529.3
发明人：慈中华 -专利权人：慈中华
申请日： 2018-10-23 - 公布日： 2019-02-01 - 主分类号： G10L15/07
摘要：本申请的提供一种通过量化输入语音指标，以减少个体差异影响的语音获取方法和装置。该方法包括：显示第一提示语并且开始接收用户的第一输入语音；当接收到用户的第一输入语音之后，将接收到的第一输入语音识别为第一用户语；将所述第一用户语与第一提示语进行对比；如果所述第一用户语与第一提示语匹配，则显示第二提示语并且开始接收用户的第二输入语音；当接收到用户的第二输入语音之后，将接收到的第二输入语音识别为第二用户语；将所述第二用户语与第二提示语进行对比；将所述第一输入语音和第二输入语音整合成一条录音文件并且将该录音文件进行保存。该方法可以准确、完整且便捷地采集将用户的声音，以便后续的分析辨识。

用于管理适应数据的方法和系统-201380034866.8
发明人：罗伊斯·A·莱维恩;理查德·T·洛德;罗伯特·W·洛德;马克·A·马拉默德 -专利权人：埃尔瓦有限公司
申请日： 2013-06-28 - 公布日： 2019-01-18 - 主分类号： G10L15/07
摘要：计算实现的方法和系统，包括：管理适应数据，其中适应数据关联于特定方的讲话的至少一个方面，响应与特定方的利于讲话的交易关联的指示，促进适应数据传输至目标设备，其中适应数据关联于特定方的讲话的至少一个方面，以及确定是否对适应数据进行更新，所述确定至少部分地基于利于讲话的交易的至少一部分的结果。除了前述内容，权利要求书、附图和正文中描述了其它方面。

语音识别方法及相关产品-201710401787.6
发明人：白剑 -专利权人：广东欧珀移动通信有限公司
申请日： 2017-05-31 - 公布日： 2017-11-03 - 主分类号： G10L15/07
摘要：本发明实施例公开了语音识别方法及相关产品，其中方法包括终端设备提示输入语音后，采集语音数据；使用至少一种识别算法获得至少两种识别结果，输出所述至少两种识别结果；获得所述至少两种识别结果中相对准确的识别结果，确定所述相对准确的识别结果所对应的识别算法作为所述终端设备后续进行语音识别使用的识别算法。通过提示用户输入语音后，采集用户输入的语音数据，然后采用一种或者多种算法得到了两种以上的识别结果，然后通过用户确认的更为准确的识别结果可以确定哪一种算法更好；该方案极为适合例如手机等较为私人或者口音类似的用户使用，可以在保证识别速度的前提下，提高非标准语音的识别的准确率。

语音识别方法以及装置-201510558047.4
发明人：杜念冬;邹赛赛;谢延 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2015-09-02 - 公布日： 2017-10-31 - 主分类号： G10L15/07
摘要：本发明公开了一种语音识别方法以及装置，其中方法包括获取说话人输入的语音信息，并获取说话人的说话人信息；根据说话人信息判断是否存在与说话人对应的个人声学模型；如果存在，则获取的个人声学模型，并根据说话人的个人声学模型对语音信息进行语音识别；如果不存在，则根据基础声学模型对语音信息进行语音识别，并根据语音信息生成说话人的语料信息并存储；以及根据基础声学模型和存储的语料信息生成说话人的个人声学模型。该方法可以基于说话人自适应的语音识别过程能够针对每个说话人的特点，定制他们的声学模型，从而提高每个说话人的准确度，提升了用户体验。

一种自适应的声纹识别方法及系统-201610024297.4
发明人：祝铭明 -专利权人：芋头科技（杭州）有限公司
申请日： 2016-01-14 - 公布日： 2017-07-21 - 主分类号： G10L15/07
摘要：本发明属于语音信号处理领域，尤其涉及一种声纹识别系统。一种自适应的声纹识别方法，应用于家用机器人，具体工作步骤包括S1采集语音信号；S2对语音信号进行预处理；S3自预处理后的语音信号中提取语音特征参数，语音特征参数包括线性预测得到的第一类特征参数及模拟人耳对声音频率的感知特性而提取的第二类特征参数；S4为每一个家庭成员建立一个码本存储在语音数据库中作为家庭成员的语音模板，家庭成员的所有码本构成一声学模型；S5依据声学模型对待测语音信号进行模式匹配，获取识别结果。以上技术方案可以自适应地实现声纹识别，应对不同应用场景下的人机交流，有利于提升用户体验。

个人文字和语音对应库的编码-201611207672.5
发明人：陈勇 -专利权人：陈勇
申请日： 2016-12-23 - 公布日： 2017-05-31 - 主分类号： G10L15/07
摘要：本发明涉及软件领域，特别是涉及个人文字和语音对应库的编码，输入编码后，就有自己的对应库，便于自己使用语音指令。

音字对应的趣味性操作中增加地方语和地方普通话的方法-201611208699.6
发明人：陈勇 -专利权人：陈勇
申请日： 2016-12-23 - 公布日： 2017-05-31 - 主分类号： G10L15/07
摘要：本发明涉及软件领域，特别是涉及音字对应的趣味性操作中增加地方语和地方普通话的方法，增加音字对应的一个重要手段，迅速增加音字对应，扩大音字对应库，音字对应库越大，也让软件收集到了本地话的对应和本地普通话的对应，为那个地方的本地话对应和本地普通话对应的收集，多了一个个体样本，人们说本地话时趣味性操作，就收集了本地话的对应，人们用本地普通话趣味性操作，就收集了本地普通话的对应。

依据环境参数及群体趋向数据的语音识别方法和系统-201410446143.5
发明人：陈飞 -专利权人：陈飞
申请日： 2014-09-03 - 公布日： 2017-05-17 - 主分类号： G10L15/07
摘要：依据环境参数及群体趋向数据的语音识别方法和系统，首先，采集用户语音信息及与该语音信息相关的环境参数和身份识别信息，依据该身份识别信息进行用户的身份识别；其次，提取个人语音及行为习惯特征库中存储的该用户个人语音及行为习惯特征数据，结合提取群体语音及习惯特征库中存储的类似群体的群体语音及习惯特征数据，判断该语音信息适合哪些功能性语义分析模块，并将相关信息发送给这些语义分析模块进行单独或联合的语义解析，从而得到语义分析结果；最后，存储语义分析结果，并将语义分析结果及相关信息发送至个人语音及行为习惯特征库和群体语音及习惯特征库进行归类存储。本发明大幅度提高了语音识别的准确率。

一种应用操作的处理方法和装置-201510662029.0
发明人：许敏强;鄢志杰;高杰;初敏 -专利权人：阿里巴巴集团控股有限公司
申请日： 2015-10-14 - 公布日： 2017-04-26 - 主分类号： G10L15/07
摘要：本申请实施例提供了一种应用操作的处理方法和装置，该方法包括在使用阶段检测到音频数据时，提取所述音频数据的第一语音特征数据；根据所述第一语音特征数据计算所述音频数据和预设的第一语音模型之间的相似度，所述第一语音模型为表征目标用户的、特定语音内容的音频数据特征的语音模型；根据所述相似度执行所述第一语音模型对应的应用操作。本申请实施例同时实现了语音和特定人身份判别，从而执行相应的应用操作，实现了个性化的声控，减少了被冒认的几率，提高了声控的安全性。

个人语音和拼音的对应库-201611209555.2
发明人：陈勇 -专利权人：陈勇
申请日： 2016-12-23 - 公布日： 2017-04-26 - 主分类号： G10L15/07
摘要：本发明涉及软件领域，特别是涉及个人语音和拼音的对应库，自己独一无二的发音和拼音形成的对应，便于准确生成文字单元；准确的知道地方语和标准普通话的具体区别在哪里，用文字，才能准确表达人的意图，人也才能容易交流，复杂式指令必须通过人机交流才能获得；通过人用最熟悉的交流方式，让计算机知道人需要它做什么，这是一个重大突破；用文字来进行人机交流，才是最准确的、最方便的。

语音识别方法及装置-201510496816.2
发明人：曾一庭 -专利权人：中兴通讯股份有限公司
申请日： 2015-08-13 - 公布日： 2017-03-01 - 主分类号： G10L15/07
摘要：本发明公开了一种语音识别方法及装置，其中，该方法包括获取并识别语音信息；判断该语音信息与预先提取的预定用户的声音特征是否相符；在判断结果为是的情况下，确定该语音信息为该预定用户的语音信息，解决了相关技术中语音识别受其他声音影响导致误识别率高的问题，降低了误识别率。

深度神经网络的低资源占用适配和个性化-201580012496.7
发明人：薛健;李锦宇;俞栋;M·L·塞尔策;龚一凡 -专利权人：微软技术许可有限责任公司
申请日： 2015-02-27 - 公布日： 2016-11-09 - 主分类号： G10L15/07
摘要：本发明提供了对用于自动语音识别的深度神经网络(DNN)模型的适配和个性化。可以在诸如话音搜索或短消息命令之类的ASR任务中接收包括一个或多个扬声器的语音特征的话语。然后，可以将分解方法应用于该DNN模型中的原始矩阵。响应于应用该分解方法，该原始矩阵可以被变换为比该原始矩阵更小的多个新矩阵。然后，可以将方阵加到所述新矩阵。然后，可以将扬声器特定参数存储在该方阵中。然后，可以通过更新该方阵来对该DNN模型进行适配。这个过程可以被应用于该DNN模型中的所有多个原始矩阵。经适配的DNN模型可以包括与原始DNN模型中接收的参数相比数量减少的参数。

一种语音交互系统-201610468878.7
发明人：王袁明;张洪雷;刘长伟;王飞;洪伟;李锟德;寇小丰;刘媛媛 -专利权人：浙江合众新能源汽车有限公司
申请日： 2016-06-25 - 公布日： 2016-10-26 - 主分类号： G10L15/07
摘要：本发明涉及人机交互领域、语音识别领域，尤其涉及一种语音交互系统。包括语音交互装置以及云处理装置，其特征在于：所述语音交互装置包括设置在汽车中的：语音输入单元、语音处理单元、车载交互终端和语音输出单元；所述云处理装置包括：云服务器、数据存储单元、语音解析单元、语音反馈单元；所述车载交互终端和所述云服务器之间通过网络进行数据交互；其特征在于：所述云处理装置还包括语音学习单元；所述语音学习单元，在所述语音解析单元匹配失败时进行跟读学习。

一种语音播放方法和装置-201610036759.4
发明人：曾戟 -专利权人：曾戟
申请日： 2016-01-20 - 公布日： 2016-06-01 - 主分类号： G10L15/07
摘要：一种语音播放方法和装置，所述方法包括：获取包含至少一个说话者的原始音频流；根据预设训练算法，对所述原始音频流进行训练；将所述训练后的音频流加载在流媒体文件中，以进行播放。以此，可以播放出精确度较高、失真度较小的音频数据。

声学模型自适应方法及系统-201610156697.0
发明人：李轶杰;刘青松;许东星 -专利权人：上海语知义信息技术有限公司
申请日： 2016-03-18 - 公布日： 2016-05-18 - 主分类号： G10L15/07
摘要：本发明涉及一种声学模型自适应方法及系统，该方法包括：在声学模型训练集上，对每段语音数据基于深度神经网络模型提取与说话人相关的身份认证矢量；在所述声学模型训练集上，对每段语音数据提取声学特征参数；将从所述语音数据中提取的所述身份认证矢量和所述声学特征参数拼接在一起，并作为深度神经网络模型的输入进行训练以形成声学识别模型；以及在语音识别阶段，依据所述声学识别模型进行语音识别以形成识别结果。本发明利用深度神经网络模型提取对应说话人的身份认证矢量，并利用身份认证矢量对深度神经网络模型进行重训练，使得深度神经网络模型具有较好的说话人自适应的特点，提高了语音识别的准确率。

一种基于压缩感知的说话人自适应方法-201510124247.9
发明人：屈丹;张文林;李真;闫红刚;张刚 -专利权人：中国人民解放军信息工程大学
申请日： 2015-03-20 - 公布日： 2015-07-22 - 主分类号： G10L15/07
摘要：本发明涉及一种基于压缩感知的说话人自适应方法，属于连续语音识别的声学模型自适应技术领域。本发明将说话人自适应视为一种高维信号的稀疏分解问题，在训练阶段联合本征音超矢量和训练说话人超矢量构造超矢量字典；在自适应阶段，在稀疏约束条件下，应用匹配追踪算法和l₁正则化原理选择若干个超矢量进行线性组合，对未知说话人超矢量进行逼近从而达到说话人自适应的目的。本发明借助于压缩感知理论在子空间基的构造上采用更一般化的超矢量字典；二是在基的选择上，采用匹配追踪原理和投影梯度算法求接得到说话人超矢量的稀疏表达。相比传统的子空间方法，在少量自适应数据量条件下，本发明的自适应效果优于现有的基于说话人子空间的自适应方法。

一种语音识别方法及装置-201310717335.0
发明人：苏丹 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2013-12-23 - 公布日： 2014-04-09 - 主分类号： G10L15/07
摘要：本发明涉及信息处理技术领域，尤其涉及一种语音识别方法及装置；其中，所述方法包括：获取语音数据；根据所述语音数据的属性信息自动确定所述语音数据的类型；选择与所述语音数据的类型相匹配的声学模型进行语音识别。通过本发明技术方案，根据语音数据类型建立相应的声学模型，使得声学模型的建立更具准确性；进而根据相应的语音数据类型选择相应类型的声学模型进行语音识别，使得语音的识别更具准确性。

语音识别语言模型-201180052260.8
发明人：阿舒拓史·A·马勒高恩卡;甘努·萨蒂施·库玛;盖德·K·M·乔尔特 -专利权人：思科技术公司
申请日： 2011-08-09 - 公布日： 2013-08-21 - 主分类号： G10L15/07
摘要：在一种实施方式中，语音或音频通过语音识别系统转换成可搜索的格式。该语音识别系统使用包括某些词的出现概率的语言模型，这些概率可以取决于其他词或词序列的出现。该语言模型是部分地从个人词表构建的。个人词表是通过来自网络流量的已知文本确定的，该网络流量包括电子邮件以及互联网帖子。该语音识别系统可以基于两个用户之间的联系将一个用户的个人词表并入到另一个用户的语言模型中。该联系可以由电子邮件、电话通话或者社交网络服务中的互动来触发。该语音识别系统可以基于从得出的语言模型计算出的置信分值来移除或添加个人词表到语言模型中。

语音识别系统-201310109044.3
发明人：王健铭 -专利权人：京东方科技集团股份有限公司;北京京东方显示技术有限公司
申请日： 2013-03-29 - 公布日： 2013-08-07 - 主分类号： G10L15/07
摘要：本发明提供一种语音识别系统，包括：存储单元，用于存储至少一个用户的语音模型；语音采集及预处理单元，用于采集待识别语音信号，对所述待识别语音信号进行格式转换及编码；特征提取单元，用于从编码后的所述待识别语音信号中提取语音特征参数；模式匹配单元，用于将所提取的所述语音特征参数与至少一个所述语音模型进行匹配，确定所述待识别语音信号所属的用户。该系统从语音的产生原理开始分析语音的特性，并使用MFCC参数，建立说话人的语音特征模型，实现说话人的特征识别算法，能够达到提高说话人检测可靠性的目的，使得最终能够在电子产品上实现说话人识别的功能。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别方法及相关产品在审

专利文献下载