[发明专利]语音识别方法及相关产品在审

专利信息
申请号: 201710401787.6 申请日: 2017-05-31
公开(公告)号: CN107316637A 公开(公告)日: 2017-11-03
发明(设计)人: 白剑 申请(专利权)人: 广东欧珀移动通信有限公司
主分类号: G10L15/07 分类号: G10L15/07;G10L15/22;G10L25/51
代理公司: 广州三环专利商标代理有限公司44202 代理人: 郝传鑫,熊永强
地址: 523860 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例公开了语音识别方法及相关产品,其中方法包括终端设备提示输入语音后,采集语音数据;使用至少一种识别算法获得至少两种识别结果,输出所述至少两种识别结果;获得所述至少两种识别结果中相对准确的识别结果,确定所述相对准确的识别结果所对应的识别算法作为所述终端设备后续进行语音识别使用的识别算法。通过提示用户输入语音后,采集用户输入的语音数据,然后采用一种或者多种算法得到了两种以上的识别结果,然后通过用户确认的更为准确的识别结果可以确定哪一种算法更好;该方案极为适合例如手机等较为私人或者口音类似的用户使用,可以在保证识别速度的前提下,提高非标准语音的识别的准确率。
搜索关键词: 语音 识别 方法 相关 产品
【主权项】:
一种语音识别方法,其特征在于,包括:终端设备提示输入语音后,采集语音数据;使用至少一种识别算法获得至少两种识别结果,输出所述至少两种识别结果;获得所述至少两种识别结果中相对准确的识别结果,确定所述相对准确的识别结果所对应的识别算法作为所述终端设备后续进行语音识别使用的识别算法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司,未经广东欧珀移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710401787.6/,转载请声明来源钻瓜专利网。

同类专利
  • 语音处理系统和方法-201410419320.0
  • 陈浪舟 - 株式会社东芝
  • 2014-08-22 - 2019-07-12 - G10L15/07
  • 一种训练用于文本转语音系统的声学模型的方法,所述方法包括:接收语音数据,所述语音数据包括对应于第一语音因素的不同值的数据,并且其中所述语音数据未标记,从而对于给定的语音数据项,所述第一语音因素的值未知;根据所述第一语音因素的值将所述语音数据聚簇为第一聚类集;以及估计第一参数集以使得所述声学模型能够针对所述第一语音因素的不同值适应语音;其中所述聚簇和所述第一参数估计根据共同的最大似然性准则联合执行。
  • 语音信息获取方法及装置-201811239529.3
  • 慈中华 - 慈中华
  • 2018-10-23 - 2019-02-01 - G10L15/07
  • 本申请的提供一种通过量化输入语音指标,以减少个体差异影响的语音获取方法和装置。该方法包括:显示第一提示语并且开始接收用户的第一输入语音;当接收到用户的第一输入语音之后,将接收到的第一输入语音识别为第一用户语;将所述第一用户语与第一提示语进行对比;如果所述第一用户语与第一提示语匹配,则显示第二提示语并且开始接收用户的第二输入语音;当接收到用户的第二输入语音之后,将接收到的第二输入语音识别为第二用户语;将所述第二用户语与第二提示语进行对比;将所述第一输入语音和第二输入语音整合成一条录音文件并且将该录音文件进行保存。该方法可以准确、完整且便捷地采集将用户的声音,以便后续的分析辨识。
  • 语音识别方法及相关产品-201710401787.6
  • 白剑 - 广东欧珀移动通信有限公司
  • 2017-05-31 - 2017-11-03 - G10L15/07
  • 本发明实施例公开了语音识别方法及相关产品,其中方法包括终端设备提示输入语音后,采集语音数据;使用至少一种识别算法获得至少两种识别结果,输出所述至少两种识别结果;获得所述至少两种识别结果中相对准确的识别结果,确定所述相对准确的识别结果所对应的识别算法作为所述终端设备后续进行语音识别使用的识别算法。通过提示用户输入语音后,采集用户输入的语音数据,然后采用一种或者多种算法得到了两种以上的识别结果,然后通过用户确认的更为准确的识别结果可以确定哪一种算法更好;该方案极为适合例如手机等较为私人或者口音类似的用户使用,可以在保证识别速度的前提下,提高非标准语音的识别的准确率。
  • 语音识别方法以及装置-201510558047.4
  • 杜念冬;邹赛赛;谢延 - 百度在线网络技术(北京)有限公司
  • 2015-09-02 - 2017-10-31 - G10L15/07
  • 本发明公开了一种语音识别方法以及装置,其中方法包括获取说话人输入的语音信息,并获取说话人的说话人信息;根据说话人信息判断是否存在与说话人对应的个人声学模型;如果存在,则获取的个人声学模型,并根据说话人的个人声学模型对语音信息进行语音识别;如果不存在,则根据基础声学模型对语音信息进行语音识别,并根据语音信息生成说话人的语料信息并存储;以及根据基础声学模型和存储的语料信息生成说话人的个人声学模型。该方法可以基于说话人自适应的语音识别过程能够针对每个说话人的特点,定制他们的声学模型,从而提高每个说话人的准确度,提升了用户体验。
  • 一种自适应的声纹识别方法及系统-201610024297.4
  • 祝铭明 - 芋头科技(杭州)有限公司
  • 2016-01-14 - 2017-07-21 - G10L15/07
  • 本发明属于语音信号处理领域,尤其涉及一种声纹识别系统。一种自适应的声纹识别方法,应用于家用机器人,具体工作步骤包括S1采集语音信号;S2对语音信号进行预处理;S3自预处理后的语音信号中提取语音特征参数,语音特征参数包括线性预测得到的第一类特征参数及模拟人耳对声音频率的感知特性而提取的第二类特征参数;S4为每一个家庭成员建立一个码本存储在语音数据库中作为家庭成员的语音模板,家庭成员的所有码本构成一声学模型;S5依据声学模型对待测语音信号进行模式匹配,获取识别结果。以上技术方案可以自适应地实现声纹识别,应对不同应用场景下的人机交流,有利于提升用户体验。
  • 音字对应的趣味性操作中增加地方语和地方普通话的方法-201611208699.6
  • 陈勇 - 陈勇
  • 2016-12-23 - 2017-05-31 - G10L15/07
  • 本发明涉及软件领域,特别是涉及音字对应的趣味性操作中增加地方语和地方普通话的方法,增加音字对应的一个重要手段,迅速增加音字对应,扩大音字对应库,音字对应库越大,也让软件收集到了本地话的对应和本地普通话的对应,为那个地方的本地话对应和本地普通话对应的收集,多了一个个体样本,人们说本地话时趣味性操作,就收集了本地话的对应,人们用本地普通话趣味性操作,就收集了本地普通话的对应。
  • 依据环境参数及群体趋向数据的语音识别方法和系统-201410446143.5
  • 陈飞 - 陈飞
  • 2014-09-03 - 2017-05-17 - G10L15/07
  • 依据环境参数及群体趋向数据的语音识别方法和系统,首先,采集用户语音信息及与该语音信息相关的环境参数和身份识别信息,依据该身份识别信息进行用户的身份识别;其次,提取个人语音及行为习惯特征库中存储的该用户个人语音及行为习惯特征数据,结合提取群体语音及习惯特征库中存储的类似群体的群体语音及习惯特征数据,判断该语音信息适合哪些功能性语义分析模块,并将相关信息发送给这些语义分析模块进行单独或联合的语义解析,从而得到语义分析结果;最后,存储语义分析结果,并将语义分析结果及相关信息发送至个人语音及行为习惯特征库和群体语音及习惯特征库进行归类存储。本发明大幅度提高了语音识别的准确率。
  • 一种应用操作的处理方法和装置-201510662029.0
  • 许敏强;鄢志杰;高杰;初敏 - 阿里巴巴集团控股有限公司
  • 2015-10-14 - 2017-04-26 - G10L15/07
  • 本申请实施例提供了一种应用操作的处理方法和装置,该方法包括在使用阶段检测到音频数据时,提取所述音频数据的第一语音特征数据;根据所述第一语音特征数据计算所述音频数据和预设的第一语音模型之间的相似度,所述第一语音模型为表征目标用户的、特定语音内容的音频数据特征的语音模型;根据所述相似度执行所述第一语音模型对应的应用操作。本申请实施例同时实现了语音和特定人身份判别,从而执行相应的应用操作,实现了个性化的声控,减少了被冒认的几率,提高了声控的安全性。
  • 个人语音和拼音的对应库-201611209555.2
  • 陈勇 - 陈勇
  • 2016-12-23 - 2017-04-26 - G10L15/07
  • 本发明涉及软件领域,特别是涉及个人语音和拼音的对应库,自己独一无二的发音和拼音形成的对应,便于准确生成文字单元;准确的知道地方语和标准普通话的具体区别在哪里,用文字,才能准确表达人的意图,人也才能容易交流,复杂式指令必须通过人机交流才能获得;通过人用最熟悉的交流方式,让计算机知道人需要它做什么,这是一个重大突破;用文字来进行人机交流,才是最准确的、最方便的。
  • 语音识别方法及装置-201510496816.2
  • 曾一庭 - 中兴通讯股份有限公司
  • 2015-08-13 - 2017-03-01 - G10L15/07
  • 本发明公开了一种语音识别方法及装置,其中,该方法包括获取并识别语音信息;判断该语音信息与预先提取的预定用户的声音特征是否相符;在判断结果为是的情况下,确定该语音信息为该预定用户的语音信息,解决了相关技术中语音识别受其他声音影响导致误识别率高的问题,降低了误识别率。
  • 深度神经网络的低资源占用适配和个性化-201580012496.7
  • 薛健;李锦宇;俞栋;M·L·塞尔策;龚一凡 - 微软技术许可有限责任公司
  • 2015-02-27 - 2016-11-09 - G10L15/07
  • 本发明提供了对用于自动语音识别的深度神经网络(DNN)模型的适配和个性化。可以在诸如话音搜索或短消息命令之类的ASR任务中接收包括一个或多个扬声器的语音特征的话语。然后,可以将分解方法应用于该DNN模型中的原始矩阵。响应于应用该分解方法,该原始矩阵可以被变换为比该原始矩阵更小的多个新矩阵。然后,可以将方阵加到所述新矩阵。然后,可以将扬声器特定参数存储在该方阵中。然后,可以通过更新该方阵来对该DNN模型进行适配。这个过程可以被应用于该DNN模型中的所有多个原始矩阵。经适配的DNN模型可以包括与原始DNN模型中接收的参数相比数量减少的参数。
  • 一种语音交互系统-201610468878.7
  • 王袁明;张洪雷;刘长伟;王飞;洪伟;李锟德;寇小丰;刘媛媛 - 浙江合众新能源汽车有限公司
  • 2016-06-25 - 2016-10-26 - G10L15/07
  • 本发明涉及人机交互领域、语音识别领域,尤其涉及一种语音交互系统。包括语音交互装置以及云处理装置,其特征在于:所述语音交互装置包括设置在汽车中的:语音输入单元、语音处理单元、车载交互终端和语音输出单元;所述云处理装置包括:云服务器、数据存储单元、语音解析单元、语音反馈单元;所述车载交互终端和所述云服务器之间通过网络进行数据交互;其特征在于:所述云处理装置还包括语音学习单元;所述语音学习单元,在所述语音解析单元匹配失败时进行跟读学习。
  • 一种语音播放方法和装置-201610036759.4
  • 曾戟 - 曾戟
  • 2016-01-20 - 2016-06-01 - G10L15/07
  • 一种语音播放方法和装置,所述方法包括:获取包含至少一个说话者的原始音频流;根据预设训练算法,对所述原始音频流进行训练;将所述训练后的音频流加载在流媒体文件中,以进行播放。以此,可以播放出精确度较高、失真度较小的音频数据。
  • 声学模型自适应方法及系统-201610156697.0
  • 李轶杰;刘青松;许东星 - 上海语知义信息技术有限公司
  • 2016-03-18 - 2016-05-18 - G10L15/07
  • 本发明涉及一种声学模型自适应方法及系统,该方法包括:在声学模型训练集上,对每段语音数据基于深度神经网络模型提取与说话人相关的身份认证矢量;在所述声学模型训练集上,对每段语音数据提取声学特征参数;将从所述语音数据中提取的所述身份认证矢量和所述声学特征参数拼接在一起,并作为深度神经网络模型的输入进行训练以形成声学识别模型;以及在语音识别阶段,依据所述声学识别模型进行语音识别以形成识别结果。本发明利用深度神经网络模型提取对应说话人的身份认证矢量,并利用身份认证矢量对深度神经网络模型进行重训练,使得深度神经网络模型具有较好的说话人自适应的特点,提高了语音识别的准确率。
  • 一种基于压缩感知的说话人自适应方法-201510124247.9
  • 屈丹;张文林;李真;闫红刚;张刚 - 中国人民解放军信息工程大学
  • 2015-03-20 - 2015-07-22 - G10L15/07
  • 本发明涉及一种基于压缩感知的说话人自适应方法,属于连续语音识别的声学模型自适应技术领域。本发明将说话人自适应视为一种高维信号的稀疏分解问题,在训练阶段联合本征音超矢量和训练说话人超矢量构造超矢量字典;在自适应阶段,在稀疏约束条件下,应用匹配追踪算法和l1正则化原理选择若干个超矢量进行线性组合,对未知说话人超矢量进行逼近从而达到说话人自适应的目的。本发明借助于压缩感知理论在子空间基的构造上采用更一般化的超矢量字典;二是在基的选择上,采用匹配追踪原理和投影梯度算法求接得到说话人超矢量的稀疏表达。相比传统的子空间方法,在少量自适应数据量条件下,本发明的自适应效果优于现有的基于说话人子空间的自适应方法。
  • 一种语音识别方法及装置-201310717335.0
  • 苏丹 - 百度在线网络技术(北京)有限公司
  • 2013-12-23 - 2014-04-09 - G10L15/07
  • 本发明涉及信息处理技术领域,尤其涉及一种语音识别方法及装置;其中,所述方法包括:获取语音数据;根据所述语音数据的属性信息自动确定所述语音数据的类型;选择与所述语音数据的类型相匹配的声学模型进行语音识别。通过本发明技术方案,根据语音数据类型建立相应的声学模型,使得声学模型的建立更具准确性;进而根据相应的语音数据类型选择相应类型的声学模型进行语音识别,使得语音的识别更具准确性。
  • 语音识别语言模型-201180052260.8
  • 阿舒拓史·A·马勒高恩卡;甘努·萨蒂施·库玛;盖德·K·M·乔尔特 - 思科技术公司
  • 2011-08-09 - 2013-08-21 - G10L15/07
  • 在一种实施方式中,语音或音频通过语音识别系统转换成可搜索的格式。该语音识别系统使用包括某些词的出现概率的语言模型,这些概率可以取决于其他词或词序列的出现。该语言模型是部分地从个人词表构建的。个人词表是通过来自网络流量的已知文本确定的,该网络流量包括电子邮件以及互联网帖子。该语音识别系统可以基于两个用户之间的联系将一个用户的个人词表并入到另一个用户的语言模型中。该联系可以由电子邮件、电话通话或者社交网络服务中的互动来触发。该语音识别系统可以基于从得出的语言模型计算出的置信分值来移除或添加个人词表到语言模型中。
  • 语音识别系统-201310109044.3
  • 王健铭 - 京东方科技集团股份有限公司;北京京东方显示技术有限公司
  • 2013-03-29 - 2013-08-07 - G10L15/07
  • 本发明提供一种语音识别系统,包括:存储单元,用于存储至少一个用户的语音模型;语音采集及预处理单元,用于采集待识别语音信号,对所述待识别语音信号进行格式转换及编码;特征提取单元,用于从编码后的所述待识别语音信号中提取语音特征参数;模式匹配单元,用于将所提取的所述语音特征参数与至少一个所述语音模型进行匹配,确定所述待识别语音信号所属的用户。该系统从语音的产生原理开始分析语音的特性,并使用MFCC参数,建立说话人的语音特征模型,实现说话人的特征识别算法,能够达到提高说话人检测可靠性的目的,使得最终能够在电子产品上实现说话人识别的功能。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top