[发明专利]外源性大词汇量模型到基于规则的语音识别的合并在审
申请号: | 201910993287.5 | 申请日: | 2015-01-12 |
公开(公告)号: | CN110706711A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | T·威尔逊;S·夸齐;J·维孔多阿;P·法特普里亚 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/30;G10L15/193;G10L15/197 |
代理公司: | 72002 永新专利商标代理有限公司 | 代理人: | 贾丽萍 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了外源性大词汇量模型到基于规则的语音识别的合并。音频流由本地小词汇量、基于规则的语音识别系统(SVSRS)接收,并被传输至大词汇量的、基于统计模型的语音识别系统(LVSRS)。SVSRS和LVSRS对音频执行识别。如果一部分音频没有被SVSRS识别,则触发这样的规则:将标记插入到识别结果中。将该识别结果发送至LVSRS。如果检测到标记,则对音频的指定的一部分执行识别。LVSRS结果与SVSRS结果进行统一并作为混合响应发送回SVSRS。如果没有触发混合识别规则,则唤起仲裁算法来确定是SVSRS识别还是LVSRS识别具有更小的词语错误率。将所确定的识别作为响应发送至SVSRS。 | ||
搜索关键词: | 语音识别系统 大词汇量 响应发送 触发 结果发送 统计模型 小词汇量 语音识别 仲裁算法 错误率 外源性 音频流 词语 传输 合并 检测 统一 | ||
【主权项】:
1.一种用于提供将外源性大词汇量模型到基于规则的语音识别的合并的方法,包括:/n从基于规则的语音识别系统接收第一识别结果,所述第一识别结果包括指定没有被所述基于规则的语音识别系统所识别的所接收的音频流的一部分的标记;/n对所述音频流的标记部分执行基于统计模型的识别,以创建第二识别结果;/n将所述第二识别结果与所述第一识别结果进行组合,以创建组合的识别结果;并且/n将所述组合的识别结果发送至所述基于规则的语音识别系统。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910993287.5/,转载请声明来源钻瓜专利网。
- 同类专利
- 一种语音识别方法、装置及存储介质-201910880013.5
- 康跃腾;付彦喆;王朋飞 - 腾讯科技(深圳)有限公司
- 2019-09-17 - 2020-02-14 - G10L15/32
- 本申请实施例公开了一种语音识别方法、装置及存储介质,包括:提取语音信号流的特征输入到第一模型中得到第一识别结果,并确定所述第一识别结果的第一得分,所述第一模型用于识别通用说法的词汇;当所述第一模型无法识别所述语音信号流中的语言词汇时,根据所述语言词汇所属的领域类型加载第二模型,将所述语言词汇输入到所述第二模型得到第二识别结果,并确定所述第二识别结果的第二得分,所述第二模型用于识别领域说法的词汇;根据所述第一得分和所述第二得分,确定最终识别结果。采用本申请实施例,提高了语音识别的准确性和效率。
- 多识别器语音识别-201910931218.1
- 彼塔尔·阿列克西克;佩德罗·J·莫雷诺门希瓦尔;法迪·比亚德希 - 谷歌有限责任公司
- 2014-04-18 - 2020-02-14 - G10L15/32
- 本发明涉及多识别器语音识别。本说明书的主题可具体体现为方法等,该方法包括接收与发声相对应的音频数据,获得使用有限语音识别器所产生的发声的第一转录。有限语音识别器包括包含通过有限语音识别词汇所训练的语言模型的语音识别器,所述有限语音识别词汇包括来自语音命令语法的一个或多个项,但包括比扩展语法的所有项少。获得使用扩展语音识别器所产生的发声的第二转录。扩展语音识别器包括包含通过扩展语音识别词汇所训练的语言模型的语音识别器,所述扩展语音识别词汇包括扩展语法的所有项。至少基于第一转录或第二转录的一部分来对发声进行分类。
- 外源性大词汇量模型到基于规则的语音识别的合并-201910993287.5
- T·威尔逊;S·夸齐;J·维孔多阿;P·法特普里亚 - 微软技术许可有限责任公司
- 2015-01-12 - 2020-01-17 - G10L15/32
- 提供了外源性大词汇量模型到基于规则的语音识别的合并。音频流由本地小词汇量、基于规则的语音识别系统(SVSRS)接收,并被传输至大词汇量的、基于统计模型的语音识别系统(LVSRS)。SVSRS和LVSRS对音频执行识别。如果一部分音频没有被SVSRS识别,则触发这样的规则:将标记插入到识别结果中。将该识别结果发送至LVSRS。如果检测到标记,则对音频的指定的一部分执行识别。LVSRS结果与SVSRS结果进行统一并作为混合响应发送回SVSRS。如果没有触发混合识别规则,则唤起仲裁算法来确定是SVSRS识别还是LVSRS识别具有更小的词语错误率。将所确定的识别作为响应发送至SVSRS。
- 关键词检测装置和方法-201910906551.7
- 赖家豪;郑达;李索恒;张志齐 - 上海依图信息技术有限公司
- 2019-09-24 - 2020-01-03 - G10L15/32
- 本发明公开了一种关键词检测装置,包括:多个语音识别装置。各语音识别装置分别采用基于CTC的训练准则得到,各语音识别装置所训练的环境不同;各语音识别装置中包括经过基于CTC的训练准则训练得到的神经网络;各语音识别装置的输入端连接音频数据。在推理阶段,各语音识别装置的输入端都输入相同的第一输入音频数据,各语音识别装置并行运行并输出对应的关键词分数,由各语音识别装置的关键词分数进行权重组合形成总得分,根据总得分输出和第一输入音频数据对应的关键词预测结果信号。本发明公开了一种关键词检测方法。本发明能提升在各种环境下使用时的召回率,降低误报。
- 专利分类