[实用新型]一种多场景命令词语音识别装置有效
申请号: | 201720552541.4 | 申请日: | 2017-05-17 |
公开(公告)号: | CN207074554U | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 詹翀;杨若冲 | 申请(专利权)人: | 詹翀;杨若冲 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/28 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙)42233 | 代理人: | 仲晖 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 场景 命令 词语 识别 装置 | ||
技术领域
本实用新型属于语音识别领域,更具体地,涉及一种多场景命令词识别装置。
背景技术
近年来,随着语音识别技术的进步,语音交互因其天然的便利性,在日常生活中应用越来越广泛。语音唤醒和命令词识别这两个最常用的技术点在车载系统、智能家居等领域里已经得到广泛的应用。但我们也发现,在目前大部分的应用方案中,语音交互采用的是在线识别的方式,这就要求设备在使用时需要连接互联网,将计算好的语音特征值上传到服务器,服务器再返回识别后的结果。这种方式的好处是识别在云端进行,识别的结果会很精确,但这种方式的用户体验与网络环境密切相关,在没有网络的时候就无法使用;而且因为要传回数据到服务器,这就牵涉到用户隐私和网络安全等因素,所以大大的影响了应用范围。
在这种情况下,业界开始采用离线的语音交互方式,相对于在云端服务器的识别方法,离线语音识别精简了语言和声学模型,所有的运算都在本地进行。离线语音交互种核心部件是命令词的语音识别,但是受制于硬件条件限制,如计算能力、RAM和Flash大小以及功耗散热等因素,尤其是主频和RAM大小,这两项直接限制了模型的大小以及所支持的命令词数量,模型精简过度之后会严重影响识别的准确率。此外,这种离线识别方案中,不同的应用场景使用的是不同的命令词,需要提前将模型和代码写入硬件,这意味着不同的应用场景必须得开发不同的固件模块,这在实际生产、使用中造成了极大的不便。
实用新型内容
针对现有技术的以上缺陷或改进需求,本实用新型提供了一种多场景命令词语音识别装置,其目的在于通过集成所有场景下语音识别模型,并在相应场景下进行调用,由此解决现有技术对于不同场景下的语音命令识别需要精简模型导致识别率不高、或者针对不同场景设计不同固件造成成本过高的技术问题。
为实现上述目的,按照本实用新型的一个方面,提供了一种多场景命令词语音识别装置,包括场景标识器、外挂存储器、内置存储器、以及处理器;
所述处理器与场景标识器、外挂存储器、以及内置存储器电相连;
所述场景标识器,用于标识当前应用场景;
所述外挂存储器,用于按照不同的应用场景,存储应用场景相应的命令词及其识别模型;
所述内置存储器,用于存储当前应用场景相应的命令词极其识别模型;
所述处理器,用于根据场景标识器标识的当前应用场景,调用所述外挂存储器种存储的当前应用场景相应的命令词极其识别模型进入所述内置存储器,进行命令词识别处理。
优选地,所述多场景命令词语音识别装置,其所述场景标识器为数字电路。
优选地,所述多场景命令词语音识别装置,其场景标识器为拨线器。
优选地,所述多场景命令词语音识别装置,其外挂存储器为RAM存储器或FLASH存储器。
优选地,所述多场景命令词语音识别装置,其内置存储器为RAN存储器。
优选地,所述多场景命令词语音识别装置,其识别模型为隐马尔科夫模型。
优选地,所述多场景命令词语音识别装置,其装置还包括语音输入模块、以及输出模块;所述语音输入模块、以及输出模块与处理器电相连。
优选地,所述多场景命令词语音识别装置,其语音输入模块,用于采集交互装置外部语音信号并进行及降噪处理。
优选地,所述多场景命令词语音识别装置,其输出模块,用于按照处理器识别出的命令,调用相应接口,实现命令功能。
优选地,所述多场景命令词语音识别装置,其应用场景包括不同类型的应用场景和/或同一类型不同级别的应用场景。
总体而言,通过本实用新型所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
本实用新型利用内置存储器调用外挂存储器中的命令词识别模型,可以大大的节省内存,在同等硬件条件下,支持更多的命令词;对于同一套元器件可以适用于不同的应用场景,并且不必针对不同的场景中的内置存储器中写入不同的代码,只需要在实施的时候调用不同的外挂存储器即可,大大的节省了应用成本,提高经济效益。
附图说明
图1是本实用新型提供的多场景命令词语音识别装置结构示意图;
图2是本实用新型实施例提供的多场景命令词语音识别装置结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于詹翀;杨若冲,未经詹翀;杨若冲许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201720552541.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:改良的铃铛结构
- 下一篇:一种基于云计算的医疗服务信息系统