[发明专利]语音识别装置、语音识别方法以及存储介质有效
申请号: | 201710759611.8 | 申请日: | 2017-08-30 |
公开(公告)号: | CN108074562B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 永尾学;藤村浩司 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/183;G10L15/187;G10L17/00;G10L25/63 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 金光华 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 装置 方法 以及 存储 介质 | ||
1.一种语音识别装置,具备:
计算部,根据语音信号,计算将包括每个输入符号的声学得分的多个得分矢量排列而成的得分矢量序列,其中,所述输入符号是预先确定的符号集合的元素;
搜索部,通过搜索对所述得分矢量序列中的似然度高的所述声学得分进行追溯的所述输入符号的路径而生成输入符号串,根据所述输入符号串中所包含的所述输入符号之中的表示识别对象的语言信息的识别对象符号,生成表示所述语音信号的识别结果的输出符号;
附加符号取得部,从所述输入符号串中的与所述输出符号对应的范围中所包含的所述输入符号中,取得表示副语言信息和/或非语言信息的附加符号,计算所取得的所述附加符号的可靠度;以及
输出部,将所述输出符号与所取得的所述附加符号对应关联地进行输出,并且将所述可靠度与对应的所述附加符号一起输出,
所述可靠度是基于所述输入符号串中的与所述输出符号对应的范围中所包含的所述附加符号的个数的值、或者基于所述输入符号串中的与所述输出符号对应的范围中所包含的所述附加符号的位置的值。
2.根据权利要求1所述的语音识别装置,其中,
所述输入符号表示所述语音信号中所包含的声学信息,
所述声学得分表示由对应的所述输入符号表示的所述声学信息包含于所述语音信号的似然度。
3.根据权利要求2所述的语音识别装置,其中,
所述副语言信息是通过说话的人发声而附加到所述语音信号的、无法从所述语言信息识别的信息,
所述非语言信息是所述语音信号中所包含的表示所述说话的人的特征的信息。
4.根据权利要求3所述的语音识别装置,其中,
所述语言信息、所述副语言信息以及所述非语言信息分别是所述声学信息之一,
所述符号集合包括所述识别对象符号以及所述附加符号作为所述输入符号。
5.根据权利要求4所述的语音识别装置,其中,
无声信息是所述声学信息之一,
所述符号集合还包括表示所述无声信息的无声符号作为所述识别对象符号。
6.根据权利要求4或者5所述的语音识别装置,其中,
对象外符号是表示所述识别对象符号以及所述附加符号表示的所述声学信息之中的哪个所述声学信息包含于所述语音信号还未定的符号,
所述符号集合还包括对象外符号作为所述输入符号。
7.根据权利要求1所述的语音识别装置,其中,
所述输出部输出根据所述输入符号串生成的多个所述输出符号。
8.根据权利要求7所述的语音识别装置,其中,
还具备对应关系取得部,该对应关系取得部关于各个所述输出符号,取得表示所述输入符号串中的与所述输出符号对应的范围的对应关系信息,
所述附加符号取得部关于各个所述输出符号,从所述输入符号串中的由所述对应关系信息示出的范围中所包含的所述输入符号中,取得所述附加符号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710759611.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音处理方法及装置
- 下一篇:时钟应用的控制方法及装置