[发明专利]语音识别装置、语音识别方法以及存储介质有效

申请号：	201710759611.8	申请日：	2017-08-30
公开（公告）号：	CN108074562B	公开（公告）日：	2021-12-03
发明（设计）人：	永尾学;藤村浩司	申请（专利权）人：	株式会社东芝
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/183;G10L15/187;G10L17/00;G10L25/63
代理公司：	中国贸促会专利商标事务所有限公司 11038	代理人：	金光华
地址：	日本***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别装置方法以及存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

提供一种语音识别装置、语音识别方法以及存储介质，识别语音信号中所包含的语言信息以及语言信息中所附带的副语言信息和/或非语言信息。实施方式的语音识别装置具备计算部、搜索部、附加符号取得部和输出部。搜索部通过搜索对得分矢量序列中的似然度高的声学得分进行追溯的输入符号的路径而生成输入符号串，根据输入符号串中所包含的输入符号之中的表示识别对象的语言信息的识别对象符号，生成表示语音信号的识别结果的输出符号。附加符号取得部从输入符号串中的与输出符号对应的范围中所包含的输入符号中，取得表示副语言信息和/或非语言信息的附加符号。输出部将输出符号与所取得的附加符号对应关联地进行输出。

技术领域

本发明的实施方式涉及语音识别装置、语音识别方法以及存储介质。

背景技术

已知能够与语言信息同时地评价填充语(filler)以及重言(stammering)等的声学模型。在使用了这样的声学模型的语音识别系统中，能够去除填充语以及重言等来进行语音识别，所以能够提高识别精度。

但是，在去除了填充语以及重言等的情况下，使用识别结果的应用无法检测附加有填充语或者重言等的单词。因此，使用语音识别结果的应用无法进行使用了填充语以及重言等的信息处理。

发明内容

发明想要解决的课题在于，识别语音信号中所包含的语言信息、以及语言信息中所附带的副语言信息和/或非语言信息。

实施方式的语音识别装置具备计算部、搜索部、附加符号取得部以及输出部。所述计算部根据语音信号，计算将包括每个输入符号的声学得分的多个得分矢量排列而成的得分矢量序列，其中，所述输入符号是预先确定的符号集合的元素。所述搜索部通过搜索对所述得分矢量序列中的似然度高的所述声学得分进行追溯的所述输入符号的路径而生成输入符号串，根据所述输入符号串中所包含的所述输入符号之中的表示识别对象的语言信息的识别对象符号，生成表示所述语音信号的识别结果的输出符号。所述附加符号取得部从所述输入符号串中的与所述输出符号对应的范围中所包含的所述输入符号中，取得表示副语言信息和/或非语言信息的附加符号。所述输出部将所述输出符号与所取得的所述附加符号对应关联地进行输出。

根据上述语音识别装置，能够识别语音信号中所包含的语言信息、以及语言信息中所附带的副语言信息和/或非语言信息。

附图说明

图1是示出实施方式的语音识别装置的结构的图。

图2是示出得分计算部的结构的一个例子的图。

图3是示出路径搜索部的结构的图。

图4是示出路径搜索部的处理流程的图。

图5是示出字母的输入符号串的一个例子的图。

图6是示出从图5的输入符号串中删除连续的识别对象符号的处理的图。

图7是示出从图6的输入符号串中删除识别对象符号以外的符号的处理的图。

图8是示出生成字母的输出符号的处理的图。

图9是示出字母的输入符号串中的与输出符号对应的范围的图。

图10是示出字母的输出符号以及附加符号的一个例子的图。