[发明专利]语音识别装置、方法和记录有语音识别软件程序的记录介质有效
申请号: | 200710188793.4 | 申请日: | 2007-11-20 |
公开(公告)号: | CN101188109A | 公开(公告)日: | 2008-05-28 |
发明(设计)人: | 原田将治 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/08;G10L15/20;G10L15/28 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 李辉 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 装置 方法 记录 软件 程序 介质 | ||
1.一种语音识别装置,该语音识别装置包括:
语音输入单元,其将输入语音转换成发声语音数据;
语音分析单元,其将所述发声语音数据转换成特征量;
识别单词字典,其存储多个识别词汇单词;
可抛弃单词字典,其存储多个可抛弃词汇单词;
语音验证单元,其利用通过所述语音分析单元进行的转换而获得的特征量,计算所述输入语音与存储在所述识别单词字典中的所述多个识别词汇单词之间的相似度,利用通过所述语音分析单元进行的转换而获得的特征量,计算所述输入语音与存储在所述可抛弃单词字典中的所述多个可抛弃词汇单词之间的相似度,并且,作为计算这些相似度的结果,从所述识别词汇单词中提取具有最高相似度的识别词汇单词作为识别候选项,并且从所述可抛弃词汇单词中提取具有最高相似度的可抛弃词汇单词作为抛弃候选项;
第一阈值存储单元,其存储用作抛弃所述输入语音的量度的第一阈值;以及
第二阈值存储单元,其存储第二阈值,所述第二阈值大于所述第一阈值并且用作输出作为识别结果的所述识别候选项的量度,
其中,如果所述识别候选项的相似度大于所述第二阈值,则所述语音验证单元输出所述识别候选项作为识别结果,并且
如果所述识别候选项的相似度小于所述第二阈值,则当所述识别候选项的相似度大于所述第一阈值并且同时所述识别候选项的相似度高于所述抛弃候选项的相似度时,所述语音验证单元输出所述识别候选项作为识别结果。
2.如权利要求1所述的语音识别装置,
其中,如果所述识别候选项的相似度大于所述第一阈值,则当所述识别候选项的相似度小于所述第二阈值并且同时所述识别候选项的相似度小于所述抛弃候选项的相似度时,所述语音验证单元抛弃所述输入语音,并且
如果所述识别候选项的相似度小于所述第一阈值,则所述语音验证单元抛弃所述输入语音。
3.如权利要求1所述的语音识别装置,该语音识别装置还包括补偿数据存储单元,所述补偿数据存储单元存储用于改变所述识别候选项的相似度和所述抛弃候选项的相似度中的至少一个相似度的补偿数据,
其中,所述语音验证单元基于所述补偿数据,改变所述识别候选项的相似度和所述抛弃候选项的相似度中的至少一个相似度。
4.如权利要求1所述的语音识别装置,其中,所述第二阈值存储单元存储分别对应于各个所述识别词汇单词的多个第二阈值。
5.如权利要求1所述的语音识别装置,该语音识别装置还包括:
多个可抛弃单词字典,其分别包含不同数目的可抛弃词汇单词;以及
选择单元,其基于存储在所述识别单词字典中的识别词汇单词的数目,从所述多个可抛弃单词字典中选择要由所述语音验证单元进行相似度计算的可抛弃单词字典。
6.一种语音识别方法,
其中,设置有存储有多个识别词汇单词的识别单词字典和存储有多个可抛弃词汇单词的可抛弃单词字典的计算机执行如下步骤:
语音输入步骤,将输入语音转换成发声语音数据;
语音分析步骤,将所述发声语音数据转换成特征量;以及
语音验证步骤,利用通过在所述语音分析步骤中的转换而获得的特征量,计算所述输入语音与存储在所述识别单词字典中的所述多个识别词汇单词之间的相似度,利用通过在所述语音分析步骤中的转换而获得的特征量,计算所述输入语音与存储在所述可抛弃单词字典中的所述多个可抛弃词汇单词之间的相似度,并且,作为计算这些相似度的结果,从所述识别词汇单词中提取具有最高相似度的识别词汇单词作为识别候选项,并且从所述可抛弃词汇单词中提取具有最高相似度的可抛弃词汇单词作为抛弃候选项;
所述计算机能够访问第一阈值存储单元和第二阈值存储单元,所述第一阈值存储单元存储用作抛弃所述输入语音的量度的第一阈值,所述第二阈值存储单元存储第二阈值,所述第二阈值大于所述第一阈值并且用作输出作为识别结果的所述识别候选项的量度,并且
所述语音验证步骤还包括如下步骤:
如果所述识别候选项的相似度大于所述第二阈值,则输出所述识别候选项作为识别结果,以及
如果所述识别候选项的相似度小于所述第二阈值,则当所述识别候选项的相似度大于所述第一阈值并且同时所述识别候选项的相似度高于所述抛弃候选项的相似度时,输出所述识别候选项作为识别结果。
7.一种记录介质,其上记录有语音识别软件程序,该语音识别软件程序使得设置有存储有多个识别词汇单词的识别单词字典和存储有多个可抛弃词汇单词的可抛弃单词字典的计算机执行语音识别处理,
其中,使所述计算机执行如下处理:
语音输入处理,将输入语音转换成发声语音数据;
语音分析处理,将所述发声语音数据转换成特征量;以及
语音验证处理,利用通过在所述语音分析处理中的转换而获得的特征量,计算所述输入语音与存储在所述识别单词字典中的所述多个识别词汇单词之间的相似度,利用通过在所述语音分析处理中的转换而获得的特征量,计算所述输入语音与存储在所述可抛弃单词字典中的所述多个可抛弃词汇单词之间的相似度,并且,作为计算这些相似度的结果,从所述识别词汇单词中提取具有最高相似度的识别词汇单词作为识别候选项,并且从所述可抛弃词汇单词中提取具有最高相似度的可抛弃词汇单词作为抛弃候选项;并且
所述计算机能够访问第一阈值存储单元和第二阈值存储单元,所述第一阈值存储单元存储用作抛弃所述输入语音的量度的第一阈值,所述第二阈值存储单元存储第二阈值,所述第二阈值大于所述第一阈值并且用作输出作为识别结果的所述识别候选项的量度,并且
所述语音验证处理还包括使所述计算机执行如下处理:
如果所述识别候选项的相似度大于所述第二阈值,则输出所述识别候选项作为识别结果,以及
如果所述识别候选项的相似度小于所述第二阈值,则当所述识别候选项的相似度大于所述第一阈值并且同时所述识别候选项的相似度高于所述抛弃候选项的相似度时,输出所述识别候选项作为识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710188793.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:空调冷凝水回收再利用装置
- 下一篇:健身器材仪表显示储存装置