[发明专利]声音识别装置在审
申请号: | 201380019801.6 | 申请日: | 2013-11-29 |
公开(公告)号: | CN104823235A | 公开(公告)日: | 2015-08-05 |
发明(设计)人: | 山室庆太;冈登洋平 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/32 | 分类号: | G10L15/32;G10L15/08 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 宋俊寅 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 识别 装置 | ||
1.一种声音识别装置,其特征在于,包括:
声音输入部,该声音输入部输入所发出的声音;
声音识别部,该声音识别部由多个识别引擎构成,所述多个识别引擎分别对从所述声音输入部获取的声音进行识别;以及
判定部,该判定部基于由所述多个识别引擎识别出的识别结果候选所分别具有的时间长度之差,来从所述识别结果候选中采用一个或多个识别结果候选。
2.如权利要求1所述的声音识别装置,其特征在于,
所述声音识别部具有第一识别引擎和第二识别引擎,所述第一识别引擎能识别预先确定的字串,所述第二识别引擎能识别所述字串的一部分,
在从由所述第一识别引擎识别出的第一识别结果候选所具有的时间长度减去由所述第二识别引擎识别出的第二识别结果候选所具有的时间长度而得到的时间长度为预先确定的第一阈值以上的情况下,所述判定部放弃所述第二识别结果候选,而采用所述第一识别结果候选。
3.如权利要求2所述的声音识别装置,其特征在于,
所述声音识别装置还包括整合部,该整合部基于所述相减而得到的时间长度,将未被所述判定部所放弃的所述第二识别结果候选的可靠性朝调低方向进行修正。
4.如权利要求2所述的声音识别装置,其特征在于,
所述判定部根据作为识别对象的字串的类别来变更所述预先确定的第一阈值。
5.如权利要求1所述的声音识别装置,其特征在于,
所述声音识别装置还包括检测部,该检测部对从所述所获取的声音的起始端到终止端为止的获取声音时间长度进行检测,
所述判定部将由所述多个识别引擎识别出的识别结果候选各自所具有的时间长度与所述获取声音时间长度之差为预先确定的第二阈值以上的识别结果候选放弃。
6.如权利要求5所述的声音识别装置,其特征在于,
所述声音识别装置还包括整合部,该整合部基于未被所述判定部所放弃的识别结果候选各自所具有的时间长度与所述获取声音时间长度之差,分别将所述未被放弃的识别结果候选的可靠性朝调低方向进行修正。
7.如权利要求5所述的声音识别装置,其特征在于,
基于作为识别对象的字串的类别以及所述所获取的声音的终止端检测的阈值,来决定所述获取声音时间长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380019801.6/1.html,转载请声明来源钻瓜专利网。