[发明专利]声音识别装置有效
| 申请号: | 201080068341.2 | 申请日: | 2010-10-01 |
| 公开(公告)号: | CN103038816A | 公开(公告)日: | 2013-04-10 |
| 发明(设计)人: | 加藤阳一;石井纯;坂下博纪 | 申请(专利权)人: | 三菱电机株式会社 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/00 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 侯颖媖 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音 识别 装置 | ||
技术领域
本发明涉及进行与多种语言对应的声音识别的声音识别装置。
背景技术
专利文献1所记载的现有声音识别装置选择性地使用与该装置所处的当前地点的信息相应的声音识别数据库,从而实现高精度的声音识别。例如,若当前地点是关西地区,则选择关西方言的声音及语言模型,并用其进行声音识别。此外,若当前地点是车站,则例如选择含大量旅行相关单词的识别词典,并用其进行声音识别。
专利文献2公开了以下系统,在该与多种语言对应的声音识别系统中,准备多种语言专用的识别词典,在该词典上预先登记有某一语言的发音信息、以及根据该语言的标记或音标所生成的其它语言的发音信息。通过参照该识别词典,能识别多种语言。
现有技术文献
专利文献
专利文献1:日本专利特开2009-175630号公报
专利文献2:日本专利特开2004-271895号公报
发明内容
但是,在专利文献1所代表的现有声音识别装置中,为了实现高精度的声音识别,必须在系统中存放有大量音响模型及识别词典,需要大容量的存储单元。此外,专利文献1不能支持多种语言的声音识别。
另一方面,专利文献2所代表的现有声音识别装置能支持多种语言,但需要在声音识别前预先生成并存放其它语言的发音信息,存在对于未预先准备发音信息的语言、不能进行声音识别的问题。
本发明是为了解决上述问题而完成的,其目的在于获得不需要大容量存储单元且能以实时处理来进行对应于多种语言的声音识别的声音识别装置。
本发明所涉及的声音识别装置包括:声音识别部,该声音识别部使用与作为识别对象而预先设定的语言即设定语言对应的声音识别引擎,参照识别对象语信息,对输入声音进行声音识别,该识别对象语信息具有声音识别词典中登记的识别对象词汇所包含的各识别对象语的标记信息和读音信息;读音信息转换数据库,该读音信息转换数据库中登记有表示单词的读音信息在多种语言之间的对应关系的读音信息转换规则;读音信息转换部,该读音信息转换部基于读音信息转换数据库的读音信息转换规则,在语言之间转换单词的读音信息;以及控制部,该控制部进行控制,使得在由声音识别部对识别对象语信息进行参照的识别对象词汇中包含有与设定语言不同的语言即其它语言的单词的情况下,由读音信息转换部将其它语言的读音信息转换成设定语言的读音信息,声音识别部参照将转换后的设定语言的读音信息包含在内的该单词的识别对象语信息来进行声音识别。
根据本发明,具有以下效果:即,不需要大容量存储单元,且能以实时处理来进行对应于多种语言的声音识别。
附图说明
图1是表示本发明的实施方式1的声音识别装置的结构的框图。
图2是表示声音识别词典的一示例的图。
图3是表示实施方式1的声音识别装置的动作流程的流程图。
图4是表示本发明的实施方式2的声音识别装置的结构的框图。
图5是表示读音信息转换数据库的一示例的图。
图6是表示实施方式2的声音识别装置的动作流程的流程图。
图7是用于说明将与设定语言不同的语言的单词的读音信息转换成设定语言的读音信息的处理的图。
图8是表示本发明的实施方式3的声音识别装置的结构的框图。
图9是表示读音信息转换数据库的一示例的图。
图10是表示实施方式3的声音识别装置的动作流程的流程图。
图11是表示本发明的实施方式4的声音识别装置的结构的框图。
图12是表示实施方式4的声音识别装置的动作流程的流程图。
图13是表示本发明的实施方式5的声音识别装置的结构的框图。
图14是表示标记转换数据库的一示例的图。图15是表示实施方式5的声音识别装置的动作流程的流程图。
图16是用于说明将特殊文字的标记信息转换成设定语言的标记信息的处理的图。
具体实施方式
以下,为了更详细地对本发明进行说明,根据附图对用于实施本发明的实施方式进行说明。
实施方式1
图1是表示本发明的实施方式1的声音识别装置的结构的框图。实施方式1的声音识别装置中,与设定为声音识别对象的设定语言不同的语言(下面适当记载为其它语言)的单词包含在识别对象词汇中时,临时启动该其它语言的声音识别引擎并进行声音识别。此外,其结构如图1所示那样包括:识别语言设定部1、声音识别处理部2、发声按钮3、麦克风4、以及监视器5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080068341.2/2.html,转载请声明来源钻瓜专利网。





