[发明专利]声音识别装置有效

申请号：	201080068341.2	申请日：	2010-10-01
公开（公告）号：	CN103038816A	公开（公告）日：	2013-04-10
发明（设计）人：	加藤阳一;石井纯;坂下博纪	申请（专利权）人：	三菱电机株式会社
主分类号：	G10L15/26	分类号：	G10L15/26;G10L15/00
代理公司：	上海专利商标事务所有限公司 31100	代理人：	侯颖媖
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声音识别装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及进行与多种语言对应的声音识别的声音识别装置。

背景技术

专利文献1所记载的现有声音识别装置选择性地使用与该装置所处的当前地点的信息相应的声音识别数据库，从而实现高精度的声音识别。例如，若当前地点是关西地区，则选择关西方言的声音及语言模型，并用其进行声音识别。此外，若当前地点是车站，则例如选择含大量旅行相关单词的识别词典，并用其进行声音识别。

专利文献2公开了以下系统，在该与多种语言对应的声音识别系统中，准备多种语言专用的识别词典，在该词典上预先登记有某一语言的发音信息、以及根据该语言的标记或音标所生成的其它语言的发音信息。通过参照该识别词典，能识别多种语言。

现有技术文献

专利文献

专利文献1：日本专利特开2009-175630号公报

专利文献2：日本专利特开2004-271895号公报

发明内容

但是，在专利文献1所代表的现有声音识别装置中，为了实现高精度的声音识别，必须在系统中存放有大量音响模型及识别词典，需要大容量的存储单元。此外，专利文献1不能支持多种语言的声音识别。

另一方面，专利文献2所代表的现有声音识别装置能支持多种语言，但需要在声音识别前预先生成并存放其它语言的发音信息，存在对于未预先准备发音信息的语言、不能进行声音识别的问题。

本发明是为了解决上述问题而完成的，其目的在于获得不需要大容量存储单元且能以实时处理来进行对应于多种语言的声音识别的声音识别装置。

本发明所涉及的声音识别装置包括：声音识别部，该声音识别部使用与作为识别对象而预先设定的语言即设定语言对应的声音识别引擎，参照识别对象语信息，对输入声音进行声音识别，该识别对象语信息具有声音识别词典中登记的识别对象词汇所包含的各识别对象语的标记信息和读音信息；读音信息转换数据库，该读音信息转换数据库中登记有表示单词的读音信息在多种语言之间的对应关系的读音信息转换规则；读音信息转换部，该读音信息转换部基于读音信息转换数据库的读音信息转换规则，在语言之间转换单词的读音信息；以及控制部，该控制部进行控制，使得在由声音识别部对识别对象语信息进行参照的识别对象词汇中包含有与设定语言不同的语言即其它语言的单词的情况下，由读音信息转换部将其它语言的读音信息转换成设定语言的读音信息，声音识别部参照将转换后的设定语言的读音信息包含在内的该单词的识别对象语信息来进行声音识别。

根据本发明，具有以下效果：即，不需要大容量存储单元，且能以实时处理来进行对应于多种语言的声音识别。

附图说明

图1是表示本发明的实施方式1的声音识别装置的结构的框图。

图2是表示声音识别词典的一示例的图。

图3是表示实施方式1的声音识别装置的动作流程的流程图。

图4是表示本发明的实施方式2的声音识别装置的结构的框图。

图5是表示读音信息转换数据库的一示例的图。

图6是表示实施方式2的声音识别装置的动作流程的流程图。

图7是用于说明将与设定语言不同的语言的单词的读音信息转换成设定语言的读音信息的处理的图。

图8是表示本发明的实施方式3的声音识别装置的结构的框图。

图9是表示读音信息转换数据库的一示例的图。

图10是表示实施方式3的声音识别装置的动作流程的流程图。

图11是表示本发明的实施方式4的声音识别装置的结构的框图。

图12是表示实施方式4的声音识别装置的动作流程的流程图。

图13是表示本发明的实施方式5的声音识别装置的结构的框图。

图14是表示标记转换数据库的一示例的图。图15是表示实施方式5的声音识别装置的动作流程的流程图。

图16是用于说明将特殊文字的标记信息转换成设定语言的标记信息的处理的图。

具体实施方式

以下，为了更详细地对本发明进行说明，根据附图对用于实施本发明的实施方式进行说明。

实施方式1

图1是表示本发明的实施方式1的声音识别装置的结构的框图。实施方式1的声音识别装置中，与设定为声音识别对象的设定语言不同的语言(下面适当记载为其它语言)的单词包含在识别对象词汇中时，临时启动该其它语言的声音识别引擎并进行声音识别。此外，其结构如图1所示那样包括：识别语言设定部1、声音识别处理部2、发声按钮3、麦克风4、以及监视器5。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社，未经三菱电机株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201080068341.2/2.html，转载请声明来源钻瓜专利网。

上一篇：一种确定油菜种子颜色和大小的方法
下一篇：用于离析磁性复合微粒悬浊液的化学实验装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声音识别装置有效

专利文献下载