[发明专利]语音识别处理装置及语音识别处理方法无效

申请号：	201310069457.3	申请日：	2013-03-05
公开（公告）号：	CN103310791A	公开（公告）日：	2013-09-18
发明（设计）人：	野中勉	申请（专利权）人：	精工爱普生株式会社
主分类号：	G10L15/20	分类号：	G10L15/20;G10L21/02
代理公司：	北京金信立方知识产权代理有限公司 11225	代理人：	黄威;苏萌萌
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别处理装置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种实施对使用者的语音的识别的语音识别处理装置。

背景技术

一直以来，存在一种语音处理装置，其输入使用者的语音，并对语音进行分析从而实施与使用者相对应的处理。这种装置例如被用于电话应答系统、实施美术馆等的馆内的引导的引导系统以及车辆导航系统等。虽然使用者的语音会通过话筒而被导入到语音处理装置中，然而在多数情况下，使用者的周围的声音也会被同时导入。这种周围的声音，在实施对使用者的语音的识别的过程中会构成噪声，从而成为使语音识别率降低的主要因素。

因此，进行了各种研究来实施用于去除周围声音的预定的处理。例如，在专利文献1中，记载了一种如下的噪声抑制装置，该噪声抑制装置在每个固定区间内提取语音输入信号并对语音区间和无语音区间进行区分，并且通过对无语音区间内的频谱进行平均化从而持续对噪声频谱进行推断和更新。

但是，由于专利文献1的噪声抑制装置需要始终导入周围的声音且持续推断并更新无语音区间内的输入信号的频谱，因此需要在语音识别处理的执行过程中使噪声抑制装置持续工作，从而认为上述情况将成为阻碍消耗电力降低化的主要因素之一。此外，虽然在每个预定的固定区间进行提取并实施其为语音区间或无语音区间的判断，然而由于使用者的发声的时刻并非按照该预定的固定区间来实施，因此存在混入了少许语音的、并非为完全的无语音区间的区间也被判断为无语音区间的情况，并且认为当这种情况增多时有时会导致噪声频谱并非优选。

此外，装置周围的状态并不一定总处于相同的状态。因此，认为存在如下情况，即，不存在使用者时的无语音区间内的噪声、和存在使用者时的噪声较大程度地不同的情况。在包括不存在使用者时的预定的固定区间内的噪声频谱在内的条件下持续进行推断和更新，有时会有在实施语音识别时成为并非优选的噪声频谱的可能性。

专利文献1：日本特开2004-20679号公报

发明内容

本发明是为了解决上述课题中的至少一部分而实施的发明，其能够作为以下的方式或应用例来实现。

应用例1

本应用例所涉及的语音识别处理装置的特征在于，包括：语音合成部；语音输出部，其输出在所述语音合成部中所合成的语音；语音输入部；语音识别部，其实施针对从所述语音输入部输入的声音的语音识别，在所述语音合成部中被合成的第一句子包括第一单词和第二单词，在将所述语音合成部中合成有所述第一单词的声音设为第一合成音、将所述语音合成部中合成有所述第二单词的声音设为第二合成音时，以在第一期间和第二期间之间的第三期间内通过所述语音输入部而被输入的声音为基础，来生成补正信息，其中，所述第一期间为输出所述第一合成音的期间，所述第二期间为输出所述第二合成音的期间，所述第三期间为未通过所述语音输出部而输出语音的期间，所述补正信息为，用于对实施所述语音识别的语音信号进行噪声去除的信息。

根据该结构，由于通过根据在第三期间内所输入的声音的信号，来生成用于噪声去除的补正信息，并将其用于语音识别时的声音的信号的噪声去除，且所述第三期间为，在语音合成部中所合成的第一合成音和第二合成音之间的、未输出语音的期间，从而不需要始终实施用于实施噪声去除的信号生成的处理，因此与始终实施噪声去除的方式相比，能够实现消耗电力的降低化。

此外还认为，在作为合成音的输出间隙的期间的第三期间内，使用者发出语音的可能性较低，从而结果成为不含有使用者的语音的无语音区间的情况较多。因此，在以预定的固定区间来分割时所计算出的噪声频谱、和在第三期间内所计算出的噪声频谱中，在第三期间内所计算出的噪声频谱中使用者的语音频谱的成分较少。由此能够判断为，根据在第三期间内被输入的声音的信号来使用被用于噪声去除的补正信息，具有进一步提高语音识别率的效果。

此外，例如，在以与使用者的对话形式实施处理的情况下，在语音识别处理装置输出通过语音合成而形成的语音时，是存在使用者之时。因此，在以第三期间内所输入的声音的信号为基础而生成的用于噪声去除的补正信息中，不包含不存在使用者时所发出的周围的声音的信息。因此，能够判断为具有进一步提高语音识别率的效果。

应用例2

在上述应用例所涉及的语音识别处理装置中，优选为，所述第二单词为所述第一单词的下一个单词。

根据该结构，通过使第二单词为第一单词的下一个单词，从而能够将第三期间设为连续的两个单词之间的期间，进而能够使第三期间的设定变得容易。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于精工爱普生株式会社，未经精工爱普生株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310069457.3/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别处理装置及语音识别处理方法无效

专利文献下载