[发明专利]语音识别设备的错误发音自动纠正更新方法和更新系统在审

申请号：	201711239000.7	申请日：	2017-11-30
公开（公告）号：	CN107993653A	公开（公告）日：	2018-05-04
发明（设计）人：	李晓飞	申请（专利权）人：	南京云游智能科技有限公司
主分类号：	G10L15/10	分类号：	G10L15/10;G10L15/30;G10L15/34;G10L15/06
代理公司：	南京正联知识产权代理有限公司32243	代理人：	邓道花
地址：	210038 江苏省南京经***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别设备错误发音自动纠正更新方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音识别技术领域，特别是涉及一种语音识别设备的错误发音自动纠正更新方法和系统。

背景技术

语音识别是一种利用机器模拟人类的识别和理解过程、把人类的语音信号转变为相应的文本或命令的技术。语音识别的根本目的是研究出一种具有听觉功能的机器，能直接接受人的语音，理解人的意图，并做出相应的反应。从技术上看，它属于多维模式识别和智能接口的范畴。

在语音识别技术中，最简单的是对特定人、小词汇量、孤立词的语音识别，最复杂、最难的是对非特定人、大词汇量、连续语音的语音识别。目前主要采用的主流算法是隐马尔可夫模型方法。

语音识别系统在本质上是一种模式识别系统，通常包括特征提取、模式匹配和参考模式库等基本单元，如图1所示。语音信号先经过特征提取后形成特征矢量，并利用词典和子词模型集合串接成的词模型进行识别，然后根据语言模型的句法限制在句子级进行输入语音与参考模板间的匹配，最后识别出相应的句子。因此，语言模型的确定对于语音识别系统至关重要。

现有技术中，语言模型一般是直接利用大型语料库进行训练得到的，但是对于特定语种或者特定领域，我们没有相关的语料库，根本无法训练得到语言模型。目前一般的做法是跨地区甚至跨国抓取HTML语料，从而得到相应语种的语料库，以利用得到的语料库对语言模型进行训练。但是通过抓取HTML语料的做法是比较困难的，且得到的语料质量较差不一定好，特别是对于特定的领域，例如电话客服领域，根本无法得到相应的语料。这种使用就必须采用人工标注的方法建立相应的语料库，这种办法需要很多会该语种的人录制并制作语料库，周期长且花费较大。

发明内容

为了克服上述现有技术的不足，本发明提供了一种语音识别设备的错误发音自动纠正更新方法和系统，包括语音识别设备和云服务器，所述语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库；通过麦克风获取语音识别信息，并与声学模型库对比并且计算发音符合度，如符合度低于门限值，则判断错误发音语料库内有无错误语音，如果有，则直接使用错误发音语料库内的正确语音片段替换错误语音，并且从音响装置输出；否则，调取声学模型库内的标准发音替换错误语音，并且使用输出装置输出，然后将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库，以达到智能辅助语言训练，并自动记录错误发音习惯和自动纠偏的技术目的。

本发明所采用的技术方案是：语音识别设备的错误发音自动纠正更新方法，包括如下步骤：

S100、通过麦克风获取语音识别信息；

S200、与声学模型库对比并且计算符合度，如果符合度低于门限值，则进入步骤S400，否则，执行步骤S300；

S300、从音响装置输出当前正确发音；

S400、判断错误发音语料库内有无错误语音，如果有，则进入步骤S500，否则，进入步骤S600；

S500、直接使用错误发音语料库内的正确语音片段替换错误语音，并且从音响装置输出；

S600、调取声学模型库内的标准发音替换错误语音，并且使用输出装置输出；

S700、将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库。

更优地，在S100之前，语音识别设备已预存声学模型库数据。

更优地，符合度门限值为0.3-0.5。

更优地，S700的后续步骤还包括：S701、将当前错误发音和声学模型库对应的标准发音上传到云服务器，以分享给其他语音识别设备的错误发音语料库。

语音识别设备的错误发音自动纠正更新系统，包括语音识别设备和云服务器，语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库，错误发音语料库和云服务器具有网络连接，并且：