[发明专利]语音识别设备的错误发音自动纠正更新方法和更新系统在审

专利信息
申请号: 201711239000.7 申请日: 2017-11-30
公开(公告)号: CN107993653A 公开(公告)日: 2018-05-04
发明(设计)人: 李晓飞 申请(专利权)人: 南京云游智能科技有限公司
主分类号: G10L15/10 分类号: G10L15/10;G10L15/30;G10L15/34;G10L15/06
代理公司: 南京正联知识产权代理有限公司32243 代理人: 邓道花
地址: 210038 江苏省南京经*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 设备 错误 发音 自动 纠正 更新 方法 系统
【说明书】:

技术领域

发明涉及语音识别技术领域,特别是涉及一种语音识别设备的错误发音自动纠正更新方法和系统。

背景技术

语音识别是一种利用机器模拟人类的识别和理解过程、把人类的语音信号转变为相应的文本或命令的技术。语音识别的根本目的是研究出一种具有听觉功能的机器,能直接接受人的语音,理解人的意图,并做出相应的反应。从技术上看,它属于多维模式识别和智能接口的范畴。

在语音识别技术中,最简单的是对特定人、小词汇量、孤立词的语音识别,最复杂、最难的是对非特定人、大词汇量、连续语音的语音识别。目前主要采用的主流算法是隐马尔可夫模型方法。

语音识别系统在本质上是一种模式识别系统,通常包括特征提取、模式匹配和参考模式库等基本单元,如图1所示。语音信号先经过特征提取后形成特征矢量,并利用词典和子词模型集合串接成的词模型进行识别,然后根据语言模型的句法限制在句子级进行输入语音与参考模板间的匹配,最后识别出相应的句子。因此,语言模型的确定对于语音识别系统至关重要。

现有技术中,语言模型一般是直接利用大型语料库进行训练得到的,但是对于特定语种或者特定领域,我们没有相关的语料库,根本无法训练得到语言模型。目前一般的做法是跨地区甚至跨国抓取HTML语料,从而得到相应语种的语料库,以利用得到的语料库对语言模型进行训练。但是通过抓取HTML语料的做法是比较困难的,且得到的语料质量较差不一定好,特别是对于特定的领域,例如电话客服领域,根本无法得到相应的语料。这种使用就必须采用人工标注的方法建立相应的语料库,这种办法需要很多会该语种的人录制并制作语料库,周期长且花费较大。

发明内容

为了克服上述现有技术的不足,本发明提供了一种语音识别设备的错误发音自动纠正更新方法和系统,包括语音识别设备和云服务器,所述语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库;通过麦克风获取语音识别信息,并与声学模型库对比并且计算发音符合度,如符合度低于门限值,则判断错误发音语料库内有无错误语音,如果有,则直接使用错误发音语料库内的正确语音片段替换错误语音,并且从音响装置输出;否则,调取声学模型库内的标准发音替换错误语音,并且使用输出装置输出,然后将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库,以达到智能辅助语言训练,并自动记录错误发音习惯和自动纠偏的技术目的。

本发明所采用的技术方案是:语音识别设备的错误发音自动纠正更新方法,包括如下步骤:

S100、通过麦克风获取语音识别信息;

S200、与声学模型库对比并且计算符合度,如果符合度低于门限值,则进入步骤S400,否则,执行步骤S300;

S300、从音响装置输出当前正确发音;

S400、判断错误发音语料库内有无错误语音,如果有,则进入步骤S500,否则,进入步骤S600;

S500、直接使用错误发音语料库内的正确语音片段替换错误语音,并且从音响装置输出;

S600、调取声学模型库内的标准发音替换错误语音,并且使用输出装置输出;

S700、将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库。

更优地,在S100之前,语音识别设备已预存声学模型库数据。

更优地,符合度门限值为0.3-0.5。

更优地,S700的后续步骤还包括:S701、将当前错误发音和声学模型库对应的标准发音上传到云服务器,以分享给其他语音识别设备的错误发音语料库。

语音识别设备的错误发音自动纠正更新系统,包括语音识别设备和云服务器,语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库,错误发音语料库和云服务器具有网络连接,并且:

语音对比器用于比较当前发音是否跟声学模型库中的标准发音相符合,并计算符合度;

发音纠正装置用于将用户当前的错误语音直接用错误发音语料库中相对应的正确语音片段替换;

错误发音语料库用于存储用户的错误发音和声学模型库中标准发音之间的对应关系。

更优地,语音识别设备在运行工作之前,已预存声学模型库数据,这些声学模型库数据为隐马尔可夫模型HMM,其用HMM刻画语音信号作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值只与当前状态或当前的状态转移有关。

与现有技术相比,本发明的有益效果是:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京云游智能科技有限公司,未经南京云游智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711239000.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top