[发明专利]一种语音识别模型的获取方法及装置在审
| 申请号: | 202010478563.7 | 申请日: | 2020-05-29 |
| 公开(公告)号: | CN111862954A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 郑晓明;李健;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L15/18 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 识别 模型 获取 方法 装置 | ||
本发明实施例提供了一种语音识别模型获取方法及装置,该方法包括:根据样本词语确定韵律词,得到目标预设词语;再根据目标预设词语中各字符的位置,为目标预设词语对应的音素标注位置信息,得到目标音素;该位置信息用于表征音素在目标预设词语发音中的位置;根据目标音素及目标预设词语,训练得到目标语音识别模型。本发明实施例中是基于韵律词进行位置信息的标注,使得位置信息能够真正体现实际发音的韵律节奏,这样,基于目标预设词语和标注后的目标音素训练语音识别模型,可以使得语音识别模型更加准确,进而能够提高语音识别的识别率。
技术领域
本发明涉及语音识别领域,特别是涉及一种语音识别模型获取方法及装置。
背景技术
语音识别(Automatic Speech Recognition,ASR)是一项研究如何将人类说话的声音识别转换为文本的技术,其广泛应用于语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等服务中。
为了实现语音识别,经常需要获取语音识别模型。因此,亟需一种语音识别模型的获取方法。
发明内容
本发明实施例提供一种语音识别模型的获取方法及装置,以解决现有技术中语音识别准确率低的问题。
为了解决上述问题,本发明实施例是这样实现的:
第一方面,本发明实施例公开了一种语音识别模型的获取方法,包括:
根据样本词语确定韵律词,得到目标预设词语;
根据所述目标预设词语中各字符的位置,为所述目标预设词语对应的音素标注位置信息,得到目标音素;所述位置信息用于表征所述音素在所述目标预设词语发音中的位置;
根据所述目标音素及所述目标预设词语,训练得到目标语音识别模型。
第二方面,本发明实施例公开了一种语音识别模型的获取装置,包括:
第一确定模块,用于根据样本词语确定韵律词,得到目标预设词语;
标注模块,用于根据所述目标预设词语中各字符的位置,为所述目标预设词语对应的音素标注位置信息,得到目标音素;所述位置信息用于表征所述音素在所述目标预设词语发音中的位置;
训练模块,用于根据所述目标音素及所述目标预设词语,训练得到目标语音识别模型。
第三方面,本发明实施例还提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现第一方面所述的语音识别模型获取的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现第一方面所述的语音识别模型获取的步骤。
在本发明实施例中,根据样本词语确定韵律词,得到目标预设词语;再根据目标预设词语中各字符的位置,为目标预设词语对应的音素标注位置信息,得到目标音素;该位置信息用于表征音素在目标预设词语发音中的位置;根据目标音素及目标预设词语,训练得到目标语音识别模型。本发明实施例中,是基于韵律词进行位置信息的标注,使得位置信息能够真正体现实际发音的韵律节奏,这样,基于标注后的目标预设词语和目标音素训练模型,可以使得语音识别模型更加准确,进而能够提高语音识别的识别率。
附图说明
图1示出了本发明的一种语音识别模型获取方法的步骤流程图;
图2示出了本发明的另一种语音识别模型获取方法的步骤流程图;
图3示出了本发明的一种语音识别模型获取装置的结构框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010478563.7/2.html,转载请声明来源钻瓜专利网。





