[发明专利]一种语音识别方法、装置、电子设备及存储介质有效
申请号: | 201711479538.5 | 申请日: | 2017-12-29 |
公开(公告)号: | CN107993651B | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 张淼;徐宇垚 | 申请(专利权)人: | 深圳和而泰数据资源与云技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L15/26 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市南山区高新南区科*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供一种语音识别方法、装置、电子设备及存储介质,其中方法包括如下步骤:获取第一格式的目标口语数据,采用预设编码方式获取所述目标口语数据对应的目标口语序列;将所述目标口语序列输入至预先训练的卷积神经网络CNN模型中,以获取所述目标口语序列对应的第二格式的目标语音序列;基于所述目标语音序列获取所述目标口语数据对应的标准语音数据,并执行所述标准语音数据指示的操作指令。采用本发明,可以增强语音数据识别效果,进而提高了语音数据识别的准确率。
技术领域
本发明涉及电子技术领域,尤其涉及一种语音识别方法、装置、电子设备及存储介质。
背景技术
随着社会的发展,电子技术发展的越来越快,智能家电设备也越来越普及。语音识别技术对于智能家电设备而言,是一项革命性的技术,由于其不需要手动操作,只需要发出语音指令,便可实现对智能家电设备控制。
目前,智能家电设备的语音控制方式通常是将用户输入的语音数据与训练样本直接进行匹配,基于匹配结果从而实现语音识别。但这种语音识别方式通常会因为用户发音方式的不同或者用户发音语法结构等因素影响,容易产生匹配错误,使得语音数据的识别效果较差,从而降低了语音数据识别的准确率。
发明内容
本发明实施例提供一种语音识别方法、装置、电子设备及存储介质,可以解决语音数据识别效果差而导致识别准确率低的问题。
本发明实施例第一方面提供了一种语音识别方法,包括:
获取第一格式的目标口语数据,采用预设编码方式获取所述目标口语数据对应的目标口语序列;
将所述目标口语序列输入至预先训练的卷积神经网络CNN模型中,以获取所述目标口语序列对应的第二格式的目标语音序列;
基于所述目标语音序列获取所述目标口语数据对应的标准语音数据,并执行所述标准语音数据指示的操作指令。
可选的,所述采用预设编码方式获取所述目标口语数据对应的目标口语序列,包括:
对所述目标口语数据进行分词处理,以获取所述目标口语数据对应的多个词组数据;
将所述多个词组数据中的每个词组数据分别转换为预设长度的向量,以获取所述目标口语数据对应的目标口语序列。
可选的,所述对所述目标口语数据进行分词处理,以获取所述目标口语数据对应的多个词组数据之后,还包括:
在停用词集合中查找与所述多个词组数据相匹配的目标词组数据;
删除所述多个词组数据中的目标词组数据。
可选的,所述将所述目标口语序列输入至预先训练的卷积神经网络CNN模型中,以获取所述目标口语序列对应的第二格式的目标语音序列之前,还包括:
采集所述第二格式的样本语音数据以及与所述样本语音数据相关联的所述第一格式的第一口语数据和与所述样本标准语音数据无关联的所述第一格式的第二口语数据;
采用所述预设编码方式分别对所述样本语音数据、所述第一口语数据以及所述第二口语数据进行编码,以分别获取所述样本语音数据对应的样本语音序列、所述第一口语数据对应的第一口语序列以及所述第二口语数据对应的第二口语序列;
创建CNN模型,将所述样本语音序列、所述第一口语序列以及所述第二口语序列作为所述CNN模型的输入,并获取所述CNN模型的损失值;
当所述损失值小于或者等于预设损失阈值时,生成训练后的所述CNN模型。
可选的,所述将所述样本语音序列、所述第一口语序列以及所述第二口语序列作为所述CNN模型的输入,并获取所述CNN模型的损失值,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳和而泰数据资源与云技术有限公司,未经深圳和而泰数据资源与云技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711479538.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成信息的方法和装置
- 下一篇:一种语音控制执行系统