[发明专利]一种基于注意力特征处理网络的中文语音识别方法在审
申请号: | 202310088585.6 | 申请日: | 2023-01-29 |
公开(公告)号: | CN116189662A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 王春艳;许召辉;吕荣闯;范光宇;饶蕾 | 申请(专利权)人: | 中航华东光电(上海)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/20;G10L15/22 |
代理公司: | 上海乐泓专利代理事务所(普通合伙) 31385 | 代理人: | 张雪 |
地址: | 201114 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 特征 处理 网络 中文 语音 识别 方法 | ||
本发明提供的一种基于注意力特征处理网络的中文语音识别方法,所述语音识别方法包括:获取用于训练的语音信号,提取语谱图特征;在初始的所述语谱图特征中筛选关键特征信息;将所述关键特征信息分别进行放大特征维度;进行一次判断,判断上采样后的特征图维度是否满足条件;如果满足,放大后的特征维度不等于初始时输入的特征维度,则继续执行上采样放大操作;将所述特征维度进行融合,并发送至声学模型,实现模型的训练和预测。采用一种基于注意力机制特征处理网络结构,实现更高精度的语音识别效果。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种基于注意力特征处理网络的中文语音识别方法。
背景技术
现有技术中,利用神经网络搭建声学模型实现语音识别已成为一种主流的趋势,随着现在对模型预测精度要求的提高,在训练模型时需要往数据集中注入大量数据样本才能实现较高的准确率。但是现存的深度学习数据集中存在着严重的数据集信息冗余的问题,一个样本中真正有用的信息占比很小,以语音数据集为例,在语音数据集中存在各种噪声,如:每一时刻都会存在的加性噪声、以及因自身发音而导致的拖音、混音、气息声音、等问题带来的单条训练样本信息冗余问题。这些问题严重影响了模型的预测精度。
发明内容
鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种基于注意力特征处理网络的中文语音识别方法。
根据本发明的一个方面,提供了一种基于注意力特征处理网络的中文语音识别方法,所述语音识别方法包括:
获取用于训练的语音信号,提取语谱图特征;
在初始的所述语谱图特征中筛选关键特征信息;
将所述关键特征信息分别进行放大特征维度;
进行一次判断,判断上采样后的特征图维度是否满足条件;
如果满足,放大后的特征维度不等于初始时输入的特征维度,则继续执行上采样放大操作;
将所述特征维度进行融合,并发送至声学模型,实现模型的训练和预测。
可选的,所述获取用于训练的语音信号,提取语谱图特征具体包括:将用于训练的语音信号进行分帧、加窗操作,提取到语谱图特征。
可选的,所述语谱图特征为用于语音识别的特征。
可选的,所述在初始的所述语谱图特征中筛选关键特征信息具体包括:将初始的所述语谱图特征输入到卷积层操作中进行压缩操作,实现对关键特征信息的筛选。
可选的,所述将所述关键特征信息分别进行放大特征维度具体包括:将多次压缩之后的特征信息分别进行某种上采样操作实现特征维度的放大。
可选的,所述将所述特征维度进行融合,并发送至声学模型,实现模型的训练和预测具体包括:满足判断条件之后,将多层编码层的输出经过上采样之后,实现融合;
输出融合之后的特征信息,输送至声学模型,实现模型的训练和预测。
本发明提供的一种基于注意力特征处理网络的中文语音识别方法,所述语音识别方法包括:获取用于训练的语音信号,提取语谱图特征;在初始的所述语谱图特征中筛选关键特征信息;将所述关键特征信息分别进行放大特征维度;进行一次判断,判断上采样后的特征图维度是否满足条件;如果满足,放大后的特征维度不等于初始时输入的特征维度,则继续执行上采样放大操作;将所述特征维度进行融合,并发送至声学模型,实现模型的训练和预测。一种基于注意力机制特征处理网络结构,实现更高精度的语音识别效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中航华东光电(上海)有限公司,未经中航华东光电(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310088585.6/2.html,转载请声明来源钻瓜专利网。