[发明专利]一种基于注意力特征处理网络的中文语音识别方法在审
申请号: | 202310088585.6 | 申请日: | 2023-01-29 |
公开(公告)号: | CN116189662A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 王春艳;许召辉;吕荣闯;范光宇;饶蕾 | 申请(专利权)人: | 中航华东光电(上海)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/20;G10L15/22 |
代理公司: | 上海乐泓专利代理事务所(普通合伙) 31385 | 代理人: | 张雪 |
地址: | 201114 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 特征 处理 网络 中文 语音 识别 方法 | ||
1.一种基于注意力特征处理网络的中文语音识别方法,其特征在于,所述语音识别方法包括:
获取用于训练的语音信号,提取语谱图特征;
在初始的所述语谱图特征中筛选关键特征信息;
将所述关键特征信息分别进行放大特征维度;
进行一次判断,判断上采样后的特征图维度是否满足条件;
如果满足,放大后的特征维度不等于初始时输入的特征维度,则继续执行上采样放大操作;
将所述特征维度进行融合,并发送至声学模型,实现模型的训练和预测。
2.根据权利要求1所述的一种基于注意力特征处理网络的中文语音识别方法,其特征在于,所述获取用于训练的语音信号,提取语谱图特征具体包括:将用于训练的语音信号进行分帧、加窗操作,提取到语谱图特征。
3.根据权利要求1所述的一种基于注意力特征处理网络的中文语音识别方法,其特征在于,所述语谱图特征为用于语音识别的特征。
4.根据权利要求1所述的一种基于注意力特征处理网络的中文语音识别方法,其特征在于,所述在初始的所述语谱图特征中筛选关键特征信息具体包括:将初始的所述语谱图特征输入到卷积层操作中进行压缩操作,实现对关键特征信息的筛选。
5.根据权利要求1所述的一种基于注意力特征处理网络的中文语音识别方法,其特征在于,所述将所述关键特征信息分别进行放大特征维度具体包括:将多次压缩之后的特征信息分别进行某种上采样操作实现特征维度的放大。
6.根据权利要求1所述的一种基于注意力特征处理网络的中文语音识别方法,其特征在于,所述将所述特征维度进行融合,并发送至声学模型,实现模型的训练和预测具体包括:满足判断条件之后,将多层编码层的输出经过上采样之后,实现融合;
输出融合之后的特征信息,输送至声学模型,实现模型的训练和预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中航华东光电(上海)有限公司,未经中航华东光电(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310088585.6/1.html,转载请声明来源钻瓜专利网。