[发明专利]语音信号的增强处理方法和装置在审
| 申请号: | 202110307449.2 | 申请日: | 2021-03-23 |
| 公开(公告)号: | CN113744754A | 公开(公告)日: | 2021-12-03 |
| 发明(设计)人: | 陈泽华;吴俊仪;蔡玉玉;雪巍;杨帆;丁国宏;何晓冬 | 申请(专利权)人: | 京东数字科技控股股份有限公司 |
| 主分类号: | G10L21/0316 | 分类号: | G10L21/0316;G10L21/0224;G10L21/0232;G10L25/03;G10L25/30;G10L25/45;G06N20/00 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 张雷;方亮 |
| 地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 信号 增强 处理 方法 装置 | ||
本公开涉及一种语音信号的增强处理方法和装置,涉及语音信号处理领域。该增强处理方法包括:提取待处理语音信号在时频域的幅度谱,作为待处理幅度谱,待处理语音信号中包含噪声;根据待处理语音信号的每一帧幅度谱及其相应的多帧历史幅度谱,确定待处理语音信号的幅度谱统计特征;根据待处理幅度谱、幅度谱统计特征,利用机器学习模型消除待处理幅度谱中的噪声,获取增强语音信号。
技术领域
本公开涉及语音信号处理领域,特别涉及一种语音信号的增强处理方法、语音信号的增强处理装置和非易失性计算机可读存储介质。
背景技术
近年来,语音识别技术的飞跃给用户带来了全新的信息输入体验。用语音输入代替传统的文本输入交互方式,提高了输入效率,降低了用户使用门槛,简化了人机交互操作过程。
目前,语音识别能力日益完善,在无噪音的环境下识别准确率高,已经达到实用标准。但是,在识别有背景噪声的语音时,准确度会有所下降。因此,对语音信号进行增强处理成为了语音识别领域的必要研究方向。
在相关技术中,在时频域上求解用于降噪的增益函数,利用该增益函数增强语音信号。
发明内容
本公开的发明人发现上述相关技术中存在如下问题:增益函数依赖于信号处理领域的专家知识,无法适应不同类型的噪声,导致语音信号增强处理的效果差。
鉴于此,本公开提出了一种语音信号的增强处理技术方案,能够提高语音信号增强处理的效果。
根据本公开的一些实施例,提供了一种语音信号的增强处理方法,包括:提取待处理语音信号在时频域的幅度谱,作为待处理幅度谱,所述待处理语音信号中包含噪声;根据所述待处理语音信号的每一帧幅度谱及其相应的多帧历史幅度谱,确定所述待处理语音信号的幅度谱统计特征;根据所述待处理幅度谱、所述幅度谱统计特征,利用机器学习模型消除所述待处理幅度谱中的噪声,获取增强语音信号。
在一些实施例中,所述根据所述待处理语音信号的每一帧幅度谱及其相应的多帧历史幅度谱,确定所述待处理语音信号的幅度谱统计特征包括:利用相应的多帧历史幅度谱,对所述每一帧幅度谱进行平滑滤波处理,确定所述幅度谱统计特征。
在一些实施例中,所述利用所述相应的多帧历史幅度谱对每一帧幅度谱进行平滑滤波处理,确定所述幅度谱统计特征包括:利用二维卷积结构,对所述每一帧幅度谱进行平滑滤波处理,确定所述幅度谱统计特征。
在一些实施例中,所述根据所述待处理语音信号的每一帧幅度谱及其相应的多帧历史幅度谱,确定所述待处理语音信号的幅度谱统计特征包括:根据所述每一帧幅度谱及其相应的多帧历史幅度谱的加权和,确定所述幅度谱统计特征。
在一些实施例中,所述根据所述待处理语音信号的每一帧幅度谱及其相应的多帧历史幅度谱,确定所述待处理语音信号的幅度谱统计特征包括:在各时间窗口内,根据所述待处理语音信号的每一帧幅度谱及其相应的多帧历史幅度谱,确定所述待处理语音信号在各时间窗口内的幅度谱统计特征。
在一些实施例中,所述根据所述待处理幅度谱、所述幅度谱统计特征,利用机器学习模型消除所述待处理幅度谱中的噪声,获取增强语音信号包括:将所述待处理幅度谱和所述幅度谱统计特征在通道维上进行拼接,生成三维特征矩阵;将所述三维特征矩阵输入所述机器学习模型,获取所述增强语音信号。
在一些实施例中,所述根据所述待处理幅度谱、所述幅度谱统计特征,利用机器学习模型消除所述待处理幅度谱中的噪声,获取增强语音信号包括:将所述待处理幅度谱、所述幅度谱统计特征输入所述机器学习模型,输出所述待处理语音信号的增强处理幅度谱;对所述增强幅度谱和提取的所述待处理语音信号在时频域的相位谱,进行逆时频变换,确定所述增强语音信号。
在一些实施例中,所述机器学习模型通过如下的方式训练:利用梯度回传方式,训练所述待处理幅度谱对于所述机器学习模型的连接权重、所述各幅度谱统计特征对于所述机器学习模型的连接权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股股份有限公司,未经京东数字科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110307449.2/2.html,转载请声明来源钻瓜专利网。





