[发明专利]音频降噪传输方法、装置、电子设备和计算机可读介质在审
申请号: | 202110237562.8 | 申请日: | 2021-03-04 |
公开(公告)号: | CN112599147A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 周玉佳 | 申请(专利权)人: | 北京嘉诚至盛科技有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L25/30 |
代理公司: | 北京卫智畅科专利代理事务所(普通合伙) 11557 | 代理人: | 陈佳 |
地址: | 100125 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 传输 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种音频降噪传输方法,应用于穿戴装置,包括:
获取语音采集装置所采集的音频信号;
对所述音频信号进行时域转换处理以生成时域波形;
对所述时域波形进行频谱变换处理,得到音频频谱;
对所述音频频谱进行频谱特征提取处理以生成频谱特征信息;
将所述频谱特征信息输入至预先训练的音频提取网络,得到频谱提取结果;
对所述频谱提取结果进行降噪处理,得到降噪音频信号;
其中,所述音频提取网络是通过以下步骤训练得到的:
获取训练样本集,其中,所述训练样本集中的训练样本包括:样本频谱特征、与所述样本频谱特征对应的幅度特征向量和与所述样本频谱特征对应的相位特征向量;
基于训练样本集,执行如下处理步骤:
将训练样本集中的至少一个训练样本包括的样本频谱特征输入至初始神经网络,得到所述至少一个训练样本中的每个训练样本对应的样本频谱提取结果,其中,所述样本频谱提取结果包括频谱幅度特征向量和频谱相位特征向量;
通过预先设置的损失函数,确定所述至少一个训练样本的损失值;
响应于确定损失值小于等于预设阈值,将初始神经网络确定为音频提取网络;
其中,所述通过预先设置的损失函数,确定所述至少一个训练样本的损失值,包括:
将所述至少一个训练样本中的每个训练样本对应的样本频谱提取结果所包括的幅度特征向量所包括的各个维度下各个数据的数量确定为幅度量,得到幅度量组;
将所述至少一个训练样本中的每个训练样本对应的样本频谱提取结果所包括的相位特征向量所包括的各个维度下各个数据的数量确定为相位量,得到相位量组;
基于所述至少一个训练样本中的每个训练样本、与所述训练样本对应的样本频谱提取结果、与所述训练样本对应的幅度量和相位量,生成单位损失值,得到单位损失值组;
将所述单位损失值组中各个单位损失值的总和确定为所述至少一个训练样本的损失值;
其中,所述基于所述至少一个训练样本中的每个训练样本、与所述训练样本对应的样本频谱提取结果、与所述训练样本对应的幅度量和相位量,生成单位损失值,包括:
对所述训练样本包括的幅度特征向量中的每一维度下的数据和相位特征向量中的每一维度下的数据分别进行翻转处理以生成翻转后的幅度特征向量和翻转后的相位特征向量;
对所述样本频谱提取结果包括的频谱幅度特征向量中的每一维度下的数据和频谱相位特征向量中的每一维度下的数据分别进行翻转处理以生成翻转后的频谱幅度特征向量和翻转后的频谱相位特征向量;
通过以下公式,生成单位损失值:
,
其中,表示幅度损失值,表示所述幅度量,表示所述翻转后的幅度特征向量所包括的维度下数据的序号,表示所述翻转后的幅度特征向量中第维的值,表示与所述翻转后的幅度特征向量对应的翻转后的频谱幅度特征向量中第维的值,表示所述翻转后的幅度特征向量中的各个维度下的数据与所述翻转后的频谱幅度特征向量中的各个维度下的数据的和的平均值,表示相位损失值,表示所述相位量,表示所述翻转后的相位特征向量所包括的维度下数据的序号,表示所述翻转后的相位特征向量中第维的值,表示与所述翻转后的相位特征向量对应的翻转后的频谱相位特征向量中第维的值,表示所述翻转后的相位特征向量中的各个维度下的数据与所述翻转后的频谱相位特征向量中的各个维度下的数据的和的平均值,表示单位损失值。
2.根据权利要求1所述的方法,其中,所述方法还包括:
对所述降噪音频信号进行压缩处理以生成压缩信号;
将所述压缩信号传输至与所述穿戴装置关联的扬声器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘉诚至盛科技有限公司,未经北京嘉诚至盛科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110237562.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:神经内科护理用照明装置
- 下一篇:一种铁路声屏障柱脚钢结构疲劳性能试验方法