[发明专利]基于改进GAN网络的语音去噪方法、装置、设备及介质有效

申请号：	201810985896.1	申请日：	2018-08-28
公开（公告）号：	CN108986835B	公开（公告）日：	2019-11-26
发明（设计）人：	成学军	申请（专利权）人：	百度在线网络技术(北京)有限公司
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/02
代理公司：	11205 北京同立钧成知识产权代理有限公司	代理人：	吴会英;刘芳<国际申请>=<国际公布>=
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请实施例提供了一种基于改进GAN网络的语音去噪方法、装置、设备及介质。该方法包括：获取待处理的语音数据；对待处理的语音数据进行特征提取，形成待处理语音的特征数据；计算待处理语音的特征数据的均值方差归一化处理值；将待处理语音的特征数据的均值方差归一化处理值输入到改进GAN网络的生成器中，输出待处理的语音数据对应的去噪语音特征数据的理想掩膜值；根据去噪语音特征数据的理想掩膜值确定待处理的语音数据的去噪语音数据；其中，待处理的语音数据对应的去噪语音特征数据的理想掩膜值为待处理的语音数据对应的去噪语音特征数据和待处理语音特征数据的比值。能够对复杂分布的噪声信号也具有明显的去噪效果，有效提高了去噪效果。
搜索关键词：	语音数据去噪语音特征数据特征数据掩膜归一化处理语音去噪语音方差改进复杂分布特征提取噪声信号网络生成器输出申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于改进GAN网络的语音去噪方法，其特征在于，包括：/n获取待处理的语音数据；/n对所述待处理的语音数据进行特征提取，形成待处理语音的特征数据；/n计算所述待处理语音的特征数据的均值方差归一化处理值；/n将所述待处理语音的特征数据的均值方差归一化处理值输入到改进GAN网络的生成器中，输出所述待处理的语音数据对应的去噪语音特征数据的理想掩膜值；/n根据所述去噪语音特征数据的理想掩膜值确定待处理的语音数据的去噪语音数据；/n其中，所述待处理的语音数据对应的去噪语音特征数据的理想掩膜值为所述待处理的语音数据对应的去噪语音特征数据和待处理语音特征数据的比值。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司，未经百度在线网络技术(北京)有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810985896.1/，转载请声明来源钻瓜专利网。

同类专利

音频信号处理设备、方法和电子设备-201710030744.1
发明人：徐荣强 -专利权人：北京地平线信息技术有限公司
申请日： 2017-01-17 - 公布日： 2020-02-14 - 主分类号： G10L21/0208
摘要：公开了一种音频信号处理设备、方法和电子设备。该音频信号处理设备包括：麦克风阵列，包括具有不同拾音区的多个指向麦克风；音频定位器件，用于识别第一组声源并确定每个声源在音频坐标系下的位置；摄像头，用于捕捉当前场景的场景图像，该当前场景至少覆盖该多个指向麦克风的拾音区；图像定位器件，用于识别第二组声源并确定每个声源在图像坐标系下的位置；以及声源分类器，用于根据音频与图像坐标系之间的配准关系、每个声源在该音频坐标系下的位置、和每个声源在该图像坐标系下的位置来对该第一和第二组声源中的每个声源进行分类。因此，可以利用指向麦克风和摄像头的双重定位来实现声源的精确分类。

一种音频处理方法及电子设备-201711047149.5
发明人：付姝华 -专利权人：维沃移动通信有限公司
申请日： 2017-10-31 - 公布日： 2020-02-14 - 主分类号： G10L21/0208
摘要：本发明提供了一种音频处理方法及电子设备。其中，该音频处理方法包括：在电子设备接收到第一上行音频信号时，在第一上行音频信号中混入预设频率的超声波信号，得到第二上行音频信号，并播放第二上行音频信号；采集包含第二上行音频信号的环境声音信号，并从采集到的环境声音信号中分离出第一下行音频信号和超声波信号；利用分离出的超声波信号，对第一下行音频信号进行回声抑制处理，得到第二下行音频信号；发送第二下行音频信号至通讯对端。上述技术方案，利用超声波信号抑制下行音频信号中的回声信号，从而提高语音质量。

一种基于RCED网络的降噪方法-201910913616.0
发明人：蓝天;吕忆蓝;李森;刘峤;惠国强;钱宇欣;叶文政;彭川;李萌 -专利权人：电子科技大学
申请日： 2019-09-25 - 公布日： 2020-02-04 - 主分类号： G10L21/0208
摘要：本发明公开一种基于RCED网络的降噪方法，包括以下步骤：S1：构建RCED；S2：将目标增强帧和其两侧的部分帧进行拼接，然后通过RCED进行卷积操作；S3：将RCED中的编码器输出和相应解码器输出进行拼接，然后输入到下一个卷积层中执行后续操作；S4：引入shortcut机制，将所有编码器和所有解码器分别组合成一个Dense Block，在层之间增加短路路径。本发明使用只包含卷积层的RCED，丢弃了池化层和与其对应的上采样层；并在其上引入不同的shortcut机制，性能良好且有泛化性，可以重复利用信息，从而使用更少的数据来提取出更多有用的特征；易于训练、减少梯度消亡、减少参数，同时在小数据集上克服过拟合的问题。

语音信号的处理方法和装置-201510866175.5
发明人：时雪煜;李先刚;邹赛赛 -专利权人：百度在线网络技术(北京)有限公司
申请日： 2015-11-27 - 公布日： 2020-02-04 - 主分类号： G10L21/0208
摘要：本发明提出一种语音信号的处理方法和装置，其中所述方法包括以下步骤：采集噪声样本信号；根据噪声样本信号对预存的纯净语音样本信号进行处理，得到具有噪声的噪声语音样本信号；根据噪声语音样本信号和纯净语音样本信号训练语音模型。本发明实施例的语音信号的处理方法，通过该语音模型可以大大提高在噪声环境下的语音识别的准确性，提升语音识别服务的鲁棒性和语音识别服务的体验。

远场语音降噪方法及系统、终端以及计算机可读存储介质-201810297312.1
发明人：耿雷 -专利权人：百度在线网络技术(北京)有限公司
申请日： 2018-04-04 - 公布日： 2020-01-24 - 主分类号： G10L21/0208
摘要：本发明提出一种远场语音降噪方法及系统、终端以及计算机可读存储介质。该远场语音降噪方法包括：采集用户的唇部特征，并识别唇部特征的特征位置值；比对所述特征位置值与标准位置值，判断唇部是否处于活动状态；确定处于活动状态的唇部在空间上的空间位置值；根据所述空间位置值，朝向处于活动状态的唇部的方位收取音频信号；以及对所述音频信号进行音频处理；其中，所述标准位置值是通过统计得出的，当唇部处于静止状态时，唇部特征的位置值。通过本发明的远场语音降噪方法，能够识别出实际说话人，并向实际说话人的方位收音，再进行音频处理操作，提高了在噪声环境下对远场语音的降噪性能。

多波束波束成形的方法、装置及电子设备-201810496450.2
发明人：周舒然;李志飞 -专利权人：出门问问信息科技有限公司
申请日： 2018-05-22 - 公布日： 2020-01-24 - 主分类号： G10L21/0208
摘要：本发明实施例公开了一种多波束波束成形的方法、装置及电子设备，目的在于实现多波束波束成形，确保目标空间指向的声音不失真，并对其他空间指向的声音进行有效抑制。技术方案包括：计算空间滤波参数与至少两个声音源指向分别对应的原始频域信号的第三乘积，得到多波束波束成形，空间滤波参数随声音源的角度和子带频率的不同而不同，至少两个声音源指向包含一个目标声音源及至少一个其他声音源指向；计算目标声音源指向的增强语音；根据目标声音源对应的子带能量与至少一个其他声音源指向的所有子带的能量和，计算能量比值；计算目标声音源指向的原始频域信号与目标声音源指向对应的增强语音、能量比值的第四乘积，并输出第四乘积对应的语音。

基于声学网络的监测方法、装置、终端及存储介质-201910865618.7
发明人：黄达林 -专利权人：深圳市铭华航电工艺技术有限公司
申请日： 2019-09-12 - 公布日： 2020-01-21 - 主分类号： G10L21/0208
摘要：本发明实施例公开了一种基于声学网络的监测方法、装置、终端及存储介质，该方法应用于设备的故障检测，该方法具体包括：采集待监测设备运行过程中的目标声音信号，所述目标声音信号包括本征信号和噪音信号；将所述本征信号以预定的时间基准换算至预设的时间坐标系；采用预设的声学处理算法对所述本征信号进行分析处理，生成与所述本征信号对应的监测结果并输出，所述监测结果包括所述待监测设备是否存在故障的判定结果和/或存在故障的类型。另外，在本发明实施例还公开了一种基于声学网络的监测装置、终端以及一种计算机可读介质。采用本发明，可实现故障的及时应对，减少因故障带来的损失。

一种基于桌面虚拟化的音频类外设降噪处理方法及系统-201910925472.0
发明人：刘海军 -专利权人：武汉噢易云计算股份有限公司
申请日： 2019-09-27 - 公布日： 2020-01-17 - 主分类号： G10L21/0208
摘要：本发明公开了一种基于桌面虚拟化的音频类外设降噪处理方法及系统，涉及通信技术领域，该方法包括以下步骤：利用桌面虚拟化终端接收外设音频数据；在外设音频数据中分离有效音频数据，识别各有效音频数据的起始点以及结束点；根据各有效音频数据和对应的起始点以及结束点，将外设音频数据进行拆分，获得多个外设音频数据帧；对多个外设音频数据帧进行降噪处理，获得降噪音频数据并上传至桌面虚拟化服务端。本发明利用音频降噪技术实时对音频类外设的音频数据进行筛选和降噪处理，提高音频数据质量，为正常的音频交互提供保障。

回声消除电路及电声设备-201920293190.9
发明人：赖浩沛;莫经科;王倩;何海明 -专利权人： TCL通力电子(惠州)有限公司
申请日： 2019-03-07 - 公布日： 2020-01-17 - 主分类号： G10L21/0208
摘要：本实用新型公开了一种回声消除电路及电声设备，包括功放模块、扬声器、麦克风、回声消除模块以及滤波电路；所述滤波电路用于将采集的所述功放模块发出的语音参考信号传输至所述回声消除模块，所述麦克风用于采集外界的混合语音信号并传输至所述回声消除模块，所述回声消除模块用于获取所述混合语音信号，并根据所述语音参考信号消除所述混合语音信号中的回声。本实用新型利用滤波电路降低了回声参考信号的噪音，提升了回声消除的效果。

噪声抑制的方法及装置-201610211263.6
发明人：曾元清 -专利权人： OPPO广东移动通信有限公司
申请日： 2016-04-05 - 公布日： 2020-01-14 - 主分类号： G10L21/0208
摘要：本发明提供一种噪声抑制的方法及装置，该噪声抑制的方法包括：采集录音信号；判断该录音信号是否满足预设降噪条件；若判定该录音信号满足该预设降噪条件，则对该录音信号进行降噪处理。本发明的噪声抑制的方法及装置，由于在降噪之前，先判断录音信号是否需要降噪，如果需要降噪再调用降噪算法；从而提高了灵活性，降低了终端的功耗。

音频信号处理方法、客户端和电子设备-201810718185.8
发明人：许云峰;余涛;刘礼 -专利权人：阿里巴巴集团控股有限公司
申请日： 2018-07-03 - 公布日： 2020-01-10 - 主分类号： G10L21/0208
摘要：本说明书公开了一种音频信号处理方法、客户端和电子设备，其中一种音频信号处理方法，包括：接收第一音频采集终端输入的第一音频信号，和第二音频采集终端输入的第二音频信号；所述第一音频采集终端和所述第二音频采集终端位于同一地点的不同位置；在所述第一音频信号和所述第二音频信号中确定目标音频信号和基准音频信号；基于所述基准音频信号确定所述目标音频信号对应的滤波系数；在所述目标音频信号中去除基于所述滤波系数和所述基准音频信号确定的串音信号。实现语音通路可以输出较少干扰的语音信号的效果。

信号处理方法、装置及电子设备-201510253309.6
发明人：李春林;陈方荣 -专利权人：宇龙计算机通信科技(深圳)有限公司
申请日： 2015-05-18 - 公布日： 2020-01-10 - 主分类号： G10L21/0208
摘要：本发明实施例公开了一种信号处理方法、装置及电子设备，当第一电子设备和第二电子设备进行语音通信的过程中，检测第一电子设备的待发送语音信号中是否包含单频音合成信号，当检测到第一电子设备的待发送语音信号中包含单频音合成信号时，判断所述单频音合成信号中是否包含第一电子设备开启双音多频编码功能所生成的单频音合成信号；当所述单频音合成信号中未包含第一电子设备开启双音多频编码功能所生成的单频音合成信号时，对所述待发送语音信号进行滤波后发送，滤波后的待发送语音信号中不包含所述单频音合成信号，从而避免第一电子设备在与第二电子设备进行通话的过程中接收到新的来电而对第二电子设备造成干扰。降低了通话过程的音频干扰。

一种音频数据处理方法、装置、设备及可读存储介质-201810690071.7
发明人：文仕学;潘逸倩 -专利权人：北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司
申请日： 2018-06-28 - 公布日： 2020-01-07 - 主分类号： G10L21/0208
摘要：本发明实施例提供了一种音频数据的处理方法、装置、设备及可读存储介质，该方法包括：获取音频输入设备采集到的音频数据，其中，所述音频数据为所述音频输入设备在封闭音频输入场景中采集到的时域数据；检测所述音频数据是否包含有混响干扰数据；若所述音频数据包含有混响干扰数据，则采用语音解混响模型在时域上消除所述音频数据中含有的混响干扰数据，得到目标音频数据。本申请实施例直接在时域上消除音频数据中的混响干扰数据，以避免将音频数据变换到频域进行解混响导致解混后的语音质量受限的问题，提高语音解混响的鲁棒性。

近距离交谈场景下双麦克风移动电话的实时语音降噪方法-201910945319.4
发明人：谭可;闫永杰 -专利权人：大象声科(深圳)科技有限公司
申请日： 2019-09-30 - 公布日： 2020-01-07 - 主分类号： G10L21/0208
摘要：本发明涉及的近距离交谈场景下双麦克风移动电话的实时语音降噪方法，包括如下步骤：接收主信道和辅信道中的带噪语音信号，其中包含语音和背景干扰噪声；从带噪语音信号中提取原始声学特征；卷积递归网络CRN，将原始声学特征输入卷积递归网络CRN中以模拟语音的时间动态，并对其进行掩模估计，得到相敏掩模PSM；将估计的相敏掩模PSM应用于主信道带噪语音信号以重新合成降噪语音的波形信号。本发明性能优秀，能够有效的在近距离交谈场景下降低通话噪音，与现有技术相比具有更强的实用性，且不依赖于噪音与说话者。

一种语音处理方法及装置-201810496822.1
发明人：周舒然;李志飞 -专利权人：出门问问信息科技有限公司
申请日： 2018-05-22 - 公布日： 2020-01-07 - 主分类号： G10L21/0208
摘要：本发明提供了一种语音处理方法及装置，该方法包括：通过麦克风阵列获取至少一路近端信号；对所述至少一路近端信号进行回声消除处理，得到至少一路残余回声信号；分别对所述至少一路近端信号以及所述至少一路残余回声信号进行波束成形处理；对波束成形处理后的至少一路近端信号以及所述至少一路残余回声信号进行非线性回声抑制处理，得到非线性回声抑制输出信号；对所述非线性回声抑制输出信号进行降噪和增益处理。因此，本发明提供的方案可以提高信噪比。

语音数据的处理方法、装置、电子设备及可读存储介质-201910900060.1
发明人：黄俊;王燕南 -专利权人：腾讯科技(深圳)有限公司
申请日： 2019-09-23 - 公布日： 2020-01-03 - 主分类号： G10L21/0208
摘要：本申请提供了一种语音数据的处理方法、装置、电子设备及计算机可读存储介质，涉及互联网领域。该方法包括：接收发送方发送的第一语音数据，获取相应的语音增强参数；基于获取到的语音增强参数对第一语音数据进行语音增强处理，得到第一语音增强数据，并基于第一语音数据确定第一语音增强参数；采用第一语音增强参数对获取到的语音增强参数进行更新，得到更新后的语音增强参数，以用于当接收到发送方发送的第二语音数据，基于更新后的语音增强参数对第二语音数据进行语音增强处理，并将第一语音增强数据发送至接收方。本申请实现了在不需要多个模型的情况下，不仅语音增强依然具有针对性，而且不需要存储多个模型，存储量需求较低。

语音增强的方法、装置、电子设备及计算机可读存储介质-201910918414.5
发明人：黄俊;王燕南 -专利权人：腾讯科技(深圳)有限公司
申请日： 2019-09-26 - 公布日： 2020-01-03 - 主分类号： G10L21/0208
摘要：本申请实施例提供了一种语音增强的方法、装置、电子设备及计算机可读存储介质，涉及音频处理技术领域。该方法包括：获取语音增强处理后的语音信号，语音增强后的语音信号是由语音增强网络模型对待处理语音信号进行语音增强处理后得到的，然后保持语音增强网络模型中除预设网络层之外的其它网络层的网络参数不变，基于语音增强后的语音信号对预设网络层进行自适应更新，以基于更新后的语音增强网络模型对下一次接收到待处理语音信号进行语音增强处理，预设网络层为语音增强网络模型的所有批处理层中的至少一层。本申请实施例实现了减少自适应更新所需要的自适应更新数据，并且可以降低自适应更新过程的复杂度，提升用户体验。

一种车内语音增强器、语音增强系统及增强方法-201911023358.5
发明人：阮海林;黄威;李龙晨;陈晓君;郑长炜;戴仁杰;赵嘉鹏 -专利权人：无锡吉兴汽车声学部件科技有限公司
申请日： 2019-10-25 - 公布日： 2020-01-03 - 主分类号： G10L21/0208
摘要：本发明公开了一种车内语音增强器、语音增强系统及增强方法，该语音增强系统包括语音采集麦克风组件、车内语音增强器和车内FM广播组件，语音采集麦克风组件通过信号线与车内语音增强器的语音采集麦克风接线柱相连，车内语音增强器插接于汽车驾驶舱内的CAN口处，语音采集麦克风采集到驾驶者的语音信号后传递车内语音增强器；语音增强器经过消噪增强后将语音信号通过FM信号发射控制板发出；车内FM广播接收到发出的语音信号并传递到车内扬声器进行播放。上述语音增强系统不仅实现了驾驶员语音信号的增强并传递到后排乘客区，提升车内语音交流清晰度；而且与汽车现有部件有很好的兼容性，无需对原车进行改造，布置简单，节约成本。

一种终端设备语音降噪的方法及装置-201410643546.9
发明人：刘琨;焦伟 -专利权人：中国移动通信集团公司
申请日： 2014-11-10 - 公布日： 2019-12-27 - 主分类号： G10L21/0208
摘要：本发明提供了一种终端设备语音降噪的方法及装置，其中方法包括：获取麦克阵列在第一时刻接收到的声音信号和终端设备的姿态的参数，并确定终端设备中麦克风阵列滤波器的主瓣区间；获取第二时刻终端设备的姿态的参数，并根据第二时刻相对于第一时刻终端设备的姿态的参数的改变量调整麦克风阵列滤波器的主瓣区间；根据调整后的主瓣区间和终端设备的姿态的参数的改变量，调节终端设备中的麦克风阵列滤波器，以控制麦克风阵列滤波器消除噪声。通过利用终端设备的姿态传感器与麦克风阵列滤波器结合的方式进行降噪，不需要实时都进行复杂的降噪计算，通过简单的运算就可以获得空间声源的区间，在此基础上对麦克风阵列滤波器快速调整，从而来进行降噪。

回声消除方法、装置及存储介质-201910915640.8
发明人：陈小燕;冯大航;陈孝良;常乐 -专利权人：北京声智科技有限公司
申请日： 2019-09-26 - 公布日： 2019-12-24 - 主分类号： G10L21/0208
摘要：本公开揭示了一种回声消除方法，属于声音处理技术领域。所述方法包括：获取近端声音信号和远端声音信号，所述近端声音信号和所述远端声音信号分别由若干个采样点数据构成，所述采样点数据为f位数据；将获取到的所述近端声音信号和所述远端声音信号输入回声消除算法模型；以f×h位数据为单位，通过所述回声消除算法模型对输入的信号进行回声消除处理，输出回声消除后的声音信号；h为大于或者等于2的整数。本方案对于以f位采样点数据组织的信号，以h个采样点数据为一组进行并行处理，缩短了对声音信号进行处理所需要的时长，能够有效的提高回声消除的效率，从而提高应用在低功耗芯片上进行回声消除的效果。

一种电子通信设备语音信号处理系统-201910890452.4
发明人：张华林 -专利权人：闽南师范大学
申请日： 2019-09-20 - 公布日： 2019-12-20 - 主分类号： G10L21/0208
摘要：本发明提供一种电子通信设备语音信号处理系统，包括语音采集单元和语音信号处理单元，所述语音采集单元通过采集器将电压信号按照相应的标准转换成量化的数字信号，所述语音信号处理单元包括语音信号处理和语音信号检测，语音信号处理包括带通滤波、预加重处理、分段处理和加窗处理，最后输送至LPC模块将语音信号正交变换域提取特征参数，并将其变换成数字代码进行传输，语音信号处理单元对语音采集单元的数字信号进行处理，去除语音信号内的环境带来的噪音并且简化分段语音信号，去除语音信号中无语音输出部分，提高语音数据传输效率。

一种信号处理方法和装置-201510425529.2
发明人：谷玉海 -专利权人：北京信息科技大学
申请日： 2015-07-17 - 公布日： 2019-12-17 - 主分类号： G10L21/0208
摘要：本发明公开一种信号处理方法和装置，包括：对第一信号执行自相关运算，并对自相关运算的结果执行时频变换运算，获取对应的第二信号；对第一信号执行时频变换运算，获取对应的第三信号；根据第二信号获取噪声信号对应的频率信息；根据噪声信号对应的频率信息，对第三信号中噪声信号对应的频率分量进行滤除操作，并得到滤除噪声之后的第四信号；对第四信号执行时频变换运算对应的频时变换运算，从而获取第一信号对应的滤除噪声信号之后的第五信号。该信号处理方法和装置对以周期成分为主的数字信号具有较好的去噪效果，尤其是在等转速条件下采集的振动信号，对于其他的以周期信号为主的数字信号也具有很好的消噪效果。

一种噪音采集方法及装置-201510617578.6
发明人：刘驭云;彭信龙;吴海全;师瑞文;吴训 -专利权人：深圳市冠旭电子股份有限公司
申请日： 2015-09-24 - 公布日： 2019-12-13 - 主分类号： G10L21/0208
摘要：本发明适用于噪音采集领域，提供了一种噪音采集方法及装置，所述噪音采集方法包括：利用麦克风，采集噪音，生成噪音信号；在蓝牙芯片中嵌入噪音采集通路；利用所述噪音采集通路，传递所述噪音信号至所述蓝牙芯片内置的数字信号处理器。本发明通过利用现有蓝牙的可编程特性建立噪声采样通道并结合内部DSP计算性能达到较高还原度的噪声采样，节省了外挂数字信号处理器的成本及开发费用，同时又具备足够的灵活性，可以根据不同需求进行不同的设计，提高了蓝牙芯片的智能程度。

一种回声消除的非线性处理方法和装置及电子设备-201510259927.1
发明人：苏环宇;邓滨 -专利权人：广州质音通讯技术有限公司
申请日： 2015-05-20 - 公布日： 2019-12-13 - 主分类号： G10L21/0208
摘要：本发明提供一种回声消除的非线性处理方法和装置及电子设备。该方法包括：自播放下行语音信号之后，将混合上行信号与预估回声信号进行能量比较；根据能量比较结果从所述混合上行信号中去除回声。本发明实施例提供的回声消除的非线性处理方法和装置及电子设备，通过判断正常语音信号和预估回声信号的能量对比，能够对线性处理之后的残余回声进行有效消除。并且，对前端的线性处理复杂度要求低，从而降低了整个回声消除系统的复杂度和实现成本，降低了对设备处理能力的依赖。

一种回声抑制方法及装置、存储介质、电子设备-201810495504.3
发明人：周舒然;李志飞 -专利权人：出门问问信息科技有限公司
申请日： 2018-05-22 - 公布日： 2019-12-10 - 主分类号： G10L21/0208
摘要：本发明提供了一种回声抑制方法及装置、存储介质、电子设备，该回声抑制方法包括：获取近端信号和参考信号；利用预设的第一滤波器和第二滤波器，得到所述参考信号对应的第一估计回声信号和第二估计回声信号；利用所述第一估计回声信号、第二估计回声信号以及所述近端信号进行回声抑制处理。因此，本发明提供的方案可以提高回声抑制效率。

一种利用CNN的SE-ED网络进行远场语音去混响的方法-201910921234.2
发明人：李楠;関博史 -专利权人：慧言科技(天津)有限公司
申请日： 2019-09-27 - 公布日： 2019-12-06 - 主分类号： G10L21/0208
摘要：本发明涉及语音信号处理技术领域，针对远场情况下混响比较大从而引起语音识别的识别准确率严重下降的情况，提出了一种利用CNN的SE‑ED网络进行语音去混响的方法。技术方案以2014年的REVERB Challenge数据集作为处理对象，主要涉及以下几个方面：1)对该数据集中的含混响的语音和与其对应的不含混响的语音进行特征提取；2)针对所提取的特征进行从含混响的语音特征到不含混响语音特征映射；3)将通过所提出的网络框架所增强后的特征进行声学模型训练及其解码。本发明通过控制scale的大小，把语音中重要的特征增强，不重要的特征减弱，从而让提取的语音特征指向性更强，达到了方案的预期结果，从而使得复杂场景下的远场语音识别性能得到了很好的提升。

一种WebRTC噪声抑制算法的智能语音交互系统及方法-201910792170.0
发明人：鲁霖;曾宗云 -专利权人：厦门市思芯微科技有限公司
申请日： 2019-08-26 - 公布日： 2019-12-03 - 主分类号： G10L21/0208
摘要：本发明属于音频信号在线处理技术领域，尤其涉及一种WebRTC噪声抑制算法的智能语音交互系统及方法，具体包括移动数据终端、蓝牙智能设备和云端服务器；移动数据终端包括SPP/BLE数据传输单元、网络传输单元，安装有运行WebRTC噪声抑制算法的语音交互APP；蓝牙智能设备包括MIC、喇叭、A2DP通道和SPP/BLE数据传输模块；云端服务器包括网络传输模块和语音识别模块；蓝牙智能设备采集音频数据，移动数据终端通过运行WebRTC噪声抑制算法的语音交互APP处理采集获得的音频数据，并提交云端服务器识别。有益效果：通过采集环境噪声并提取噪声特征结合WebRTC噪声抑制算法进行蓝牙语音音频数据降噪，实现语音交互模式下的主动降噪且满足实时性。

一种抑制竞争性噪声的实时语音增强系统及方法-201910857922.7
发明人：宫琴 -专利权人：清华大学无锡应用技术研究院;北京清耳华聪科技有限公司
申请日： 2019-09-11 - 公布日： 2019-12-03 - 主分类号： G10L21/0208
摘要：本发明涉及一种抑制竞争性噪声的实时语音增强系统及方法，该系统包括双麦克风阵列模块，用于采集各种声源信号；音频模块，用于将采集的声源信号进行模数转换；处理器模块，用于通过信号输入接口获取所述音频模块传送的数据进行实时处理，并通过输出接口发送控制信号到所述音频模块，使所述音频模块输出实时处理过的音频信号。本发明包含了一种通过提取麦克风阵列的延迟参数，计算带噪信号的掩蔽权重的语音增强算法，可以应用于多人交谈的场合，抑制与目标源处于不同方位的竞争性语音噪声。

一种语音信号处理方法及装置-201610802804.2
发明人：王乐临;李玉龙;郑成诗;厉剑 -专利权人：华为技术有限公司
申请日： 2016-09-05 - 公布日： 2019-11-29 - 主分类号： G10L21/0208
摘要：本发明实施例公开了一种语音信号处理方法及装置，涉及信号处理技术领域，可以准确进行目标语音角度的估计，从而有效增强目标语音，并衰减或屏蔽其他方向的噪声和干扰信号。具体方案为：确定出与至少三个传声器对应的至少三个波束；通过至少两个传声器组合，确定当前声场中目标声源的入射角，并计算目标声源的入射角与至少三个波束中每个波束的中心角的角度偏差；根据目标声源的入射角与至少三个波束中每个波束的中心角的角度偏差，计算每个波束的保护角增益，并根据至少三个波束中每个波束的保护角增益，计算语音信号的多波束加权增益，并对至少三个传声器采集的语音信号进行加权输出。本发明用于语音信号的处理过程中。

用于语音处理的基于神经网络的时频掩模估计和波束形成-201910314382.8
发明人：亚当·库普里亚诺;库巴·洛帕特卡 -专利权人：英特尔公司
申请日： 2019-04-18 - 公布日： 2019-11-26 - 主分类号： G10L21/0208
摘要：本公开涉及用于语音处理的基于神经网络的时频掩模估计和波束形成。提供了用于语音信号的预处理增强的技术。根据实施例的实现这种技术的方法包括：对从麦克风阵列接收到的信号执行去混响处理，所述信号包括语音和噪声。该方法还包括：生成每个信号的时频掩模(TFM)。TFM指示与TFM元素相关联的信号的时频分量包括语音的概率。TFM的生成是基于向信号应用递归神经网络。该方法还包括：基于语音协方差矩阵和噪声协方差矩阵生成导向矢量。TFM被用来对信号的语音分量进行滤波以用于计算语音协方差，并且对信号的噪声分量进行滤波以用于计算噪声协方差。该方法还包括：基于导向矢量对信号执行波束形成，以生成增强语音信号。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于改进GAN网络的语音去噪方法、装置、设备及介质有效

专利文献下载