[发明专利]回声消除方法和装置、存储介质、电子设备在审

专利信息
申请号: 201910377077.3 申请日: 2019-05-07
公开(公告)号: CN111916100A 公开(公告)日: 2020-11-10
发明(设计)人: 胡玉祥 申请(专利权)人: 北京地平线机器人技术研发有限公司
主分类号: G10L21/0216 分类号: G10L21/0216
代理公司: 北京思源智汇知识产权代理有限公司 11657 代理人: 王晓多
地址: 100080 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开实施例公开了一种回声消除方法和装置、存储介质、电子设备,其中,方法包括:确定当前时刻扬声器系统输入的激励电压值,并确定当前时刻扬声器系统中的系统参数值;基于激励电压值和所述系统参数值,确定扬声器系统发出的声压信号值;基于声压信号值消除扬声器系统在当前时刻的回声,本公开实施例提供的回声消除方法在不增加硬件的前提下,使用系统集总参数模型实时估计经过非线性畸变后的声压信号值,以声压信号值作为参考信号,有效提升了对扬声器非线性畸变的处理能力。
搜索关键词: 回声 消除 方法 装置 存储 介质 电子设备
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910377077.3/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于改进谱减法的语音去噪方法-202310837044.9
  • 尹宏鹏;唐丹;秦岩;蒋炜杰;易旻晗 - 重庆大学
  • 2023-07-10 - 2023-10-27 - G10L21/0216
  • 本发明公开了一种基于改进谱减法的语音去噪方法,包括以下步骤:输入带噪语音,对带噪语音的信号进行预处理,将信号从时域维度转换到帧维度;采用傅里叶变换,获取信号全段频谱;逐帧计算人声所在子频带的频谱能量占比;生成语音屏蔽掩码,估计噪声;根据调节因子划分语音浊音、语音清音和噪声;对语音浊音、语音清音、噪声进行谱减后权重修正。本发明一种基于改进谱减法的语音去噪方法,能够实时的、有效的抑制平稳和非平稳噪声,显著提升语音信噪比,同时能够保证语音信号有效部分不受前端去噪带来的失真影响,适用于各语音任务下系统的前端去噪,提升系统处理速率及性能。
  • 音频数据处理方法、装置、设备和存储介质-202310118721.1
  • 余剑威;罗艺 - 腾讯科技(深圳)有限公司
  • 2023-01-31 - 2023-10-27 - G10L21/0216
  • 本公开的实施例提供了一种音频数据处理方法、装置、设备和计算机可读存储介质。本公开的实施例所提供的方法通过对基于待处理的输入音频信号所获得的时频特征进行频带分割,并确定经分割得到的每个频带中的目标分量的时频掩码,来基于所获得的时频特征和所确定的时频掩码生成输出音频信号,从而实现对音频信号关于目标分量的语音增强。通过本公开的实施例所提供的方法能够通过频带分割来利用单个模型对具有不同采样率的音频信号进行语音增强,并且该单个模型的计算复杂度可以根据输入音频信号的采样率而自适应地调整,使得该方法可以在不改变模型的情况下广泛适用于各种采样率的音频信号,避免了额外的模型训练和存储开销。
  • 一种数据处理方法、装置、设备以及存储介质-202310092402.8
  • 邹欢彬;李志成;赵军 - 腾讯科技(深圳)有限公司
  • 2023-01-16 - 2023-10-27 - G10L21/0216
  • 本申请实施例提供了一种数据处理方法、装置、设备以及存储介质,用于实现对音频数据中的语音数据和噪声数据进行分别识别,从而提高音频数据的优化效果。包括:获取待处理音频数据;按照第一处理方式对待处理音频数据进行预处理得到频域表征;将频域表征输入预测模型的至少两个支路得到至少两个掩码估计值,预测模型包括至少两个支路以及至少一个交互网络结构,至少两个支路由至少一个交互网络结构连接;按照第二处理方法对至少两个掩码估计值与频域表征进行处理得到至少两个声源信息对应的至少两个音频信号估计值。本申请提供的技术方案可应用于计算机技术、人工智能、云技术等领域。
  • 语音活动检测方法、系统、语音增强方法以及系统-202180095487.4
  • 肖乐;张承乾;廖风云;齐心 - 深圳市韶音科技有限公司
  • 2021-11-11 - 2023-10-27 - G10L21/0216
  • 本说明书提供的语音活动检测方法、系统、语音增强方法以及系统中,麦克风阵列输出的麦克风信号满足噪声信号对应的第一模型或目标语音信号与所述噪声信号混合对应的第二模型。所述方法和系统可以以似然函数最大化以及噪声协方差矩阵的秩最小化为联合优化目标,分别对第一模型以及第二模型进行优化,确定所述第一模型的噪声协方差矩阵的第一估计值以及第二模型的噪声协方差矩阵的第二估计值,并通过统计假设检验的方法判断麦克风信号满足第一模型还是第二模型,从而确定麦克风信号中是否存在目标语音信号,并确定麦克风信号的噪声协方差矩阵,进而对麦克风信号进行语音增强。所述方法和系统可以使噪声协方差估计精度,进而提高语音增强效果。
  • 音频信号处理方法和装置-202011194355.0
  • 倪忠 - 维沃移动通信有限公司
  • 2020-10-30 - 2023-10-27 - G10L21/0216
  • 本申请公开了一种音频信号处理方法和装置,属于通信技术领域。该方法包括:获取麦克风采集的第一音频信号和发送的第二音频信号,确定第一音频信号的强度不低于对应的强度阈值的待复检麦克风,并确定待复检麦克风的回声路径,在待复检麦克风中包括回声路径不符合预设条件的麦克风的情况下,对回声路径符合预设条件的麦克风采集到的第一音频信号进行处理,得到目标音频信号。在音频信号处理过程中,在第一次堵麦检测之后,根据麦克风回声路径的变化,对多个检测正常的麦克风进行第二次堵麦检测,可以避免在堵麦检测错误时,使用异常的音频信号,从而可以提高目标音频信号的质量。
  • 一种面向智能车机抗副驾干扰的语音识别方法-202310760521.6
  • 明杨;赵亚丽;缪炜 - 上海互问信息科技有限公司
  • 2023-06-27 - 2023-10-24 - G10L21/0216
  • 本发明涉及一种面向智能车机抗副驾干扰的语音识别方法,包括以下步骤:步骤一、将N个麦克风传感器以固定间距d沿水平方向均匀排列在车机中央底部或顶部,N为大于等于2的整数,以此构成多通道语音采集设备;步骤二、将采集到的多通道音频数据经傅里叶变换后逐帧输入训练好的二分类DOA模型,输出结果为“1”或“0”。该面向智能车机抗副驾干扰的语音识别方法,根据主副驾相对车机的大致方位固定,但主驾的精确导向矢量很难获得的实际情况,通过二分类模型分别获得主副驾MASK进而计算出主驾的精确导向矢量,解决基于MASK的波束形成方法很难区分两个人声的问题,从而改善在智能车机这种特定场景下的语音交互问题。
  • 一种基于逐级幅度补偿网络的单通道语音增强方法-202310969308.6
  • 叶中付;陈雯卓 - 中国科学技术大学
  • 2023-08-01 - 2023-10-20 - G10L21/0216
  • 本发明涉及一种基于逐级幅度补偿网络的单通道语音增强方法,采用一种基于编码器‑解码器的三分支结构,分别为幅度谱估计支路、复数谱细化支路和时域波形校正支路。利用幅度谱估计支路滤除主要的噪声成分,复数谱细化支路补绘缺失的细节,隐式估计相位信息的基础上,利用时域波形对两个支路进行校正。为了充分利用三个支路的信息,在本发明中,提出跨域信息融合模块,并嵌入到三个分支中,逐步提取和融合三个分支的特征,对幅度谱估计支路和复数谱细化支路的信息进行校正和幅度补偿。本发明能够有效地弥补幅度和相位之间的隐含补偿效果,提高语音信号的质量和可理解性,优于目前最先进的跨域语音增强方法和以往的先进系统。
  • 实时语音流降噪方法、装置、计算机设备及存储介质-202311088355.6
  • 陈锷;欧俊健 - 广州市睿翔通信科技有限公司
  • 2023-08-25 - 2023-10-20 - G10L21/0216
  • 本申请实施例属于人工智能技术领域,涉及一种实时语音流降噪方法、装置、计算机设备及存储介质,方法包括:采集场景语音流,以确定场景标识;采集待处理语音流;获取待处理语音流的实时声谱图矩阵,并获取场景标识所对应的噪声声谱图矩阵;将实时声谱图矩阵和噪声声谱图矩阵输入训练完毕的降噪模型,并由降噪模型中的扩散模型根据噪声声谱图矩阵,对实时声谱图矩阵进行生成处理,得到第一声谱图矩阵,降噪模型包括扩散模型和变分自编码器;将第一声谱图矩阵输入变分自编码器进行数据重构,得到第二声谱图矩阵;根据第二声谱图矩阵进行语音合成,并将合成得到的语音作为待处理语音流对应的已降噪语音流。本申请提高了实时语音流降噪的准确性。
  • 一种深度学习优化波束特性的麦克风阵列语音增强方法-202310788499.6
  • 童峰;张家扬;何伟;周跃海;陈东升 - 厦门大学
  • 2023-06-30 - 2023-10-17 - G10L21/0216
  • 本申请提供了一种深度学习优化波束特性的麦克风阵列语音增强方法,包括模型训练阶段和语音增强阶段,其中,模型训练阶段基于第一带噪双通道语音信号、传统的固定波束形成算法获取的FB系数、受权重控制的单通道纯净语音信号的STFT特征值获取语音增强模型;语音增强阶段将第二带噪双通道语音信号和通过所述语音增强模型优化输出后的FB系数卷积,并加权求和得到波束形成增强后的语音信号。通过引入深度学习网络进行麦克风阵列波束特性优化,取得了优于传统方法的波束指向特性,同时支持低复杂度工程化实现。
  • 一种用于语音鼠标的降噪系统-202310811988.9
  • 卢宇;冯海洪;毛德平 - 安徽咪鼠科技有限公司
  • 2023-07-04 - 2023-10-10 - G10L21/0216
  • 本发明公开了一种用于语音鼠标的降噪系统,涉及音频降噪技术领域,解决了语音鼠标识别准确率低的技术问题;通过语音采集模块用于采集语音信号;并将语音信号发送至语音降噪模块;语音降噪模块分别对第一语音信号和第二语音信号进行降噪处理,获取第一干净语音信号和第二干净语音信号;第一干净语音信号和第二干净语音信号合成,获取干净语音信号;对语音信号进行降噪处理,可以在与数据通信中降低数据的通信量,保证数据的完整性;根据AGC算法对干净语音信号进行补偿,当用户人声超过采集限度的时候反向增益,防止音频失真,从而提高音频的保真性与准确性。
  • 基于干扰噪声空间谱矩阵的语音信号波束成形方法-202211565066.6
  • 肖永雄;宛敏红;宋伟;朱世强;顾建军 - 之江实验室
  • 2022-12-07 - 2023-10-03 - G10L21/0216
  • 本发明公开了一种基于干扰噪声空间谱矩阵的语音信号波束成形方法与装置。本发明基于麦克风阵列流形矢量计算球面扩散噪声的空间谱矩阵;在麦克风没有检测到语音信号时,计算背景噪声的空间谱矩阵;在麦克风检测到语音信号后,计算信号空间谱矩阵;基于麦克风阵列流形矢量和信号空间谱矩阵对Capon空间谱进行积分,计算干扰语音信号的空间谱矩阵;球面扩散噪声的空间谱矩阵、背景噪声的空间谱矩阵、干扰语音信号的空间谱矩阵叠加得到干扰噪声空间谱矩阵;对干扰噪声空间谱矩阵进行特征值分解,获取特征向量和噪声功率估计值,并以此更新干扰噪声空间谱矩阵;并结合线性约束最小方差波束形成得到波束增强的语音信号。
  • 一种基于音频推送的音质优化方法及系统-202310731601.9
  • 黄汉贵;赵定金;张常华;明德 - 广东保伦电子股份有限公司
  • 2023-06-19 - 2023-09-29 - G10L21/0216
  • 本发明公开了一种基于音频推送的音质优化方法及系统,包括:接收第一电子设备发送的第一录音音频,并根据预设的标准音频获取方式获得所述第一电子设备当前的登录用户对应的第一标准音频,根据所述第一标准音频对预设的深度学习模型进行训练,生成训练后的降噪模型,根据所述降噪模型对所述第一录音音频进行降噪处理,获得降噪处理后的第二录音音频,并将所述第二录音音频推送到第一播放设备以使播放所述第二录音音频,解决现有技术中音频存在噪音的技术问题,进而提高音频的音质。
  • 声音信号处理系统及方法-202011318379.2
  • 波温·路 - 新唐科技股份有限公司
  • 2020-11-23 - 2023-09-29 - G10L21/0216
  • 本发明提供一种声音信号处理系统及方法,该系统包含输入模块、相位差模块、延迟分布模块,以及配置以基于延迟分布进行最终延迟估计的延迟估计模块。最终延迟估计施加以对两个选定的通道中的一个进行对准,并组合两个通道以获得感兴趣信号。相位差模块计算频格的一定范围的相位差。延迟估计模块考虑了从相位差得出的所有可能的延迟,包含±2π的倍数,其克服当两个声音感测器之间的间隔大于波长的一半时高频格中的模糊。
  • 一种麦克风阵列的拾音方法、电子设备及存储介质-202110556564.3
  • 蔡野锋;叶超;马登永;沐永生 - 中科上声(苏州)电子有限公司
  • 2021-05-21 - 2023-09-29 - G10L21/0216
  • 本发明公开了一种麦克风阵列的拾音方法、电子设备及计算机可读存储介质。该拾音方法包括如下步骤:对麦克风阵列接收的语音信号进行固定波束形成,将麦克风阵列的波束形成方向指向估计的预期波达方向;对处理后的语音信号进行阻塞处理,以阻塞来自预期波达方向的语音信号,只保留非预期波达方向的语音信号;以处理后的信号作为参考信号,通过第一滤波器滤除非预期波达方向的信号,保留预期波达方向的信号;根据下式(I)计算第一滤波器的更新因子,#imgabs0##imgabs1#为第m个麦克风通道的第一滤波器的更新因子,SNRf,d(ω,l)为Yf,d(ω,l)的信噪比,Yf,d(ω,l)为步骤S1处理后的信号经延迟处理后的延迟信号,SNRm(ω,l)为步骤S2处理后的信号Um(ω,l)的信噪比。本发明进一步提高语音质量。
  • 声音信号处理方法、装置和电子设备-202011462091.2
  • 范文之;孔凡留;徐杨飞;张志飞 - 北京有竹居网络技术有限公司
  • 2020-12-08 - 2023-09-29 - G10L21/0216
  • 本公开实施例公开了声音信号处理方法、装置和电子设备。该方法的一具体实施方式包括:将第一音频数据对应的第一频谱数据,导入预先训练的声音处理模型,得到处理结果;基于该处理结果,生成第一音频数据对应的纯净音频数据;声音处理模型包括至少一个预设卷积层,在预设卷积层执行的操作包括:基于第一卷积核组,对输入预设卷积层的对应第一声谱特征图进行卷积操作,得到第二声谱特征图;基于第二卷积核组,对得到的第二声谱特征图进行合并,得到与第二卷积核组对应的第三声谱特征图。由此,可以提供新的声音信号处理方式。
  • 噪声估计方法、装置、介质和设备-202310837082.4
  • 李强;叶东翔;朱勇 - 深圳百瑞互联技术有限公司
  • 2023-07-10 - 2023-09-19 - G10L21/0216
  • 本申请公开了一种噪声估计方法、装置、介质和设备,属于蓝牙音频编解码技术领域。该方法主要包括:利用编码过程中的带宽检测模块,判断语音信号是否已完成降噪处理;在语音信号未完成降噪处理时,利用气导语音信号计算得到语音信号中是否存在音频信号的第一语音概率;根据骨导语音信号的幅度谱,判断语音信号是否为纯噪声帧,并在语音信号为非纯噪声帧时,根据骨导语音信号的幅度谱,修正第一语音概率,得到第二语音概率;根据气导语音信号的长期后置滤波处理后的参数和气导语音信号的幅度谱,对第二语音概率进行修正,得到第三语音概率。本申请在不增加算法延迟的条件下,能够准确的进行噪声估计,进而能够提高音频的音质。
  • 一种基于子带信噪比估计的低复杂度双端检测方法-201910601964.4
  • 王青云;梁瑞宇;姜涛;唐闺臣;包永强 - 南京工程学院
  • 2019-07-05 - 2023-09-19 - G10L21/0216
  • 本发明公开了一种基于子带信噪比估计的低复杂度双端检测方法,包括以下步骤。首先将一帧信号通过分解滤波器得到子带信号,并进行降采样处理;其次在每个子带信号的每帧内找最大值,再将其转到对数域,得到阶梯包络;然后分别估计语音包络和噪声包络,得到当前帧的信噪比估计值;最后将子带信噪比映射为双端判决阈值,将自适应判决阈值应用到相关性判决因子上。使系统进入双讲状态时,及时冻结自适应滤波器的更新步长。本发明在复杂的噪声环境下,能有效提高回声抵消器的双端检测的准确率,在音频会议系统中具有良好的应用前景。
  • 一种声音信号的处理方法、装置及设备-201910577192.5
  • 杨晓霞;刘溪 - 大众问问(北京)信息科技有限公司
  • 2019-06-28 - 2023-09-15 - G10L21/0216
  • 本发明实施例公开了一种声音信号的处理方法、装置及设备,该方法包括:将声音信号的能量值控制在小于预设阈值的情况下,通过优化求解得到差分麦克风阵列算法中的计算参数;利用声源方向对应的差分麦克风阵列算法参数,对获取到的多路声音信号进行处理,得到指向声源方向的声音信号;可见,本方案中,第一方面,对声源方向进行信号增强处理,降低了干扰信号的影响;第二方面,现有的差分麦克风阵列算法存在对低频声音信号进行放大的技术问题,而本方案中,将声音信号的能量值控制在小于预设阈值的情况下,求解得到差分麦克风阵列算法中的计算参数,利用该计算参数处理声音信号,解决了这一技术问题。
  • 一种强噪环境下的麦克风阵列波束自适应处理方法-202310720246.5
  • 刘建洪;朱训魏;陈洁 - 长沙东玛克信息科技有限公司
  • 2023-06-16 - 2023-09-12 - G10L21/0216
  • 本发明涉及自适应波束处理的技术领域,揭露了一种强噪环境下的麦克风阵列波束自适应处理方法,所述方法包括:对采样协方差矩阵进行特征分解并构造特征值曲线,确定特征值曲线拐点;将特征分解结果区分为信号子空间和强噪声信号子空间;根据声源信号以及干扰信号的入射角度和功率重构采样协方差矩阵,计算得到波束自适应处理权重;利用波束自适应处理权重进行自适应波束处理。本发明通过结合信号子空间投影对声源信号导向向量进行噪声干扰消除,结合期望入射角度的导向向量对声源信号导向向量进行修正,提高了导向向量估计的准确性,并利用波束自适应处理权重对麦克风阵列信号进行加权处理,得到过滤噪声信号以及降低干扰信号影响的稳定波束。
  • 一种多麦克阵列降噪处理的方法及装置-202010346678.0
  • 董齐;陈孝良;冯大航 - 北京声智科技有限公司
  • 2020-04-28 - 2023-09-12 - G10L21/0216
  • 本发明实施例提供了一种多麦克阵列降噪处理的方法及装置,该方法包括获取多麦克阵列的m个参考信号,按照预设间隔时刻对所述多麦克阵列的m个参考信号中第i个参考信号的权重参数进行更新,得到更新后的第i个参考信号的权重参数,根据更新后的第i个参考信号的权重参数和第i个参考信号,确定出第i个参考信号的输出噪声信号,并根据m个参考信号中未更新权重参数的参考信号的权重参数和m个参考信号中未更新权重参数的参考信号确定出m个参考信号中未更新权重参数的参考信号的输出噪声信号。由于按照预设间隔时刻的方式对当前参考信号的权重参数进行更新,可以减少权重参数的更新次数,从而降低现有技术中多麦克阵列降噪算法的计算量。
  • 音频采集方法、装置及存储介质-202310954141.6
  • 美耸 - 北京小米移动软件有限公司
  • 2023-07-31 - 2023-09-05 - G10L21/0216
  • 本公开涉及一种音频采集方法、装置及存储介质,可以获取当前时刻采集的目标音源的目标图像;根据所述目标图像调整音频采集设备的聚焦参数,所述聚焦参数用于调节所述音频采集设备的聚焦方向;根据调整后的聚焦参数采集所述目标音源发出的音频信号。这样,即使目标音源与音频采集设备的相对位置发生变化,音频录制聚焦方向也可以自动指向目标音源,避免了手动调整音频采集设备的方向。
  • 拾音方法、装置、非易失性存储介质及终端设备-202210182711.X
  • 康洪涛 - 北京中创视讯科技有限公司
  • 2022-02-25 - 2023-09-05 - G10L21/0216
  • 本发明公开了一种拾音方法、装置、非易失性存储介质及终端设备。其中,该方法包括:采用包括多个麦克风的麦克风阵列采集声音信号;检测声音信号被麦克风阵列采集到时对应的目标方位角;在目标方位角位于预设角度区间内的情况下,对声音信号进行信号增强处理,得到目标声音信号。本发明解决了拾音设备无法准确区分需要增强的声音导致声音处理结果不理想的技术问题。
  • 一种提高音频信息传输效果方法及系统-202310710781.2
  • 黄达庆;罗志生;黄小根 - 广州磐钴智能科技有限公司
  • 2023-06-15 - 2023-09-05 - G10L21/0216
  • 本发明涉及音频处理技术领域,公开了一种提高音频信息传输效果方法及系统,该方法包括:通过麦克风阵列来对当前环境中各个方向的音频信息进行音频采集以得到待处理音频信息,并确定与相应待处理音频信息对应的音频方向;提取待处理音频信息中的上升沿处信号并得到待降噪音频信息;基于音频方向来确定接收到的待降噪音频信息的噪声状态,根据待降噪音频信息的噪声状态来匹配相应的音频降噪模型来降噪。本发明中提高音频信息传输效果方法通过对环境中多种不同位置进行噪声状态检测以确定对应目标音源所处具体噪声环境,进而基于特定的降噪模型来对语音信号中的噪声数据进行识别降噪处理以得到更加清晰的语音信息来进行传输,提高音频传输效果。
  • 指向可变的差分波束形成方法、装置、设备及存储介质-202310669787.X
  • 李林峰;汪杨刚;万成 - 武汉海微科技有限公司
  • 2023-06-06 - 2023-09-01 - G10L21/0216
  • 本发明属于信号处理技术领域,公开了一种指向可变的差分波束形成方法、装置、设备及存储介质。该方法包括:根据目标指向方向的余弦值与目标零点方向的余弦值,确定过渡零点方向的余弦值;根据目标指向方向的余弦值、目标零点方向的余弦值以及过渡零点方向的余弦值,确定阵列流型矩阵;根据阵列流型矩阵,确定滤波权系数;接收麦克风线阵发出的采样信号,根据滤波权系数对采样信号进行滤波,输出目标差分波束,目标差分波束的指向方向为目标指向方向,目标差分波束的零点方向为目标零点方向。通过上述方式,利用代数多项式分解方法,设计差分波束形成的权系数,使用该权系数对每个采样信号进行滤波,得到指向任意方向的差分波束。
  • 一种应用于助听器的频域双通道语音增强方法-202310554246.2
  • 李鹏;张威;李子豪;朱尚文;邵文 - 杭州爱听科技有限公司
  • 2023-05-17 - 2023-09-01 - G10L21/0216
  • 本发明提出了一种应用于助听器的频域双通道语音增强方法,在频域GSC框架上对BM部分及ANC部分进行改进,利用FBF部分输出的语音参考信号与BM部分输出的噪声参考信号的频域相关性区分语音帧与含有较多噪声成分的信号帧,以选择合适的阻塞矩阵,并在频域NLMS基础上进行改进。本发明将相关性较大的信号帧视为含有较多噪声成分的信号帧,选择较大的更新步长,加快算法收敛,反之则视为语音帧,选择较小的步长,减小算法稳态误差。通过实验,本发明输出信干比和短时客观可懂度相较于传统方法和对比方法都有一定提升,并且具有比较好的鲁棒性。
  • 基于二元麦克风阵列的语音增强方法和装置-201910255952.0
  • 耿岭;陈宇;占凯 - 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
  • 2019-04-01 - 2023-09-01 - G10L21/0216
  • 本申请实施例公开了基于二元麦克风阵列的语音增强方法和装置。该方法的一具体实施方式包括:基于二元麦克风阵列中的两个麦克风采集到的语音信号,形成目标方向的第一波束以及至少一个干扰方向的第二波束,其中,目标方向和该至少一个干扰方向是预先设定的;基于所形成的第二波束的语音信号,确定干扰信号;从第一波束的语音信号中减去干扰信号,得到增强后的语音信号。该实施方式可以在不为麦克风增加特殊音腔结构以及不增加麦克风阵元个数的情况下,实现对目标方向的语音信号的增强。
  • 一种滤除机器学习语音增强后的残留噪声的方法及装置-202011207590.7
  • 项京朋;邱锋海;王之禹 - 北京声加科技有限公司
  • 2020-11-03 - 2023-09-01 - G10L21/0216
  • 本申请实施例公开了一种滤除机器学习语音增强后的残留噪声的方法及装置,方法包括:根据原始带噪语音信号,确定所述原始带噪语音信号中干净语音信号的后验存在概率;根据所述后验存在概率,确定第一语音信号中的残留噪声信号的功率谱;其中,所述第一语音信号通过神经网络对所述原始带噪语音信号进行增强得到;根据所述残留噪声信号的功率谱,确定所述第一语音信号的增益函数;根据所述增益函数,滤除所述第一语音信号中的残留噪声信号。本申请实施例通过更加准确地估计干净语音信号的后验存在概率,从而更为准确地估计残留噪声信号的功率谱,因此能够更有效地滤除残留噪声信号。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top