[发明专利]基于半盲源分离的非线性声学回声消除方法在审

专利信息
申请号: 202110080038.4 申请日: 2021-01-21
公开(公告)号: CN112927706A 公开(公告)日: 2021-06-08
发明(设计)人: 程国良;卢晶 申请(专利权)人: 南京大学
主分类号: G10L21/0208 分类号: G10L21/0208;G10L21/0216
代理公司: 江苏法德东恒律师事务所 32305 代理人: 李媛媛
地址: 210046 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于半盲源分离的非线性声学回声消除方法。该方法包括以下步骤:(1)利用已知的远端输入信号获取含有非线性回声的麦克风信号;(2)对远端输入信号的非线性映射进行基函数展开,将未知的非线性展开系数合并到回声路径中;(3)将远端输入信号的基函数形式看作已知的参考信号,并与麦克风信号合并为向量形式;(4)利用短时傅里叶变换得到时频域信号;(5)采用带约束的缩放自然梯度独立向量分析实现在线半盲源分离算法,估计分离矩阵并分离出近端时频域信号;(6)通过短时傅里叶逆变换得到时域的近端信号。本发明的方法能在非线性模型与实际模型存在偏差的实际应用中获得更好的非线性回声消除性能。
搜索关键词: 基于 半盲源 分离 非线性 声学 回声 消除 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202110080038.4/,转载请声明来源钻瓜专利网。

同类专利
  • 语音增强方法、语音增强网络的训练方法及电子设备-202311044108.6
  • 邹欢彬 - 腾讯科技(深圳)有限公司
  • 2023-08-17 - 2023-10-27 - G10L21/0208
  • 本申请实施例公开了一种语音增强方法、语音增强网络的训练方法及电子设备,通过对各个增强语音帧的语音有效性进行分类,根据各个增强语音帧的分类结果生成样本增强语音的有效性分布特征,通过有效性分布特征确定语音增强网络的有效性损失,衡量各个增强语音帧的语音有效性相较于降噪前的变化程度,在此基础上,再根据转换损失和有效性损失确定目标损失,能够着重提升语音增强网络对非语音段的噪声抑制能力,在基于训练后的语音增强网络对待处理语音进行降噪时,对于包含非语音段的待处理语音,训练后的语音增强网络能够有效减少出现噪声残留的现象,提升语音增强的质量,可广泛应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。
  • 主动降噪方法、装置、设备及存储介质-202311215912.6
  • 李林峰;汪杨刚;万成 - 武汉海微科技有限公司
  • 2023-09-20 - 2023-10-27 - G10L21/0208
  • 本发明公开了一种主动降噪方法、装置、设备及存储介质,该方法包括:根据虚拟传声器与物理传声器进行FxLMS算法降噪训练,得到目标辅助滤波器;将扬声器输出信号通过物理传声器次级路径传输至物理传声器,得到物理传声器误差信号;根据目标辅助滤波器和物理传声器误差信号进行降噪,得到降噪后的物理传声器初级噪声信号;若降噪后的物理传声器初级噪声信号达到预设值,则判定对虚拟传声器处的噪声降噪完成。本发明通过降噪训练得到目标辅助滤波器并对物理传声器进行降噪,从而实现虚拟传声器处的降噪,解决现有降噪方法容易受到传递路径变化的影响,实际效果不佳的问题,实现对噪声的稳定控制,在座舱等复杂环境中有着良好的效果。
  • 基于binder的软回路动态消回声方法及移动终端-202010826798.0
  • 孟海龙;王刚;李彬;赵辉宏 - 齐鲁工业大学
  • 2020-08-17 - 2023-10-27 - G10L21/0208
  • 本申请公开了基于binder的软回路动态消回声方法及移动终端,移动终端的android操作系统的多媒体服务MediaServer播放音频;扬声器对音频进行播放,麦克风接收混合音频流,混合音频流包括:播放的音频和唤醒语音;android操作系统native层的binder client获取扬声器的音频流,并将获取的音频流送入native层的binder server;binder client获取麦克风的混合音频流,并将获取的混合音频流送入binder server;binder server将接收到的扬声器的音频流和麦克风的混合音频流,基于消除回声算法进行处理,将处理后的音频送入java层。
  • 回声消除方法、装置及存储介质-202010700907.4
  • 马路;赵培;苏腾荣 - 海尔优家智能科技(北京)有限公司
  • 2020-07-17 - 2023-10-27 - G10L21/0208
  • 本发明提供了一种回声消除方法、装置及存储介质,该方法包括:基于远端信号,通过非线性滤波器得到预测回声信号,其中,所述非线性滤波器基于神经网络构建,且所述非线性滤波器基于所述神经网络对所述远端信号进行前向计算的过程中,基于非线性函数对所述前向计算中各节点的加权求和结果进行非线性处理;根据所述预测回声信号对麦克风输入的近端信号进行回声消除。通过本发明,解决了采用线性滤波结合非线性处理来实现回声消除的方案中,非线性回声抑制效果不佳、处理复杂度高的问题,提高了对非线性回声的估计精度,进而提高回声消除的效果。
  • 混音控制方法、装置、设备及存储介质-202310871128.4
  • 尹建朋;刘广升;朱宗霞;吴劼;黄若舟;周宇;谢荣良;赵玉萍 - 歌尔科技有限公司
  • 2023-07-14 - 2023-10-24 - G10L21/0208
  • 本发明涉及智能头盔技术领域,公开了一种混音控制方法、装置、设备及存储介质,所述方法包括:获取当前噪声数据,在所述当前噪声数据的分贝值大于预设分贝阈值时,对噪声监测设备的增益进行降低;通过降低增益后的噪声监测设备获取目标噪声数据;对所述目标噪声数据和当前人声数据进行混音,得到目标混音数据;通过上述方式,在获取到当前噪声数据后,判断当前噪声数据的分贝值是否大于预设分贝阈值,若是,则降低噪声监测设备的增益,然后利用调整增益后的噪声监测设备实时获取目标噪声数据,然后对目标噪声数据和当前人声数据进行混音,从而能够得到更加清晰的人声,进而提高用户的体验感。
  • 一种音频系统及回音消除方法-202310740602.X
  • 陈启升;王继尧;欧阳楠 - 深圳市飞易通科技有限公司
  • 2023-06-20 - 2023-10-24 - G10L21/0208
  • 本发明涉及一种音频系统及回音消除方法,包括:远端音频输入通路、音频播放单元、音频处理单元、拾音单元、声道数据分离单元以及消回音模块,其中,音频处理单元包括第一和第二声道输入端;远端音频输入通路转换远端音频为第一模拟音频信号,输出至音频播放单元和音频处理单元的第一声道输入端;拾音单元生成第二模拟音频信号并传输至音频处理单元的第二声道输入端;音频处理单元根据第一和第二模拟音频信号生成数字音频并输出至声道数据分离单元;声道数据分离单元解析数字音频,得到对应的参考信号和输入信号;消回音模块根据参考信号对输入信号滤波输出目标音频数据。实施本发明能优化参考信号的获取过程,大幅改善消回音的稳定性和性能。
  • 音频合成方法、装置及车辆-202310886168.6
  • 周岭松 - 小米汽车科技有限公司;北京小米松果电子有限公司
  • 2023-07-18 - 2023-10-24 - G10L21/0208
  • 本公开是关于一种音频合成方法、装置及车辆,属于声音处理技术领域。该方法包括:获取车辆状态信息,基于车辆状态信息,确定待合成音频包括的多阶谐波频率和每个谐波频率上的第一谐波幅度;采集初始环境声音,并对初始环境声音进行去噪处理,确定每个谐波频率对应的校正因子;基于多阶谐波频率、每个谐波频率上的第一谐波幅度和校正因子进行音频合成,得到合成的目标音频;对目标音频进行播放。由此,本方案基于车辆状态信息,确定多阶谐波频率和第一谐波幅度,并基于采集的初始环境声音确定校正因子。进而进行音频合成,得到合成的目标音频,通过对目标音频进行播放,可以保障电动汽车的驾驶体验,提高车辆在行驶过程中的安全性。
  • 一种低资源多通道回声抑制方法、装置、电子设备和介质-202310926308.8
  • 关海欣;马金龙;谭小彬;梁家恩 - 云知声智能科技股份有限公司
  • 2023-07-26 - 2023-10-24 - G10L21/0208
  • 本发明涉及一种低资源多通道回声抑制方法、装置、电子设备和介质,该方法包括:获取多通道麦克风信号与多通道参考信号;将多通道麦克风信号与多通道参考信号送入线性滤波器得到多通道中每个通道的线性滤波后信号;将多通道参考信号送入Combine模块中得到参考信号;将第一通道的线性滤波后信号与参考信号合并后送入模型中得到估计的第一通道的干净信号;根据估计的第一通道的干净信号和第一通道的线性滤波后信号确定频谱增益系数;将系数复用到多通道中除第一通道外的其他通道确定多通道中除第一通道外的其他通道的干净信号。本发明通过合并回声通道,计算一个麦克风通道的处理结果,然后计算频谱掩码复用到其它通道,降低了计算量。
  • 回声的消除方法、装置、存储介质及电子装置-201910656350.6
  • 朱睿;李岳鹏;商世东 - 腾讯科技(深圳)有限公司
  • 2019-07-19 - 2023-10-24 - G10L21/0208
  • 本发明公开了一种回声的消除方法、装置、存储介质及电子装置。其中,该方法包括:获取第一设备接收到的第一音频数据;根据非线性回声特征信息估计第一音频数据所对应的非线性回声数据,并估计第一音频数据所对应的线性回声数据,其中,非线性回声特征信息用于指示第一设备所具有的非线性回声特征;获取第一设备对第一音频信号以及第二音频信号进行采集得到的第二音频数据;从第二音频数据中消除非线性回声数据和线性回声数据,得到目标音频数据;向发送第一音频数据的第二设备发送目标音频数据。本发明解决了消除回声的效率较低的技术问题。
  • 波束设计方法、装置、设备及存储介质-202011382173.6
  • 赵湘;付中华;王海坤 - 科大讯飞股份有限公司
  • 2020-11-30 - 2023-10-24 - G10L21/0208
  • 本申请公开了一种波束设计方法、装置、设备及存储介质,本申请获取待进行波束设计的目标麦克风阵列的本底噪声的声压级,基于目标麦克风阵列的本底噪声的声压级以及目标信号的声压级,确定波束的白噪声增益下限值,其中目标信号为用户期望通过目标麦克风阵列所采集的信号,至少以波束的白噪声增益不小于所述白噪声增益下限值作为波束设计的约束条件,以最大化目标麦克风阵列的指向性为目标,得到设计的波束系数。本申请将麦克风阵列的本底噪声水平作为波束设计的约束条件,使得设计的波束在指向性和白噪声增益间达到很好的平衡,最终形成的波束在限制白噪声增益不低于白噪声增益下限值的情况下,得到最大化的波束指向性。
  • 回声消除方法、装置、虚拟现实设备及存储介质-202311002180.2
  • 程志;王明;范澳生 - 歌尔科技有限公司
  • 2023-08-09 - 2023-10-20 - G10L21/0208
  • 本发明公开了一种回声消除方法、装置、虚拟现实设备及存储介质,包括:根据远端音频数据中的当前音频数据块生成频域音频数据块;根据频域音频数据块和当前滤波器权重值系数确定估计回声频域数据,当前滤波器权重值系数基于与当前音频数据块相邻的历史音频数据块确定;根据估计回声频域数据和近端音频数据中对应的音频数据生成当前音频数据块对应的回声消除音频数据。本发明通过与当前音频数据块相邻的历史音频数据块对滤波器权重值系数进行动态更新,能够动态控制滤波器的强度和响应速度,降低了回声信号对语言信号的影响,提高了虚拟现实设备语音信号的质量。
  • 回声消除模型的训练方法、装置、电子设备及介质-202211623399.X
  • 黄川 - 中移物联网有限公司;中国移动通信集团有限公司
  • 2022-12-16 - 2023-10-20 - G10L21/0208
  • 本公开提供一种回声消除模型的训练方法、装置及相关设备,涉及音视频通话技术领域,其中,所述方法包括:获取训练数据,其中,训练数据基于终端接收的混合信号生成,所述混合信号包括扬声器接收的第一信号和麦克风接收的第二信号;根据所述训练数据对多任务学习模型进行训练,得到回声消除模型,其中,所述多任务学习模型包括第一初始模型和第二初始模型,所述第一初始模型和所述第二初始模型均为深度神经网络模型,第一初始模型用于消除回声信号,第二初始模型用于判别回声是否存在。利用多任务学习和深度神经网络模型的设置,以克服背景噪声干扰以及回声传播路径的估计模型和终端硬件不匹配带来的干扰,令训练得到的回声消除模型更加可靠。
  • 多通道回声消除方法、装置、设备和存储介质-202211462700.3
  • 王冬霞;蔡浩然;韩瑜;郭庭航 - 天津职业技术师范大学(中国职业培训指导教师进修中心)
  • 2022-11-21 - 2023-10-20 - G10L21/0208
  • 本公开提出一种多通道回声消除方法、装置、设备和存储介质。其中,该方法包括根据前N帧的输入信号,利用卡尔曼滤波器,确定第一回声向量;根据所述第一回声向量,确定近端语音相关矩阵;根据所述近端语音相关矩阵,对所述卡尔曼滤波器进行更新;根据当前帧的输入信号,利用所述卡尔曼滤波器,确定第二回声向量;根据所述当前帧的输入信号和所述第二回声向量,得到当前帧的近端语音信号,以完成回声信号的消除。根据本公开实施例,能够通过卡尔曼滤波器确定回声向量,并根据回声向量修正近端语音相关矩阵,更新卡尔曼滤波器,从而减少计算复杂度,使算法更具适应性,从而进提升回声消除效果。
  • 一种语音克隆方法、系统及电子设备-202310346015.2
  • 刘刚;张硕;李健 - 暗物智能科技(广州)有限公司
  • 2023-03-31 - 2023-10-20 - G10L21/0208
  • 本说明书公开了一种语音克隆方法、系统及电子设备,能够在低资源情况下实现高保真的语音克隆与音色复刻。所述方法包括获取源音频数据与目标文本数据,所述源音频数据包括源文本以及与所述源文本相应的录制音频;对所述录制音频进行差异化降噪处理,以生成去噪音频;分别从所述源文本与所述去噪音频中提取音素特征数据与声学特征数据;基于所述音素特征数据与所述声学特征数据对克隆模型进行训练;利用训练好的所述克隆模型对所述目标文本数据进行处理,以生成与所述目标文本数据对应的目标音频。所述系统包括:数据获取单元、源音频降噪单元、特征提取单元、克隆模型训练单元、语音克隆单元。所述电子设备中的处理器用于执行所述语音克隆方法。
  • 回波检测-202111108573.2
  • 亚历山大·洛伊科;马库斯·怀尔布兰德;塞缪尔·马丁·扎克里森;伊沃·克卢森;芒·古斯塔夫·塞巴斯蒂安 乌尔贝格;丹尼尔·约翰逊;阿莱西奥·巴兹卡 - 谷歌有限责任公司
  • 2019-07-17 - 2023-10-20 - G10L21/0208
  • 本发明提供一种计算机实现的回波检测方法,当所述回波检测方法由数据处理硬件(610)执行时,使所述数据处理硬件(610)执行以下操作:接收与麦克风音频信号(132)对应的播放音频信号(112)的频率表示(324);基于所述播放音频信号(112)的所述频率表示(324)来确定特征(302),每个特征(302)对应于所述频率表示(324)的频率对(342)和所述频率对(342)之间的时间段;确定在基于所述麦克风音频信号(132)的所述频率表示(324)的第一特征(302)与基于所述播放音频信号(112)的所述频率表示(324)的第二特征(302)之间发生匹配(212);和当所述第一特征(302)和所述第二特征(302)之间的延迟值(222)满足回波阈值(224)时,确定所述麦克风音频信号(132)内存在回波,所述回波阈值(224)预测相应回波是人类可感知的。还提供一种回波检测系统(100)。
  • 一种语音处理方法-202310396582.9
  • 汪张龙;徐俊;沈毅飞;巫庭虎;邹月荣 - 广州讯飞易听说网络科技有限公司
  • 2023-04-13 - 2023-10-20 - G10L21/0208
  • 本申请适用于语音处理的技术领域,提供了提供了一种语音处理方法及处理装置、终端设备、计算机可读存储介质,包括:获取音源设备运行参数,并根据所述运行参数采集对应的噪音信号,对获取的噪声信号进行预处理,对分离噪声信号进行降噪处理以获得降噪信号,获取环境语音信号与所述音源设备运行参数,并将所述降噪信号与语音信号进行混合后获得混合信号,本方案提高了在具有特定背景噪声情景下的语音识别度,有利于语音识别技术的大规模推广与应用。
  • 回声消除方法、装置、设备和介质-202011613417.7
  • 周军民;杨晓云;李志伦 - 北京佳讯飞鸿电气股份有限公司
  • 2020-12-30 - 2023-10-20 - G10L21/0208
  • 本发明实施例公开了一种回声消除方法、装置、设备和介质。该方法包括:在实时通信过程中,通过采集线程在获取音频采集数据时,向播放线程发送同步指示信息,并将所述音频采集数据发送至回声消除线程;通过所述播放线程在接收到所述同步指示信息之后,获取音频播放数据进行播放,并将所述音频播放数据发送至所述回声消除线程;通过所述回声消除线程根据所述音频播放数据对所述音频采集数据进行回声消除处理。上述技术方案保证了采集线程与播放线程之间的数据同步,解决了音频播放和音频采集之间的时间差过大的问题,提高了音频回声消除的准确性。
  • 语音增强方法、装置、设备及介质-202011635949.0
  • 梁彧;傅强;马多佳;田野;杨满智;蔡琳;王杰;金红;陈晓光 - 恒安嘉新(北京)科技股份公司
  • 2020-12-31 - 2023-10-17 - G10L21/0208
  • 本发明实施例公开了一种语音增强方法、装置、设备及介质。该方法包括:获取目标含噪语音信号并对其进行短时傅里叶变换,得到与目标含噪语音信号对应的目标频域信号;将目标频域信号当前信号帧的目标特征输入预先训练得到的语音噪声抑制模型中的编码器中,得到与目标频域信号当前信号帧对应的编码特征;将编码特征、语音噪声抑制模型中的解码器输出的目标频域信号当前信号帧的前一个信号帧对应的解码特征,输入解码器中,得到与目标频域信号当前信号帧对应的解码特征;将与目标频域信号各个信号帧对应的解码特征进行信号重构,得到与目标含噪语音信号对应的目标增强语音信号。上述技术方案可以提高语音增强效果,减少计算时间和计算成本。
  • 基于区块链的线上诊疗及音视频数据智能优化方法和系统-202311132515.2
  • 吴晓彤 - 北京赛博日新科技有限公司
  • 2023-09-05 - 2023-10-13 - G10L21/0208
  • 本发明公开了一种基于区块链的线上诊疗及音视频数据智能优化方法和系统,涉及数据处理技术领域。该方法包括:录入医生和患者双方的身份信息;当任意一方发言时,提取对应的视频信号和音频信号;对视频信号中的每一帧图像进行检测,并进行去噪,得到优化后的视频信号;对音频信号进行去噪,得到优化后的音频信号;将优化后的视频信号和音频信号传输给另一方观看;对优化后的音频信号进行编码,得到对应音频信号的编码结果;记录并将线上就诊时间、医生身份信息、患者身份信息以及每段音频信号的编码结果上传至区块链。本发明结合多种模型,对图像、语音进行有效去噪,并对音频信号进行有效编码,大大降低占用资源;并对核心数据上链存储。
  • 一种基于信号增强的音频处理方法-202311134182.7
  • 陈灿涛 - 深圳市极客空间科技有限公司
  • 2023-09-05 - 2023-10-13 - G10L21/0208
  • 本发明涉及音频处理技术领域,尤其涉及一种基于信号增强的音频处理方法。所述方法包括以下步骤:通过音频降噪算法对音频源设备进行数据采集降噪处理,得到音频信号降噪数据;利用信号增强算法和信号特征分析技术对音频信号降噪数据进行信号增强特征分析,得到音频信号时频域特征;利用关键特征挖掘算法和音频处理技术对音频信号时频域特征进行音频信号调整处理,得到音频信号调整处理结果;利用自适应监测技术和音频信号评估技术对音频信号调整处理结果进行监测评估处理,得到音频信号评估结果;利用音频信号评估结果执行相应的音频信号播放策略。本发明通过多种算法和技术对音频信号进行增强和降噪处理,以提高音频的质量、清晰度和可听性。
  • 基于端到端深度学习语音复刻模型的嵌入向量处理方法-202310528041.7
  • 朱明;王卓越;刘浩哲;张笑源 - 华中科技大学
  • 2023-05-10 - 2023-10-13 - G10L21/0208
  • 本发明公开了一种基于端到端深度学习语音复刻模型的嵌入向量处理方法,属于基于深度学习端到端的语音处理技术领域。其中方法的实现包括:语音复刻编码器模型从话者的语音样本中提取话者嵌入向量,计算标准语音与话者语音的基频和相似度量值,选取最优的标准语音,以固定步长计算话者语音与标准语音的不同权值比,得到最优权值比,完成声音美颜的处理。以固定步长选取阈值,得到最优置零阈值后,将嵌入向量所有维度中低于置零阈值的维置零,完成小向量阈值置零处理。本发明利用嵌入向量这一工具,进行声音美颜和小向量阈值置零处理,可以显著提高生成语音的音频质量。
  • 一种时延估计系统及装置-202211380324.3
  • 刘杨;杨飞然;杨军 - 中国科学院声学研究所
  • 2022-11-03 - 2023-10-13 - G10L21/0208
  • 本发明提供了一种时延估计系统及装置,所述系统基于编码器‑时序建模结构实现,用于经过训练后计算时延估计值;所述系统包括:信号时频特征提取模块、编码器模块、时序建模模块、时延分类器和时延计算模块。本发明的优势在于:将时延估计设计问题为分类问题,通过设计训练集和标签,可以控制时延估计的精度、上限和估计误差;时延时变的训练集,能够降低时延估计的方差;进一步减小时延估计的误差和方差,并尽量避免时延过估计的现象;在长混响、大时延和双端对讲情况下,本发明的时延估计收敛时间、跟踪时间更短,过估计率更低。本发明与自适应滤波级联的系统具有更大的远端单讲回声抵消量和更好的双端对讲语音质量。
  • 一种语音增强方法、装置以及处理设备-202110852033.9
  • 李登实;赵兰馨;高雨;官端正 - 江汉大学
  • 2021-07-27 - 2023-10-13 - G10L21/0208
  • 本申请提供了一种语音增强方法、装置以及处理设备,用于实现一种语音增强机制,保障高精度的降噪处理,以具有更高的实用价值。方法包括:处理设备获取发送方发送的第一语音数据;处理设备提取第一语音数据的第一语音特征以及第一背景噪声分贝特征;处理设备采集自身所处环境的第二背景噪声分贝特征;处理设备将第一语音特征、第一背景噪声分贝特征以及第二背景噪声分贝特征输入语音特征处理模型,并得到语音特征处理模型输出的第二语音特征;处理设备根据第二语音特征,对第一语音数据进行语音增强处理,得到第二语音数据。
  • 音频处理方法及装置、模型训练方法及装置、介质和设备-202110309926.9
  • 成帅;陈功;陈丽;郝一亚 - 杭州网易智企科技有限公司
  • 2021-03-23 - 2023-10-13 - G10L21/0208
  • 本发明的实施方式提供了一种音频处理方法及装置、音频处理模型训练方法及装置、存储介质和电子设备。该音频处理方法包括:提取音频信号中的扩展巴克刻度倒谱系数和谐波相关性系数;将所述扩展巴克刻度倒谱系数和所述谐波相关性系数输入预设音频处理模型中,得到扩展巴克刻度频带增益值;根据所述扩展巴克刻度频带增益值,获取处理后频带增益值;根据所述处理后频带增益值与所述音频信号的频谱幅值,获得所述音频信号对应的处理后信号。本发明实施例的技术方案可以实现实时音频降噪。
  • 语音处理方法、装置和介质-202010508206.0
  • 王颖;李健涛;张丹;刘宝;张硕;杨天府;梁宵;荣河江;李鹏翀 - 北京搜狗智能科技有限公司
  • 2020-06-05 - 2023-10-13 - G10L21/0208
  • 本发明实施例提供了一种语音处理方法和装置、一种用于语音处理的装置,其中的方法应用于耳机收纳装置,具体包括:从耳机装置接收第一语音信号;基于所述第一语音信号,确定所述第一语音信号对应的第二语音信号;所述第二语音信号为对所述第一语音信号进行美化处理得到;所述美化处理包括:滤除所述第一语音信号中的用户噪音;所述用户噪音表征用户产生的噪音;向耳机装置发送所述第二语音信号,以使耳机装置输出所述第二语音信号;或者,耳机收纳装置对所述第二语音信号进行播放和/或展示。本发明实施例能够提高语音信号的清晰度和质量,进而帮助用户实现打动听众、增强自信的目的。
  • 回声消除方法、装置、计算机设备和存储介质-202310995773.7
  • 高毅;陈静聪;李斌;罗程 - 腾讯科技(深圳)有限公司
  • 2023-08-09 - 2023-10-13 - G10L21/0208
  • 本申请涉及一种回声消除方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取当前帧序的回声预测信号帧和残差信号帧;根据当前帧序的回声预测信号帧在多个频点处的差分功率谱,以及当前帧序的残差信号帧在多个频点处的差分功率谱,确定回声泄露系数;根据回声泄露系数对当前帧序的残差信号帧进行第二回声消除处理,得到经第二回声消除处理的残差信号帧的频谱估计数据;确定当前帧序的近端音频帧,并确定频谱估计数据与当前帧序的近端音频帧的频谱之间的频谱相关度;根据频谱相关度对经第二回声消除处理的残差信号帧进行第三回声消除处理,得到消除了回声的目标音频帧。采用本方法能够消除回声。
  • 语音处理方法、装置和介质-202010508198.X
  • 王颖;李健涛;张丹;刘宝;张硕;杨天府;梁宵;荣河江;李鹏翀 - 北京搜狗科技发展有限公司
  • 2020-06-05 - 2023-10-10 - G10L21/0208
  • 本发明实施例提供了一种语音处理方法和装置、一种用于语音处理的装置,其中的方法应用于耳机装置,具体包括:采集第一语音信号;确定所述第一语音信号对应的第二语音信号;所述第二语音信号为对所述第一语音信号进行美化处理得到;所述美化处理包括:滤除所述第一语音信号中的用户噪音;所述用户噪音表征用户产生的噪音;输出所述第二语音信号。本发明实施例能够提高语音信号的清晰度和质量,进而帮助用户实现打动听众、增强自信的目的。
  • 音频处理方法、装置、设备及存储介质-201911252463.6
  • 肖纯智 - 广州酷狗计算机科技有限公司
  • 2019-12-09 - 2023-10-10 - G10L21/0208
  • 本申请公开了一种音频处理方法、装置、设备及存储介质,属于计算机和互联网技术领域,所述方法包括:获取目标音频帧的基音频率;根据基音频率,确定谐波信号;根据目标音频帧和谐波信号,确定噪声信号;对噪声信号进行衰减,得到衰减后的噪声信号;根据衰减后的噪声信号和谐波信号,重构目标音频帧。本申请实施例提供的技术方案,实现了一种音频处理方法;并且噪声信号是基于音频帧和谐波信号确定的,可以确保所确定的噪声信号较为准确;此外,在进行音频处理时,是单独对噪声信号进行衰减,从而只降低了音频帧的无用成分噪声信号,而不会降低音频帧的有效成分谐波信号,从而准确有效地增强了音频帧中的有效成分。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top