[发明专利]使用比率作为分离特征来分解音频信号的装置和方法有效

申请号：	201780071526.0	申请日：	2017-11-16
公开（公告）号：	CN110114828B	公开（公告）日：	2023-10-27
发明（设计）人：	亚历山大·阿达米;于尔根·赫勒;萨沙·迪施;弗洛林·基多	申请（专利权）人：	弗劳恩霍夫应用研究促进协会
主分类号：	G10L21/028	分类号：	G10L21/028;G10L19/008
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	宋融冰
地址：	德国***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种用于将音频信号(100)分解成背景分量信号(140)和前景分量信号(150)的装置，包括：块生成器(110)，用于生成音频信号值的时间序列块；音频信号分析器(120)，用于确定音频信号的当前块的块特征，并用于确定一组块的平均特征，该组块包括至少两个块；以及分离器(130)，用于响应于当前块的块特征与一组块的平均特征的比率而将当前块分离成背景部分和前景部分，其中背景分量信号(140)包括当前块的背景部分，并且前景分量信号(150)包括当前块的前景部分。
搜索关键词：	使用比率作为分离特征分解音频信号装置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种用于将音频信号(100)分解成背景分量信号(140)和前景分量信号(150)的装置，所述装置包括：块生成器(110)，用于生成音频信号值时间序列块；音频信号分析器(120)，用于确定音频信号的当前块的块特征，并用于确定一组块的平均特征，所述一组块包括至少两个块；以及分离器(130)，用于响应于当前块的块特征与一组块的平均特征的比率而将当前块分离成背景部分和前景部分，其中背景分量信号(140)包括当前块的背景部分，并且前景分量信号(150)包括当前块的前景部分。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会，未经弗劳恩霍夫应用研究促进协会许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201780071526.0/，转载请声明来源钻瓜专利网。

上一篇：使用相位补偿对多声道信号进行下混合或上混合的装置和方法
下一篇：基于特征的话语码本选择

同类专利

使用比率作为分离特征来分解音频信号的装置和方法-201780071526.0
发明人：亚历山大·阿达米;于尔根·赫勒;萨沙·迪施;弗洛林·基多 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2017-11-16 - 公布日： 2023-10-27 - 主分类号： G10L21/028
摘要：一种用于将音频信号(100)分解成背景分量信号(140)和前景分量信号(150)的装置，包括：块生成器(110)，用于生成音频信号值的时间序列块；音频信号分析器(120)，用于确定音频信号的当前块的块特征，并用于确定一组块的平均特征，该组块包括至少两个块；以及分离器(130)，用于响应于当前块的块特征与一组块的平均特征的比率而将当前块分离成背景部分和前景部分，其中背景分量信号(140)包括当前块的背景部分，并且前景分量信号(150)包括当前块的前景部分。

从呼叫和音频消息中对其他说话者进行语音过滤-202180074499.9
发明人：马修·谢里菲;维克托·克尔布内 -专利权人：谷歌有限责任公司
申请日： 2021-10-26 - 公布日： 2023-07-11 - 主分类号： G10L21/028
摘要：一种方法(400)包括：接收对应于语音命令(118)的原始音频数据(102)的第一实例；以及接收原始音频数据的第二实例，所述第二实例对应于用户(102)所说的基于音频的通信(150)的可听内容(126)的话语。在语音过滤辨识例程(200)确定为用户的语音激活语音过滤时，该方法还包括：获得用户的相应说话者嵌入(318)并使用相应说话者嵌入处理原始音频数据的第二实例以生成用于基于音频的通信的增强音频数据(152)，所述增强音频数据(152)隔离用户说出的可听内容的话语并且排除不是用户说出的一个或多个附加声音的至少一部分。该方法还包括将增强音频数据传输到接收者设备(105)。

一种定向录音方法及电子设备-201680080704.1
发明人：仇存收;陶凯;韩博;李硕 -专利权人：华为技术有限公司
申请日： 2016-10-31 - 公布日： 2022-11-04 - 主分类号： G10L21/028
摘要：一种定向录音方法及电子设备，涉及音视频处理领域，能够精确定位声源的三维空间方位，以便对期望的录音范围内的声音信号进行拾取，大大提高了声音信号与期望录音范围的匹配程度，实现更准确的定向录音。方法包括：电子设备确定预设录音范围；预设录音范围包括水平角度范围以及俯仰角度范围(101)；电子设备获取麦克风阵列收集到的声音信号(102)；电子设备确定声音信号的声源的方位信息；方位信息包括声源的水平角度与声源的俯仰角(103)；电子设备根据声源的方位信息判断声源是否在预设录音范围内(104)；若声源不在预设录音范围内，则消除声音信号(105)；若声源在预设录音范围内，则存储声音信号(106)。

声音分离装置、声音分离方法、声音分离程序以及声音分离系统-201880096367.4
发明人：相原龙;花泽利行;冈登洋平;G·P·维彻恩;J·勒劳克斯 -专利权人：三菱电机株式会社
申请日： 2018-08-24 - 公布日： 2021-03-26 - 主分类号： G10L21/028
摘要：声音分离系统的声音分离装置(12)具备：特征量抽出部(121)，抽出混合声音的声音特征量的时间序列数据；块分割部(122)，将声音特征量的时间序列数据分割成具有一定的时间宽度的块；声音分离神经网络(1b)，根据块化的声音特征量的时间序列数据，制作多个说话者各自的掩码的时间序列数据；以及声音恢复部(123)，从掩码的时间序列数据和混合声音的声音特征量的时间序列数据，恢复多个说话者各自的声音数据。在多个说话者各自的掩码的时间序列数据的制作中，声音分离神经网络(1b)在正向的LSTM神经网络中使用与当前相比在时间上靠前的块的时间序列数据，在逆向的LSTM神经网络中使用与当前相比在时间上靠后的包括预先决定的数量的帧的块的时间序列数据。

使用相似性测度的盲源分离-201780058185.3
发明人：威廉·巴斯蒂安·克雷杰;林施杰 -专利权人：谷歌有限责任公司
申请日： 2017-09-01 - 公布日： 2019-08-02 - 主分类号： G10L21/028
摘要：一种方法包括：接收位于位置的一组麦克风产生音频信号的时刻；确定接收到的音频信号中的至少一些音频信号的频率分量之间的失真测度；通过使用所述确定的失真测度来确定所述频率分量的相似性测度；以及基于确定的相似性测度来处理所述音频信号。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]使用比率作为分离特征来分解音频信号的装置和方法有效

专利文献下载