[发明专利]独立于绝对信号电平的音频咝声消除器有效

申请号：	201880064355.3	申请日：	2018-10-02
公开（公告）号：	CN111164683B	公开（公告）日：	2021-07-30
发明（设计）人：	G·真加勒;A·马特奥斯·索莱;B·G·克罗克特	申请（专利权）人：	杜比实验室特许公司;杜比国际公司
主分类号：	G10L21/0264	分类号：	G10L21/0264;H03G9/02;G10L21/0232
代理公司：	北京律盟知识产权代理有限责任公司 11287	代理人：	陈甜甜
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	立于绝对信号电平音频消除
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于音频处理的方法，其包括：

由一或多个处理器在时域中将接收到的音频信号划分成一系列缓冲区，每个缓冲区包含所述音频信号的样本；

将每个缓冲区变换成频域；

对于每个缓冲区，确定相应能量包络、相应咝声能级和相应过零率；

响应于确定以下各项而对所述缓冲区中的缓冲区的咝声频带应用增益降低：

所述缓冲区的咝声能级与紧邻的前一缓冲区的能量包络之间的比率满足第一阈值；和

所述缓冲区的过零率满足第二阈值；和

向消费装置提供在所述咝声频带中增益降低的所述音频信号，以进行存储、流式传输或回放，其中所述消费装置为存储装置、流服务器或回放装置。

2.根据权利要求1所述的方法，其中所述一系列缓冲区中的每对相邻缓冲区具有重叠。

3.根据权利要求1或权利要求2所述的方法，其包括确定所述频域中的侧链滤波器，所述侧链滤波器具有在对应咝声频带中的量值1和在所述对应咝声频带之外的量值0，并且具有斜坡。

4.根据权利要求3所述的方法，其中为每个缓冲区确定相应咝声能级包括将所述侧链滤波器应用于所述缓冲区并在所述滤波之后确定所述缓冲区的能级。

5.根据权利要求1或权利要求2所述的方法，其中为每个缓冲区确定相应能量包络包括：

确定相应缓冲区的总能级；和

通过应用具有时间常数的一阶低通滤波器将所述总能级平滑到所述相应能量包络中，所述时间常数基于所述缓冲区是处于起音阶段还是释音阶段。

6.根据权利要求5所述的方法，其中使所述总能级平滑包括：

响应于确定所述相应缓冲区的所述总能级高于紧邻的前一缓冲区的能量包络，确定所述时间常数为对应于起音的第一值；或

响应于确定所述相应缓冲区的所述总能级不高于所述紧邻的前一缓冲区的所述能量包络，确定所述时间常数为对应于释音的第二值。

7.根据权利要求6所述的方法，其中使所述总能级平滑包括：

将1减去所述时间常数和所述总能级的第一乘积与所述时间常数和所述紧邻的前一缓冲区的所述能量包络的第二乘积的和指定为所述相应缓冲区的能量包络。

8.根据权利要求1或权利要求2所述的方法，其包括基于所述缓冲区的咝声能级与紧邻的前一缓冲区的能量包络之间的所述比率来确定所述增益降低的量，其中所述量与高于所述第一阈值的所述比率成比例。

9.根据权利要求8所述的方法，其中应用所述增益降低包括：

基于所述过零率和所述第二阈值确定函数，所述函数是所述过零率的S形函数，所述函数具有在所述第二阈值周围的给定域中的过渡范围、低于所述给定域的值0，以及高于所述给定域的值1；和

在所述缓冲区的每个频带中，将增益降低的所述量乘以所述函数的所述值。

10.根据权利要求1或权利要求2所述的方法，其中所述音频信号是多声道信号，并且对每个声道独立地执行应用增益降低。

11.根据权利要求1或权利要求2所述的方法，其中所述音频信号是多声道信号，并且使用每个声道的侧链信号之和对所述声道同等地执行应用增益降低。

12.一种音频处理系统，其包括：

一或多个处理器；和

非暂时性计算机可读媒体，其存储指令，所述指令在被所述一或多个处理器执行时使得所述一或多个处理器执行操作，所述操作包括根据权利要求1至11中任一权利要求所述的操作。

13.一种非暂时性计算机可读媒体，其存储指令，所述指令在被一或多个处理器执行时使得所述一或多个处理器执行操作，所述操作包括根据权利要求1至11中任一权利要求所述的操作。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司，未经杜比实验室特许公司;杜比国际公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201880064355.3/1.html，转载请声明来源钻瓜专利网。

上一篇：用于确定熔融金属的化学成分的浸入式传感器
下一篇：用于组织牵开的装置和方法

同类专利

使用神经网络的信号处理装置及信号处理方法、记录介质-201880050189.1
发明人：木下庆介;中谷智广;M·德尔克鲁瓦 -专利权人：日本电信电话株式会社
申请日： 2018-08-01 - 公布日： 2023-06-27 - 主分类号： G10L21/0264
摘要：信号处理装置(10)是根据由1个以上的麦克风观测到的包含回声的观测信号，估计减少了回声的信号的信号处理装置，其具有：功率估计部(12)，其通过向神经网络输入与观测信号对应的观测特征量，对与观测信号对应的与减少了回声的信号的功率对应的特征量的估计值进行估计，该神经网络被学习为，将包含回声的信号的特征量作为输入，输出与减少了该信号中的回声的信号的功率对应的特征量的估计值；以及回归系数估计部(13)，其使用功率估计部(12)的估计结果对生成观测信号的自回归过程的回归系数进行估计，该估计结果是与功率对应的特征量的估计值。

用于汽车免提通信的自适应降噪系统-202180059521.2
发明人： D·叶;T·S·徐 -专利权人：特斯拉公司
申请日： 2021-07-27 - 公布日： 2023-05-30 - 主分类号： G10L21/0264
摘要：一种自适应降噪系统，利用多个多轴加速度计和多个麦克风，其中多个多轴加速度计和多个麦克风可组合使用以拾取车辆底盘上的振动。加速度计可以定位在车辆的悬架转向节或接头附近的点处，并且麦克风可以定位在车辆的头枕和遮阳板附近。自适应降噪系统可以使用自适应算法导出一个或多个滤波器权重，该滤波器权重将车辆底盘上的振动之间的传递函数建模为多个麦克风位置处的声压。

目标音强调装置及方法、噪音估计用参数学习装置及方法、记录介质-201780075048.0
发明人：小泉悠马;齐藤翔一郎;小林和则;大室仲 -专利权人：日本电信电话株式会社
申请日： 2017-09-12 - 公布日： 2023-02-17 - 主分类号： G10L21/0264
摘要：本发明提供噪音估计用参数学习装置，即使在混响或时间帧差成为问题的大规模空间中，也可以使配置在远离的位置的多个麦克风协作而执行频谱相减法，强调目标音。学习多个麦克风的观测信号中包含的噪音的估计中使用的噪音估计用参数的噪音估计用参数学习装置包括：模型化单元，将规定的麦克风的观测信号的概率分布模型化，将时间帧差的概率分布模型化，将传递函数增益的概率分布模型化；似然函数设定单元，根据模型化的概率分布，设定与时间帧差有关的似然函数、与传递函数增益有关的似然函数；以及参数更新单元，交替地反复更新两个似然函数的变量，将收敛后的时间帧差以及传递函数增益作为噪音估计用参数输出。

声音信号增强装置-201680081212.4
发明人：古田训 -专利权人：三菱电机株式会社
申请日： 2016-02-15 - 公布日： 2022-08-02 - 主分类号： G10L21/0264
摘要：第1信号加权部(2)输出根据混入有目标信号和噪声的输入信号对目标信号或噪声的特征进行加权后的信号。神经网络运算部(4)使用耦合系数输出目标信号的增强信号。逆滤波器部(6)输出根据增强信号解除目标信号或噪声的特征的加权后的信号。第2信号加权部(9)输出针对示教信号对目标信号或噪声的特征进行加权后的信号。误差评价部(11)输出使得由第2信号加权部(9)加权后的信号与神经网络运算部(4)的输出信号之间的学习误差为设定值以下的值的耦合系数。

独立于绝对信号电平的音频咝声消除器-201880064355.3
发明人： G·真加勒;A·马特奥斯·索莱;B·G·克罗克特 -专利权人：杜比实验室特许公司;杜比国际公司
申请日： 2018-10-02 - 公布日： 2021-07-30 - 主分类号： G10L21/0264
摘要：公开了自动咝声消除的方法、系统和计算机程序产品。可以使用自动咝声消除器而不需要手动设置参数，并且所述自动咝声消除器可以执行可靠的咝声检测和降低，而不考虑绝对信号电平、歌手性别和其它外来因素。音频处理装置将输入音频信号划分成缓冲区，每个缓冲区含有一些样本，所述缓冲区彼此重叠。所述音频处理装置将每个缓冲区从时域变换成频域，并将咝声消除实施为仅作用于指定咝声频带的多频带压缩器。所述音频处理装置基于缓冲区的咝声频带中的能级与前一缓冲区中的宽频带能级的比较来确定所述咝声频带中的衰减量。还基于过零率以及压缩曲线的斜率和起始来确定所述衰减量。

语音处理方法和语音处理装置-201480072103.7
发明人：李长宁 -专利权人：宇龙计算机通信科技（深圳）有限公司
申请日： 2014-01-15 - 公布日： 2020-03-17 - 主分类号： G10L21/0264
摘要：一种语音处理方法和装置，其中所述语音处理方法包括：获取终端上的声音采集单元阵列相对于用户发声源的位置数据变化量(302)；根据所述位置数据变化量修正所述声音采集单元阵列的波达方向(304)；对声音采集单元获取的声音信号进行滤波处理(306)。通过本方法，利用陀螺仪来获取通话时终端方位变化信息，并利用这些信息来对基于多麦克风阵列的语音降噪算法中某些参数进行及时修正，使得降噪算法具备自适应性，能自适应地根据用户通话过程中姿势的随机变化来随时调整降噪算法中的某些参数，达到最好的降噪效果。同时，大大节约了对终端资源的占用。

执行增益控制的系统及方法-201380071693.7
发明人：芬卡特拉曼·斯里尼瓦沙·阿提;文卡特什·克里希南 -专利权人：高通股份有限公司
申请日： 2013-08-06 - 公布日： 2018-10-26 - 主分类号： G10L21/0264
摘要：一种特定方法包含基于对应于音频信号的跨线谱对LSP间距确定所述音频信号包含对应于伪声产生条件的分量。所述方法还包含响应于确定所述音频信号包含所述分量，调整对应于所述音频信号的增益参数。举例来说，可经由增益衰减及/或增益平滑来调整所述增益参数。

噪声降低方法和装置-201380012027.6
发明人：市川治;S·J·伦尼 -专利权人：国际商业机器公司
申请日： 2013-02-08 - 公布日： 2016-11-23 - 主分类号： G10L21/0264
摘要：本发明的目的在于提供一种在语音识别中的基于模型的噪声降低的创新技术。本发明在基于模型的噪声补偿中生成概率模型，该概率模型被表示为具有观测值y作为因数的失配向量g(或干净语音x)的概率分布和具有针对每个频带的置信度指数β作为因数的失配向量g(或干净语音x)的概率分布的乘积，在概率模型上执行MMSE估计，以及估计干净语音估计值x^。因此，每个频带以根据它的置信度级别的贡献程度来影响MMSE估计的结果。进一步地，观测语音的S/N比率越高，输出值越加变得偏移到观测值。因此，前端的输出被优化。

信号处理装置、拍摄装置及程序-201380049672.5
发明人：冈野康介 -专利权人：株式会社尼康
申请日： 2013-07-18 - 公布日： 2015-05-27 - 主分类号： G10L21/0264
摘要：本发明提供一种信号处理装置，其能够适当地降低声音信号中含有的噪声。信号处理装置的特征在于，具有：转换部，其将声音信号转换为频域信号；减法运算部，其从在声音信号中含有规定噪声的期间的第1频域信号中，减去为了降低规定噪声而估算出的估算噪声的频域信号；校正信号生成部，其基于在声音信号中不含有规定噪声的期间的第2频域信号，生成第4频域信号，该第4频域信号用于对减法运算部从第1频域信号减去估算噪声的频域信号而得到的第3频域信号进行校正；以及加法运算部，其对第3频域信号加上第4频域信号。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]独立于绝对信号电平的音频咝声消除器有效

专利文献下载