[发明专利]一种音频爆音检测方法和装置有效

专利信息
申请号: 201711283064.7 申请日: 2017-12-07
公开(公告)号: CN109903775B 公开(公告)日: 2020-09-25
发明(设计)人: 高超;马哲 申请(专利权)人: 北京雷石天地电子技术有限公司
主分类号: G10L19/025 分类号: G10L19/025;G10L21/01;G10L25/51
代理公司: 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 代理人: 王新月
地址: 100101 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例提供了一种音频爆音检测方法和装置。该方法包括:将音频文件切割为等时长的多个音频切片;将每个音频切片再均分为N个小份,对每个小份进行快速傅里叶变换后,将频域能量值由低到高等分为M个区间,统计其分布在所述M个区间的个数为切片频域值分布个数;根据每个音频切片的所述切片频域值分布个数,通过K‑紧邻算法计算K个相邻音频切片在每个频域能量值区间的切片频域值分布个数平均值;当与该K个相邻音频切片相邻的待测音频切片在每个频域能量值区间的切片频域值分布个数与所述平均值的差值满足预设条件时,判定该待测音频切片为爆音。该方法和装置精确度高,适用范围广泛,节省大量人力资源。
搜索关键词: 一种 音频 检测 方法 装置
【主权项】:
1.一种音频爆音检测方法,其特征在于,该方法包括:将音频文件切割为等时长的多个音频切片;将每个音频切片再均分为N个小份,对每个小份进行快速傅里叶变换,得到每个音频切片中每个小份的频域能量最高值;将频域能量值由低到高等分为M个区间,统计每个音频切片对应的N个频域能量最高值分布在所述M个区间的个数为切片频域值分布个数;根据每个音频切片的所述切片频域值分布个数,通过K‑紧邻算法计算K个相邻音频切片在每个频域能量值区间的切片频域值分布个数平均值;当与该K个相邻音频切片相邻的待测音频切片在每个频域能量值区间的切片频域值分布个数与所述平均值的差值满足预设条件时,判定该待测音频切片为爆音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京雷石天地电子技术有限公司,未经北京雷石天地电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711283064.7/,转载请声明来源钻瓜专利网。

同类专利
  • 一种音频爆音检测方法和装置-201711283064.7
  • 高超;马哲 - 北京雷石天地电子技术有限公司
  • 2017-12-07 - 2020-09-25 - G10L19/025
  • 本发明实施例提供了一种音频爆音检测方法和装置。该方法包括:将音频文件切割为等时长的多个音频切片;将每个音频切片再均分为N个小份,对每个小份进行快速傅里叶变换后,将频域能量值由低到高等分为M个区间,统计其分布在所述M个区间的个数为切片频域值分布个数;根据每个音频切片的所述切片频域值分布个数,通过K‑紧邻算法计算K个相邻音频切片在每个频域能量值区间的切片频域值分布个数平均值;当与该K个相邻音频切片相邻的待测音频切片在每个频域能量值区间的切片频域值分布个数与所述平均值的差值满足预设条件时,判定该待测音频切片为爆音。该方法和装置精确度高,适用范围广泛,节省大量人力资源。
  • 用于空间音频对象编码中信号相依缩放变换的编码器、解码器及方法-201380052362.9
  • 萨沙·迪施;约尼·鲍卢斯;贝恩德·埃德勒;奥立夫·赫尔穆特;于尔根·赫勒;索尔斯腾·科斯特 - 弗朗霍夫应用科学研究促进协会
  • 2013-10-02 - 2018-09-25 - G10L19/025
  • 提供一种用于从降混信号产生包括一个或多个音频输出声道的音频输出信号的解码器。降混信号编码一个或多个音频对象信号。解码器包括用于根据一个或多个音频对象信号中的至少一个的信号属性将激活指示设定成激活状态的控制单元(181)。此外,解码器包括用于变换解混信号以获得包括多个第一子带声道的第一变换后的降混的第一分析模块(182)。此外,解码器包括第二分析模块(183),用于当激活指示被设定成激活状态时,通过变换第一子带声道中的至少一个获得第二子带声道而产生第二变换后的降混,其中第二变换后的降混包括尚未被第二分析模块变换的第一子带声道及第二子带声道。此外,解码器包括解混单元(184),其中解混单元(184)用于当激活指示被设定成激活状态时,基于关于一个或多个音频对象信号的参数边信息对第二变换后的降混进行解混以获得音频输出信号,以及当激活指示未被设定成激活状态时,基于关于一个或多个音频对象信号的参数边信息度第一变换后的降混进行解混以获得音频输出信号。此外,提供一种编码器。
  • 嘈杂语音信号中的脉冲干扰的单信道抑制-201180073151.4
  • T·沃尔夫;C·霍夫曼 - 纽昂斯通讯公司
  • 2011-07-07 - 2014-04-30 - G10L19/025
  • 本文公开了用于减少信号中的脉冲干扰的方法和装置,无需确定信号中的基音频率,通过搜索高能量分量的频谱寻找沿着频率相关并且从非常低的频率扩展可能直到大约若干kHz的较大的时间导数,来检测脉冲干扰的起始。估计脉冲干扰的能量,并且将这些估计用于抑制脉冲干扰。可选地,利用技术来保护期望的语音信号,避免其由于对脉冲干扰的抑制而被损坏。
  • 译码及解码瞬时帧-201180043611.9
  • 文卡特什·克里希南;阿南塔帕德玛纳班·阿拉桑尼帕莱·坎迪哈代 - 高通股份有限公司
  • 2011-09-09 - 2013-05-08 - G10L19/025
  • 描述一种用于译码瞬时帧的电子装置。所述电子装置包括处理器及存储于与所述处理器电子连通的存储器中的可执行指令。所述电子装置获得当前瞬时帧。所述电子装置还基于所述当前瞬时帧而获得残余信号。另外,所述电子装置基于所述残余信号而确定峰值位置集合。所述电子装置进一步至少基于所述峰值位置集合而确定是使用第一译码模式还是第二译码模式来译码所述当前瞬时帧。如果确定所述第一译码模式,则所述电子装置还基于所述第一译码模式而合成激励。如果确定所述第二译码模式,则所述电子装置还基于所述第二译码模式而合成激励。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top