[发明专利]一种基于静音段的异源音频拼接篡改盲检测方法有效
申请号: | 201710218327.X | 申请日: | 2017-04-05 |
公开(公告)号: | CN106941008B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 胡永健;梁富文;刘琲贝;王宇飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L25/06 | 分类号: | G10L25/06;G10L25/27;G10L25/48;G10L25/51 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 许菲菲 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 静音 音频 拼接 篡改 检测 方法 | ||
本发明公开了一种基于静音段的异源音频拼接篡改盲检测方法。该方法包括如下步骤:对待测音频进行分帧与加窗;对音频帧频谱能量和过零率进行阈值判断,检测静音段;计算静音段音频特征;利用滑动窗口求取静音段上相邻静音帧音频特征相关系数向量;检测篡改点;确定篡改位置。本发明无需借助数字水印作为嵌入信息,针对时域上的异源音频拼接和插入操作,能有效判断篡改是否存在并定位具体篡改位置。
技术领域
本发明涉及音频取证技术领域,具体涉及一种基于静音段的异源音频拼接篡改盲检测方法。
背景技术
音频拼接是最常见的音频篡改形式之一。随着便携式录音设备的普及以及各种功能强大的多媒体编辑软件的出现,对音频真伪进行检测变得十分重要。数字音频盲取证作为一种音频数据的取证方法,无需借助添加数字水印进行检测,更具有实用性,在司法取证和新闻信息真伪鉴定等领域具有广泛的应用前景。
在数字音频篡改盲检测研究领域,目前流行的方法主要有基于电网频率(Electric Network Frequency,ENF)和基于音频特征(例如,语音特征,录音设备的本征噪声等)两大类。2005年Grigoras在期刊IJSLL(International Journal of Speech,Language and the Law,国际语音、语言和法律期刊)上发表论文《Digital AudioRecording Analysis The Electric Network Frequency Criterion》,首次提出基于ENF的数字音频篡改方法,通过比较音频中的ENF与历史ENF数据库中的记录是否一致,判断音频是否被篡改。2009年Nicolalde等学者在ICASSP(International Conference onAcoustics,Speech and Signal Processing,国际声学、语音与信号处理会议)上发表论文《Evaluating Digital Audio Authenticity with Spectral Distance and ENF PhaseChange》,通过音频中ENF信号的相位变化来检测和定位篡改。随后,有一批基于ENF信号的音频篡改检测算法涌现。然而,对于手机和录音笔等常用的直流供电录音设备,由于其录制的音频中并不含ENF信号,基于ENF的音频篡改检测方法并不适用。
数字音频录音过程除了储存有效的语音信号,还不可避免地引入了噪声,主要包括录音设备的本征噪声和环境噪声。对于异源音频拼接篡改,现有算法通常在未区分有声段和静音段的情况下,从待测音频中提取语音特征、设备的本征噪声和环境噪声特征,通过检查其一致性是否受到破坏判断音频是否存在篡改。2012年X.Pan等学者在ICASSP上发表论文《Detecting Splicing in Digital Audio Using Local Noise Level Estimation》,通过对音频的局部噪声水平进行比较,检测和定位篡改。然而,该算法在有声段计算的噪声水平波动较大,导致误检率过高,并且拼接前后音频的噪声水平一般相差不大,故检测效果常常不明显。2014年H.Zhao等学者在ACM IHMMSec(ACM Workshop on InformationHiding and Multimedia Security,信息隐藏暨多媒体安全国际会议)上发表论文《AudioSource Authenticity and Splicing Detection Using Acoustic EnvironmentalSignature》,以起始若干帧音频特征的均值作为参考特征,通过考察音频各帧与参考特征的相关系数变化来检测和定位篡改。然而,该算法从有声段提取的音频特征不稳定,导致出现过多异常相关系数。同时由于数字语音是非平稳的时变信号,其特性会随时间缓慢变化,与参考特征间隔时间越长,计算得到的相关系数越小,容易造成误检。另外该算法没有定位机制,不能精确确定篡改位置。
发明内容
本发明的目的在于克服现有异源音频拼接篡改盲检测方法准确率不高,定位精度不足等缺点,提供一种准确率高,定位精度高的基于静音段的异源音频拼接篡改盲检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710218327.X/2.html,转载请声明来源钻瓜专利网。