[发明专利]一种基于静音段的异源音频拼接篡改盲检测方法有效
申请号: | 201710218327.X | 申请日: | 2017-04-05 |
公开(公告)号: | CN106941008B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 胡永健;梁富文;刘琲贝;王宇飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L25/06 | 分类号: | G10L25/06;G10L25/27;G10L25/48;G10L25/51 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 许菲菲 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于静音段的异源音频拼接篡改盲检测方法。该方法包括如下步骤:对待测音频进行分帧与加窗;对音频帧频谱能量和过零率进行阈值判断,检测静音段;计算静音段音频特征;利用滑动窗口求取静音段上相邻静音帧音频特征相关系数向量;检测篡改点;确定篡改位置。本发明无需借助数字水印作为嵌入信息,针对时域上的异源音频拼接和插入操作,能有效判断篡改是否存在并定位具体篡改位置。 | ||
搜索关键词: | 一种 基于 静音 音频 拼接 篡改 检测 方法 | ||
【主权项】:
一种基于静音段的异源音频拼接篡改盲检测方法,其特征在于包括以下步骤:步骤1、选择待测的可疑音频,对待测音频进行分帧,帧长为m,帧移为n,相邻音频帧互有重叠,使帧和帧之间能够平滑过渡;音频帧时长m为16‑128毫秒,音频帧移时长n表示相邻音频帧之间重合的部分大小,取音频帧时长的1/2‑2/3;对分帧后的各个音频帧采用汉明窗进行加窗,分帧加窗后的时域音频信号表示为yi,j,其中,i=1,2,…,N;i为音频帧序号,共有N个音频帧,j=1,2,…,Nframe,为音频帧的第j个数据点,共有Nframe个数据点;步骤2、Spure代表说话人语音信号,hRIR代表环境脉冲响应,dB代表环境噪声,hMic代表设备脉冲响应,dMic代表设备本征噪声,则数字音频y为:y=(Spure*hRIR+dB)*hMic+dMic (1)其中,*代表卷积运算。当语音信号Spure等于零时,得到的输出即为静音,静音段只含有录音设备和环境信息;计算音频中每一帧的Nfft点短时傅里叶频谱能量E,同时在各音频帧的时域计算其数据点的过零率Z;对音频帧进行判断,若其短时频谱能量E小于设定的阈值TE且过零率Z小于设定的阈值TZ,则判定为静音帧,得到待测音频的静音段为Sl,其中,l=1,2,…,NS,l为静音段帧序号,NS为静音段帧数量;静音段帧序号对应于待测音频帧序号的映射为Loc,在静音段得到篡改点位置后,根据Loc求得篡改点在待测音频中的位置;步骤3、计算静音段S中各帧基于梅尔倒谱系数扩展的超向量特征,扩展过程采用广义线性区分性序列核函数,得到静音段音频特征为二维矩阵其中,hi为D维列向量,代表一个音频帧特征向量,共有NS个音频特征向量,用于表征音频的噪声信息,为设备本征噪声和环境噪声信息的总和,D取大于30的自然数;步骤4、用大小为D×2w的窗口在音频特征H上从前向后沿水平方向滑动,每次滑动距离为w,窗口内前w个列向量构成大小为D×w的子矩阵,计算子矩阵每行的均值,得到一个D维均值向量;窗口内后w个列向量构成大小为D×w的子矩阵,计算子矩阵每行的均值,得到一个D维均值向量;计算每个窗口前后两个D维均值向量的相关系数,随着窗口的移动,得到相关系数向量ρ,ρ中各元素用ρ(p)表示,p=1,2,…,Nρ,为相关系数序号,为相关系数向量长度;步骤5、计算相关系数向量ρ中各个元素的均值u,设定幅度阈值Tρ,令幅度阈值为均值的倍数,Tρ=ku,k为小于1的正数;计算相关系数向量ρ的一阶差分,得到一阶差分向量ρ′,计算ρ′中各个元素绝对值的均值u′,设定一阶差分阈值ρ′,令一阶差分阈值为均值的倍数,Tρ′=q′u′,k′为大于1的正整数;利用相关系数向量中小于阈值Tρ′的元素位置及一阶差分向量中绝对值大于阈值Tρ′的元素位置确定篡改点的位置,假设有U个篡改点,用位置集合Q表示,记为Q={q1,q2,q3,…,qU};步骤6、若Q不为空,则待测音频存在篡改,否则为原始音频;若待测音频被篡改过,共有U个篡改点,根据篡改点在相关系数向量中的位置,计算篡改点在静音段中对应的帧区间,再根据步骤2中静音段帧序号与待测音频帧序号的映射Loc,求得篡改点对应于待测音频中的帧区间,作为最终估计的定位篡改区域。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710218327.X/,转载请声明来源钻瓜专利网。