[发明专利]一种基于语音频谱融合特征的手机来源识别方法有效
申请号: | 201710550925.7 | 申请日: | 2017-07-07 |
公开(公告)号: | CN107507626B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 王让定;裴安山;严迪群;金超;秦天芸 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L25/51 |
代理公司: | 宁波奥圣专利代理有限公司 33226 | 代理人: | 周珏 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 频谱 融合 特征 手机 来源 识别 方法 | ||
本发明公开了一种基于语音频谱融合特征的手机来源识别方法,其对每个手机对应的语音库中的每个语音样本中的每帧进行快速傅里叶变换,获取每帧的前一半加1个频率点的频率值的幅值;然后根据频率值及幅值,获取每个语音样本的统计平均信息量特征、统计平均对数谱特征和统计平均相位谱特征,组成频谱融合特征;接着将所有手机对应的所有语音样本的频谱融合特征组成频谱融合特征矩阵;之后对频谱融合特征矩阵进行归一化和特征选择,得到最优特征矩阵,即获得每个语音样本的最终频谱融合特征;最后对所有语音样本的最终频谱融合特征进行模型训练和测试样本识别;优点是识别准确率高、稳定性好,且泛化能力强。
技术领域
本发明涉及一种手机来源识别技术,尤其是涉及一种基于语音频谱融合特征的手机来源识别方法。
背景技术
如今,随着移动互联网和微芯片产业的快速发展,移动终端不再仅仅是一种通信设备,而是人们生活中不可或缺的部分。越来越多的人开始使用智能手机、PAD等便携设备捕捉和采集他们看到或听到的情景,而不是使用相机、录音笔、DV(Digital Video,数字视频)等专业设备。然而,大量的数字采集设备和采集数据的可用性带来了新的问题和挑战——多媒体的安全问题。作为一种检测多媒体数据独创性、真实性、完整性的技术,多媒体取证技术是信息安全领域的热点研究问题。
数字音频来源取证是对音频来源的真实性、完整性等进行验证的,是多媒体取证技术的重要研究内容。当一段录音样本被当作法庭证据时,对录音的来源的真实性和完整性的检测往往是必须的。近年来,数字音频来源取证引起了越来越多的关注,并获得了重大进展。如:Hanilci,C.,Ertas,F.,Ertas,T.,Eskidere,O.Recognition of brandandmodels of Cell-Phones from recorded speech signals.IEEETrans.Inf.Forensics Security.7(2),625-634(2012)(基于录音信号的手机品牌和型号的识别,电气和电子工程师协会,多媒体取证和安全学报)中提出的一种通过提取录音文件的MFCC(Mel Frequency Cepstrum Coefficient,梅尔频率倒谱系数)特征信息用于手机品牌和型号的识别的方法,其在14个不同型号的手机设备的闭集识别实验中,识别率可以达到96.42%。又如:Kotropoulos,C.Source phone identification using sketches offeatures.IET Biometrics.3(2):75–83(2014)(基于特征稀疏表示的手机来源识别,英国工程技术学会,生物学报)中提出的方法,其通过对不同手机得到的录音文件的语音信号频谱取对数,然后沿时间轴取平均或者通过堆叠每一帧的特征参数并基于高斯混合模型建模得到大尺寸的特征向量,接着通过映射到低维空间进行降维,其在7个品牌21个型号的手机来源识别实验中,识别率可达到94%。还如:王志锋、贺前华、李艳雄提出的录音设备的建模和识别算法,其考虑到语音段中的静音包含了与正常语音一样的设备信息,并且不受说话人、文本、情感等因素的影响,因此从静音段中提出表征录音设备的特征,然后利用设备通用背景模型构建设备模型,最后通过归一化似然度得分对输入的录音设备的语音样本特征进行分类判决,实验结果表明,其对于9种不同设备的平均识别率为87.42%。
现有的大多数手机来源识别的研究都是基于语音频谱单一特征的,由于目前大多数的研究基于的语音数据库中设备种类和数量较少,设备型号陈旧,因此使得不同设备采集语音的差异性较大,从而使得相关特征在手机来源识别中取得了不错的效果。但是,当语音数据库中设备种类和数量达到一定程度之后,特别是随着相同品牌不同型号设备不断增加后,相关特征在手机来源识别中是否依旧能取得不错的效果呢?通过在现下主流的7个品牌23个型号的手机构建的语音数据库上,分析不同设备语音信号的语谱图,发现不同设备的频谱信息不尽相同,不同品牌的设备差异明显,可以用频谱单一特征来有效的进行区分,而相同品牌不同型号的设备虽然存在差异,但较为相似,单一的频谱特征难以准确实现不同品牌手机的类内识别。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710550925.7/2.html,转载请声明来源钻瓜专利网。