[发明专利]一种基于旋律识别的多媒体安全过滤方法在审
申请号: | 201210481006.6 | 申请日: | 2012-11-23 |
公开(公告)号: | CN102984147A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 王磊;黄伟 | 申请(专利权)人: | 上海吟隆信息科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F17/30 |
代理公司: | 上海宝鼎专利代理有限公司 31222 | 代理人: | 龚峥嵘 |
地址: | 201200 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 旋律 识别 多媒体 安全 过滤 方法 | ||
技术领域
本发明涉及一种多媒体安全过滤方法,尤其涉及一种基于旋律识别的多媒体安全过滤方法。
背景技术
如今,许多不法分子开始利用音乐、电影等多媒体文件传播危害国家安全的言论和信息,例如事先录制好非法宣传的语音或视频,然后利用多媒体编辑软件插入到热门音乐和电影文件中,然后放到网上传播。与传统的文字传播不同,多媒体文件的内容过滤不能用现有的关键字过滤手段实现,因而这种行为不易被发现,严重危害着国家与社会的安全。因此,有必要提供一种新的方法将包含有非法内容的多媒体文件过滤掉,从而保证网络环境的健康、安全。
发明内容
本发明所要解决的技术问题是提供一种基于旋律识别的多媒体安全过滤方法,能够将包含有非法内容的多媒体文件过滤掉,且识别准确率高,从而保证网络环境的健康、安全。
本发明为解决上述技术问题而采用的技术方案是提供一种基于旋律识别的多媒体安全过滤方法,包括如下步骤:a) 采集非法宣传音频的样本;b) 提取样本中关键语句的旋律特征,并将其添加到非法语音特征数据库中;c) 采集上传到网络上的多媒体文件的音频,并对其进行分段;d) 提取每一分段的旋律特征,并在非法语言特征数据库中查找相似的旋律特征,如找到,则判定该多媒体文件中存在非法宣传片段。
上述的基于旋律识别的多媒体安全过滤方法,其中,所述旋律特征为音符片段序列: ,其中,代表音符音高,为音符持续时长,m为音符片段数,i为自然数,。
上述的基于旋律识别的多媒体安全过滤方法,其中,所述音符片段序列持续时长为5~15秒。
上述的基于旋律识别的多媒体安全过滤方法,其中,所述步骤d)中查找相似的旋律特征包括如下过程:
计算两个旋律特征相似度:
其中,A=,B=为两个待比较相似度的旋律特征,m为旋律特征A的音符片段数,W 为旋律特征A的音符片段的长度,n为旋律特征B的音符片段数,U为旋律特征B的音符片段的长度,为音符到的距离,表示搬移音符的长度;
当两个旋律特征的相似度达到预设阈值则判定两个旋律特征相符。
上述的基于旋律识别的多媒体安全过滤方法,其中,所述相似度的预设阈值范围为[0.86,1]。
上述的基于旋律识别的多媒体安全过滤方法,其中,所述步骤d)中查找相似的旋律特征包括如下过程:d1) 对音符片段序列加汉明窗后提取功率谱,然后将功率谱按照梅尔对数频率刻度,划分成若干个子带;d2) 计算各子带能量,得到各子带能量的分布,将各子带能量进行归一化,得到能量向量;d3) 将能量向量量化成矢量量化码本中的码字;d4) 若两个音符片段序列码字相同则判定两个旋律特征相似。
本发明对比现有技术有如下的有益效果:本发明提供的基于旋律识别的多媒体安全过滤方法,先将非法宣传音频中的旋律特征提取出来,并存储到非法语音的特征数据库中,然后对上传到网络的多媒体文件的音频进行处理,分段提取旋律特征,并将提取出来的旋律特征与非法语音特征数据库中的旋律特征作对比,若存在匹配的旋律,则可认为该多媒体中存在不法宣传的音频,进而可阻止该多媒体文件在网络上的传播,保证网络环境的健康、安全。
附图说明
图1为本发明基于旋律识别的多媒体安全过滤流程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
图1为本发明基于旋律识别的多媒体安全过滤流程示意图。
请参见图1,本发明提供的基于旋律识别的多媒体安全过滤方法包括如下步骤:
S101:采集非法宣传音频的样本。
S102:提取样本中关键语句的旋律特征,并将其添加到非法语音特征数据库中。旋律特征可采用如下音符片段序列:,其中,代表音符音高,为音符持续时长,m为音符片段数,i为自然数,。综合考虑识别速度和准确率,所述音符片段序列持续时长为5~15秒。
S103:采集上传到网络上的多媒体文件的音频,并对其进行分段,如将音频以10秒为单位分段。
S104:提取每一分段的旋律特征,并在非法语言特征数据库中查找相似的旋律特征,如找到,则判定该多媒体文件中存在非法宣传片段;从而可将其过滤阻止其在互联网上的传播。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海吟隆信息科技有限公司,未经上海吟隆信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210481006.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种处理含钡废水的复合除钡剂
- 下一篇:一种含两pprrr闭环子链的并联机构