[发明专利]一种基于互联网大数据的网络违法视频广告识别方法及系统在审
申请号: | 201711212506.9 | 申请日: | 2017-11-28 |
公开(公告)号: | CN108628923A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 谭晓磊 | 申请(专利权)人: | 南京莱斯信息技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 张弛 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频广告 视频广告识别 大数据 智能搜索引擎 互联网 判定 抓取 互联网信息 准确度 广告特征 静态文字 违法行为 引擎 解析 数据库 存储 网络 多媒体 学习 | ||
本发明提供一种基于互联网大数据的网络违法视频广告识别方法及系统,首先通过智能搜索引擎,从互联网中抓取视频广告,智能搜索引擎能够支持所有互联网信息形式,包括静态文字及多媒体等内容,通过识别引擎对视频广告的内容进行解析,同时基于互联网大数据,不断进行机器深度学习,提高违法视频广告识别的准确度,最终判定视频广告违法行为。判定后的视频广告,提取其广告特征参数,存储在数据库中,作为后续机器深度学习的依据。
技术领域
本发明涉及网络安全领域,尤其是一种违法视频广告的识别方法及系统。
背景技术
互联网是一个巨大的、超时空的、跨行业的信息库,网络广告则是广告主利用互联网媒体向受众传递商业信息或其他信息的传播活动,由于互联网的特殊性,许多网络广告运用音频,视频以及动画技术以达到更好的让观众接受和理解效果。伴随着网民数量急剧增加,网络广告内容形式层出不穷,网络广告主的群体迅速扩大以及电子商务的快速发展,产生了虚假、夸大、误导消费者的现象。网络广告由于市场准入门槛低,投资成本不高,一些网站无视法律和消费者的利益,发布内容虚假的广告,甚至从事法律禁止的宣传,给网络经济以及互联网的健康发展蒙上了一层阴影。同时随着互联网小视频的兴起,其具有的交互性强、传播范围广、发布灵活、成本低廉、形式多样等特点,使得监管对象不明确,监管范围不清晰,特别是网络广告主体的虚拟性和内容的无限性使监管难度加大。
现有的解决方案有:
1)利用违法行为特征库匹配判定。
通过将待识别的广告进行特征提取,与现有的违法行为特征数据库进行匹配,并设置相应的相识度阈值,当与特征库中的相似度达到对应阈值时,可以判定为疑似违法行为。
2)利用人工识别
对疑似网络违法广告进行人工识别,并进行人为判定。
上述的已有解决方案的技术中,主要有以下缺点:
1)过度依赖违法行为特征库,当出现新违法行为时就无法进行识别。
2)通过机器进行匹配时会有一定的偏差,准确率不高。
3)后期需要人工干预,识别效率比较低下。
故,需要一种新的技术方案以解决上述问题。
发明内容
本发明针对违法广告视频识别效率低下的问题,提供一种新的网络违法视频广告识别方法,能够提高识别效率。
本发明同时提供一种提高识别效率的网络违法视频广告识别系统。
为达到上述目的,本发明网络违法视频广告识别方法可采用如下技术方案:
一种基于互联网大数据的网络违法视频广告识别方法,包括以下步骤:
(1)、首先通过搜索引擎,从互联网中抓取视频广告,截取时同时记录视频广告当时特征向量空间,包括网页类型、页面地址、相关链接;
(2)、对抓取的视频广告进行结构化处理,生成计算机可以解读的编码信息;
(3)、通过识别引擎,加载违法行为模型及行为识别模型,对视频广告的内容进行行为理解和语义分析,同时基于互联网大数据,对违法行为特征进行深度挖掘,充实违法视频广告特征知识库;
(4)、通过相关的判定模型对识别的结果进行判定,对判定后的视频广告提取广告特征参数,存储在违法广告特征数据库中;
(5)、根据判定模型,对视频广告的识别结果进行输出,并将输出的结果参数也存储至违法广告特征数据库中;
(6)、从违法广告特征数据库中提取相应的特征数据,作为后续机器深度学习的依据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京莱斯信息技术股份有限公司,未经南京莱斯信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711212506.9/2.html,转载请声明来源钻瓜专利网。