[发明专利]一种面向多通道互联网新媒体数据的视图像内容布控方法在审
申请号: | 201711478891.1 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108304481A | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 沈宜;贾宇;郭先会;张家亮;何海诣 | 申请(专利权)人: | 成都三零凯天通信实业有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46 |
代理公司: | 成都睿道专利代理事务所(普通合伙) 51217 | 代理人: | 薛波 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向多通道互联网新媒体数据的视图像内容布控方法,所述方法包括如下步骤:1)基于分布式爬虫架构的多通道数据的爬取和下载;2)基于Hash值的视图像黑白名单库建立;3)基于SIFT特征算法的视图像内容识别;由于互联网新媒体的传播途径较多,如何有效地对互联网新媒体中传播的数据进行有效识别和监测,成为目前网络信息内容安全领域亟待解决的重要问题之一,目前主流的互联网新媒体数据传播通道主要有:网站、APP、微信公众号、微博等,本发明公开的面向多通道互联网新媒体数据的视图像内容布控方法,可以快速采集所述传播平台上的数据,并通过视图像内容布控方式对爬取和下载的图片、视频内容进行有效的识别。 | ||
搜索关键词: | 新媒体 图像内容 互联网 布控 多通道 下载 图像内容识别 网络信息内容 多通道数据 黑白名单库 安全领域 传播途径 快速采集 视频内容 数据传播 有效识别 重要问题 爬虫 有效地 算法 网站 微博 传播 架构 图像 监测 主流 图片 | ||
【主权项】:
1.一种面向多通道互联网新媒体数据的视图像内容布控方法,其特征是:所述方法包括如下步骤:1)基于分布式爬虫架构的多通道数据的爬取和下载,主要包括:利用分布式爬虫技术从互联网新媒体爬取网络数据、下载视图像及存储视图像;2)基于Hash值的视图像黑白名单库建立,主要包括:对所述存储的视图像通过提取Hash值的方式与不良及受控媒资对应Hash值进行匹配,如果匹配成功,则将所述存储的视图像提取的Hash值写入黑名单库;如果匹配失败,则将所述存储的视图像提取的Hash值写入白名单库;3)基于SIFT特征算法的视图像内容识别,主要包括:利用SIFT特征算法提取不良及受控媒资的指纹信息,并建立不良及受控媒资指纹库作为布控媒资库,对步骤2)中写入白名单库中的Hash值对应的视图像通过SIFT特征算法提取指纹并与不良及受控媒资指纹库中的指纹信息进行匹配,分析所述匹配结果,完成布控。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都三零凯天通信实业有限公司,未经成都三零凯天通信实业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711478891.1/,转载请声明来源钻瓜专利网。