[发明专利]一种网络图片舆情监测方法在审

专利信息
申请号: 201710280955.0 申请日: 2017-04-26
公开(公告)号: CN107122450A 公开(公告)日: 2017-09-01
发明(设计)人: 郭怡适;黄耀鸿;陈城;杨湧 申请(专利权)人: 广州图匠数据科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广州三环专利商标代理有限公司44202 代理人: 郝传鑫
地址: 510000 广东省广州*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 网络 图片 舆情 监测 方法
【说明书】:

技术领域

本发明涉及一种网络舆情监测方法。

背景技术

随着互联网在全球范围内的大量普及,网络媒体成为传播社会信息的主要载体之一,并且网络媒体包含了专业媒体以及群众、消费者等更广泛的声音。品牌企业需要知道消费者、媒体在网络各个平台上对自身品牌形象、产品的评价,政府部门以及公众人物也需要了解网络各个渠道群众、媒体的正负面声音。对于政府部门、品牌企业、公众人物来说,了解网络舆情有利于发现问题并快速对自身作出调整。

目前的网络舆情监测方法均是通过关键字匹配或文字OCR识别技术,抓取网络各个平台上相关的新闻、社交动态、网民评论等网络舆情信息。在这种情况下,只有包含相关关键字文本的数据才会被处理,声量只是文字声量,针对只有图片而没有相关关键字的内容却不能被搜索到。例如,越来越多的消费者喜欢用图片来表达情感,他们可能没有提及到某些关键词,但却用图片传递了同样的信息,微博真实用户每日所发的图片就达数百万张。目前由于缺乏有效的识别手段,图片数据是长期存在的监测盲区。

中国专利201310395230.8公开了一种图片搜索系统,,包括以下程序:(1)图片搜索系统进行关键字搜索,关键字包括颜色、形状、质地、通用名称和品质表征,(2)进行图片检索,用户首先对检索图片进行分类,标示出主要进行检索的区域,使用图片检索系统中的抓取键抓取图片中的关键部分,然后点击确认按钮进行检索,图片检索系统会自动检索出所有含有该抓取部分的图片集,并且按照相似度,进行排列,(3)进行图片对比,所述图片搜索系统还包括图片对比功能,图片搜索软件将用户图片与搜索到的图片进行对比,找出其中的相同点和不同点,确认图片的相似度和相似比例。通过上述方式,本发明图片搜索系统不仅能够通过关键字进行图片搜索,还能够通过抓取图片的关键部分进行图片搜索,并且能够将搜索到的图片与原始图片进行对比,使用效果好、检索效率高、有效识别出山寨图片、弥补了现阶段对于图片搜索和图片对比的空白。

中国专利201410189773.9公开了一种图片搜索方法及装置,其中,图片搜索方法包括:获得客户端发送的当前图片,从当前图片中提取出当前特征,根据当前特征对倒排索引库进行检索,获取倒排索引值,其中,倒排索引库中包含多个与图片的特征一一对应的链表;根据倒排索引值对对应的链表进行归并排序处理;以及根据处理后的结果向客户端返回检索结果,以便向用户显示。本发明实施例,提取获得的当前图片的当前特征,根据当前特征对包含多个链表的倒排索引库进行检索获取倒排索引值,根据倒排索引值对对应的链表进行归并排序处理,并向用户显示检索结果,操作方便、实现简单,克服了依赖文字的输入来获取结果的不便。

上述两个专利都在图片信息搜索方面提供了搜索方法,依据标记关键部分或者特征索引获得与目标图片的相似度和相关性并进行排序处理,根据排序结果向用户显示检索结果。此方法并不能全面完整地获得相关纯图片的搜索结果,因此无法全方位地获知网络舆情信息。

发明内容

针对现有技术的缺点,本发明的目的是提供一种图片舆情信息搜索方法,使用该方法可以将网络上不包含相关关键字的纯图片信息一并搜索到,使获得的舆情信息更全面,更确切。

为了实现上述目的,本发明提供了一种网络图片舆情监测方法用来监测网络舆情信息,该方法具体包括如下步骤:

S1、根据需要搜索的信息输入关键字进行全网爬虫搜索相关图片;

S2、所述步骤S1中搜索到的图片集作为训练样本数据,对样本图片中的目标图像进行标注;

S3、将所述步骤S2中标注过的样本图片集交给训练机进行模式训练,得到具备识别目标图像能力的识别引擎;

S4、所述识别引擎在全网进行全网爬虫搜索相关信息并进行识别。

本发明基于深度学习的图像识别先进技术和网络爬虫技术进行网络图片舆情信息监测。通过用户关键字信息全网爬虫搜索相关的网络图片作为训练机模式训练学习的样本图片集,训练完成后得到具备图像识别能力的识别引擎,再通过识别引擎基于全网爬虫搜索相关图片并识别抓取,此时不仅能够搜索到包含关键字的图片还能搜索到不包含关键字的纯图片。因此,通过本方法监测舆情填补了纯图片舆情这一缺口,能够全方位地获知网络舆情。

根据本发明另一具体实施方式,步骤S3模式训练进一步包括目标检测训练和分类训练。

根据本发明另一具体实施方式,目标检测训练根据图像物体检测模型进行目标检测与提取,该图像物体检测模型基于卷积神经网络建立。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州图匠数据科技有限公司,未经广州图匠数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710280955.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top