[发明专利]一种爬取手机客户端公共账号信息的方法在审
申请号: | 201410467250.6 | 申请日: | 2014-09-15 |
公开(公告)号: | CN104199953A | 公开(公告)日: | 2014-12-10 |
发明(设计)人: | 徐宏伟;王传超;孙海峰 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜明 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种爬取手机客户端公共账号信息的方法,解决了手机客户端部分公共账号信息采集的难题。目前公众号整体数量在300万多,微信整体国内用户数在5亿;这也就说明每个微信用户已经开始关注大量的微信公众号,微信公众号的信息同质化严重(尤其是信息类)。但同时,微信公众号们的弊端也越来越明显,一些杂七杂八甚至有悖于法理的信息不断干扰、冲击着人们。因此,需要通过公众号发布的内容进一步判断,有哪些有益信息,有哪些是负面信息。 | ||
搜索关键词: | 一种 手机 客户端 公共 账号 信息 方法 | ||
【主权项】:
一种爬取手机客户端公共账号信息的方法, 其特征在于由于各个公共账号信息地址不一样,异步加载数据的地址更是不一样,因此,分以下几步完成对手机端公共账号信息数据采集:1)安装采集软件及分析工具;2)分析异步加载网页,寻找异步请求地址;3)分析出异步请求地址规律,配置相关工具实施数据采集;4)把采集的数据通过json分析后,储存到服务器;5)通过手机微信搜到公众账号,或通过“扫一扫”搜到公众账号;6)打开抓包工具,设置手机网络的代理地址,把地址设置成电脑的地址,设置正确的端口号;7)打开搜到公共账号发布的信息链接; 8)分析抓到的地址;9)通过分析数据,预防反面言论,判断事件的目的性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司;,未经浪潮软件集团有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410467250.6/,转载请声明来源钻瓜专利网。