|
钻瓜专利网为您找到相关结果 920854个,建议您 升级VIP下载更多相关专利
- [发明专利]数据的爬取方法及装置-CN201811277896.2有效
-
陆生辉
-
北京国双科技有限公司
-
2018-10-30
-
2023-05-12
-
G06F16/951
- 本发明公开了一种数据的爬取方法及装置,涉及爬虫技术领域,提高了数据爬取客户端爬取WebView界面中的数据内容的成功率。本发明的方法包括:当数据爬取模块获取到目标WebView对象时,创建目标WebView对象对应的动态代理,其中,数据爬取模块为在Xposed框架下创建的Xposed模块;将动态代理作为参数添加至预设脚本函数中,其中,预设脚本函数为数据爬取模块对应的执行脚本中的函数,执行脚本用于爬取目标WebView对象对应的数据内容;数据爬取模块通过调用预设脚本函数,指示执行脚本爬取目标WebView对象对应的数据内容;通过动态代理获取执行脚本爬取的数据内容本发明适用于数据爬取客户端爬取WebView界面中的数据内容的过程中。
- 数据方法装置
- [发明专利]网页爬取方法及装置-CN201811145540.3有效
-
何熠皓
-
北京国双科技有限公司
-
2018-09-29
-
2023-05-12
-
G06F16/951
- 本发明公开了一种网页爬取方法及装置,涉及爬取技术领域。本发明主要解决了现有技术中无法基于预先创建的爬取架构形成一个新的爬取架构对网页进行爬取的问题。本发明的方法包括:获取目标网页的域名,并确定与所述域名相匹配的规则;判断预先创建的第一爬取构架中是否包含与所述域名相匹配的至少部分规则;若所述第一爬取构架中包含与所述域名相匹配的至少部分规则,则从所述第一爬取构架中继承所述至少部分规则;根据所述至少部分规则,创建第二爬取架构,通过所述第二爬取构架对所述目标网页进行爬取。本发明可广泛应用于爬取网页的场景中。
- 网页方法装置
- [发明专利]网页数据的爬取方法及装置-CN201811161352.X有效
-
满悦
-
北京国双科技有限公司
-
2018-09-30
-
2023-05-12
-
G06F16/951
- 本发明公开了一种网页数据的爬取方法及装置,涉及爬虫技术领域,主要目的在于解决现有的爬取的网页数据中存在大量冗余,影响爬取数据的准确性的问题。本发明的方法包括:接收到爬取指令时,确定待爬取网页元素及所述待爬取网页元素对应的元素标签;根据所述元素标签从已爬取的网页内容数据中获取第一内容数据,所述元素标签中存储有已爬取网页元素与已爬取网页内容数据的对应关系;判断所述第一内容数据与第二内容数据是否一致,所述第二内容数据为待爬取网页元素对应的网页数据;若不一致,则爬取所述第二内容数据。本发明适用于爬取网页中的数据。
- 网页数据方法装置
- [发明专利]一种数据爬取方法及装置-CN201811157671.3在审
-
陆生辉
-
北京国双科技有限公司
-
2018-09-30
-
2020-04-07
-
G06F8/30
- 本发明公开了一种数据爬取方法及装置,涉及爬虫技术领域,利用在Xposed框架下编写通用的Xposed模块来优化爬取应用程序的数据信息的方法,增强Xposed模块的通用性,节约开发成本,同时轻量化Xposed模块,也有助于提高Xposed模块处理性能,本发明的主要技术方案为:守护进程获取数据爬取任务;所述守护进程将所述数据爬取任务下发至数据爬取模块,以使所述数据爬取模块从应用程序中爬取数据信息;所述守护进程接收所述数据爬取模块根据所述数据爬取任务从所述应用程序中爬取的数据信息本发明应用于爬取应用程序上的数据信息。
- 一种数据方法装置
- [发明专利]数据爬取方法及装置、存储介质及电子设备-CN202111333310.1在审
-
陈程
-
北京搜房科技发展有限公司
-
2021-11-11
-
2022-01-14
-
G06F16/951
- 本发明提供一种数据爬取方法及装置、存储介质及电子设备,该方法包括:当接收到用户发送的任务创建指令时,向用户展示任务创建页面;获取用户在任务创建页面中输入的包含站点信息的任务创建信息,并根据任务创建信息生成爬取任务;基于用户提供的采集配置数据、解析配置数据定义爬取任务;对爬取任务进行处理,以便基于采集配置数据和解析配置数据从与站点信息对应的网站中爬取数据。基于用户输入的任务创建信息生成爬取任务,并基于采集配置数据以及解析配置数据,定义爬取任务,通过对爬取任务进行处理,实现需求网站的数据爬取,该过程无需开发网络爬虫程序即可爬取数据,节省了技术排期时间,降低了爬取数据的技术壁垒,提高爬取任务的效率。
- 数据方法装置存储介质电子设备
- [发明专利]一种财经博客文本分析方法-CN201911142631.6有效
-
张国威;胡汤磊;杨杰;诸葛瑜亮
-
国元证券股份有限公司
-
2019-11-20
-
2023-06-06
-
G06F16/35
- 本发明公开了一种财经博客文本分析方法,爬取博客数据,对博文进行两类分类,对博文进行看涨看跌看平分类;通过将一段时期内博主所有博文的分类情况与其对应的接下来若干个交易日股市的涨跌情况比较来判断该博主看涨看跌的准确性,若博文的看涨看跌与股市的涨跌一致,则认为该博文预测正确,否则预测错误;计算一段时间内博主所有博文的准确率,然后根据准确率的高低对博主进行排序,将其划分不同的区间,对博主给予等级评定。本发明能够对财经博客的前几名的博主进行有效排序,他们在看盘准确率上相对较高,发表的关于股市交易指导的博文是有一定参考价值的,可考虑最为日常资讯推送给重要客户参考,一定程度上减少投资者的投资失误。
- 一种财经博客文本分析方法
- [发明专利]一种直播网页爬取方法及装置-CN201710946257.X有效
-
满悦
-
北京国双科技有限公司
-
2017-10-12
-
2021-04-27
-
G06F16/953
- 本发明公开了一种直播网页爬取方法及装置,该方法包括:接收直播网页爬取指令,所述直播网页爬取指令包括直播时段、目标直播网页地址;在直播时段内,将目标直播网页地址所对应的目标直播网页加载至预设浏览器的标签页中;若目标直播网页在标签页中加载完成,将预定义的爬取脚本文件嵌入到标签页中;实时检测目标直播网页是否符合预设爬取条件,并在符合预设爬取条件的情况下,运行爬取脚本文件,爬取目标直播网页上的直播数据。这就可以在直播网页运行的过程中不断爬取直播数据,从而保证所爬取直播数据的全面性。
- 一种直播网页方法装置
|