[发明专利]一种基于pc端的页面信息智能采集工具及方法有效
申请号: | 201711034890.8 | 申请日: | 2017-10-30 |
公开(公告)号: | CN107729006B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 张林;高树;王立钧;徐新皎;郑跃 | 申请(专利权)人: | 南京唯实科技有限公司 |
主分类号: | G06F8/34 | 分类号: | G06F8/34;G06F8/38;G06F16/958 |
代理公司: | 南京睿之博知识产权代理有限公司 32296 | 代理人: | 陈琛 |
地址: | 210000 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 pc 页面 信息 智能 采集 工具 方法 | ||
本发明提供了一种基于pc端的页面信息智能采集工具及方法,包括页面可提取数据展示模块、页面数据提取模块、页面数据处理模块以及页面数据展示操作模块;所述页面可提取数据展示模块在用户浏览页面的过程中将可提取的信息进行标记展示;所述页面数据提取模块对页面进行数据提取并分类;所述页面数据处理模块对所提取的页面数据进行合并;所述页面数据展示操作模块将所提取的数据及其关系以节点和连线的方式在画布上展示出来。本发明可以帮助用户从多个页面进行数据提取,并智能的将提取的数据按照一定的关系合并,降低了用户对提取后数据的分析时间,减少了工作量。同时将提取的数据进行展示,并供用户自定义的编辑,方便用户进行分析。
技术领域
本发明涉web互联网领域,具体涉及一种基于pc端的页面信息智能采集工具及方法。
背景技术
现有的页面数据提取工具根据用户选择的网页元素,利用节点的分析算法和相应的网页信息提取动作所需的配置参数,将页面的数据抽取出来,从而达到网页信息提取的目的。尽管数据都提取出来了,但是这些数据一般都是单条单条的罗列出来,然后展示给用户去浏览。
1)页面上哪些数据能够提取,哪些不能提取,并没有明确标识出来,对用户有一定的混淆作用。
2)提取出的信息都是单条零散的,并没有信息与信息之间的关联
3)提取后的信息在展示的时候不能进行再次修改,添加,删除,建立关系,添加分组,添加备注等,有利于用户进行浏览的操作。
4)不能对提取的数据进行截图,数据保存,导出,附件上传等操作,有利于用户下次继续浏览和备份的操作
5)不能对提取后的数据,再次进行分析,也就是以提取的数据为信息源,再进行二次分析,有利于用户对问题的二次定位,便于深度分析数据。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种基于pc端的页面信息智能采集工具及方法,提取快速简洁,可以帮助用户快速的定位问题,大大提高了工作效率。
技术方案:
一种基于pc端的页面信息智能采集工具,包括页面可提取数据展示模块、页面数据提取模块、页面数据处理模块以及页面数据展示操作模块;
所述页面可提取数据展示模块根据在页面上预先设定的数据类型信息,在用户浏览页面的过程中将可提取的信息进行标记展示;
所述页面数据提取模块根据不同数据类型的标识数据对页面进行数据提取并分类,得到分类之后的页面数据;
所述页面数据处理模块通过比较所述页面数据提取模块提取的页面数据之间的标识数据判断数据之间的关系,并根据预先设定的数据类型信息对所提取的页面数据进行合并;
所述页面数据展示操作模块将所提取的数据及其关系以节点和连线的方式在画布上展示出来。
还包括后续分析模块,所述后续分析模块对多个节点内容的后续分析操作,列出可分析的数据,通过用户自由勾选的分析项对勾选数据进行二次分析,并将分析结果展示出来。
所述预先设定的数据类型包括五类数据,为任务数据、案件数据、卡片数据、关系及对象数据、活动轨迹数据。
所述标记展示采用高亮提示进行展示。
所述数据之间的关系具体为:如果是同一节点关系的数据则合并到同一节点下,如果两条数据满足关系结构那么建立关系连接。
一种页面信息智能采集方法,包括步骤:
(1)在页面上预先设定数据类型信息,所述数据类型包括五类数据,为任务数据、案件数据、卡片数据、关系及对象数据、活动轨迹数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京唯实科技有限公司,未经南京唯实科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711034890.8/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置