[发明专利]一种基于RPA的企业公示信息数据采集方法在审
申请号: | 202110943612.4 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113779540A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 黄贺宾;许健彰;王雍胜;樊梦哲 | 申请(专利权)人: | 广东融合通信股份有限公司 |
主分类号: | G06F21/36 | 分类号: | G06F21/36;G06F11/34;G06N3/04;G06N3/08 |
代理公司: | 广州恒华智信知识产权代理事务所(普通合伙) 44299 | 代理人: | 唐一鸣 |
地址: | 519000 广东省珠海市横琴新区环岛东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于RPA的企业公示信息数据采集方法,通过分析目标网站的页面元素信息,获取数据采集所需的关键XPath,构建训练yolo目标检测网络模型和孪生网络模型,RPA通过所述yolo目标检测网络模型和孪生网络模型识别匹配验证码图片中的小图标和大图标信息,并点选通过验证,根据获取的关键XPath在目标网站的页面进行输入和点击操作,读取目标企业的页面元素内容并保存到本地txt文件。本发明模拟人工的操作方式来获取企业公示信息,实现友好访问目标网站、操作简单;将手工查询公示网站获取企业信息的工作方式变为系统自动执行搜索、验证码识别与数据拉取的工作方式,提高数据采集效率;模拟人工的网页操作,形成与目标网站的友好且健康交互。 | ||
搜索关键词: | 一种 基于 rpa 企业 公示 信息 数据 采集 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东融合通信股份有限公司,未经广东融合通信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110943612.4/,转载请声明来源钻瓜专利网。