[发明专利]一种APP Wrapper的构造方法有效

专利信息
申请号: 202110051477.2 申请日: 2021-01-15
公开(公告)号: CN112395347B 公开(公告)日: 2021-04-09
发明(设计)人: 邹睿泓;桂文明 申请(专利权)人: 金陵科技学院
主分类号: G06F16/25 分类号: G06F16/25
代理公司: 南京众联专利代理有限公司 32206 代理人: 蒋昱
地址: 210000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 app wrapper 构造 方法
【说明书】:

发明公开一种APP wrapper的构造方法,包括以下步骤:1、打开目标activity,通过外部直接构造的intent打开或通过uiautormator2框架在每个activity的界面上找到相对应的widget模拟点击打开;2、滚动处理,通过试探算法模拟将屏幕swipe到目标界面,从中抽取数据;3、建立数据采集路径规则,通过直接组装url实现页面的遍历采集或通过挨个模拟点击app索引页面上的每一项;4、搭建数据抽取规则,抽取规则设为三个部分:滚动的swipe的step数、屏幕固定不变的框架Xpath和数据Xpath;通过上述过程,实现基于安卓app的数据解析机制抽取相关信息的目标。

技术领域

本发明涉及人工智能技术领域 ,特别是涉及到一种APP Wrapper的构造方法。

背景技术

随着智能手机的普及,手机端产生的数据信息已发生了极大的改变,大量的数据信息在手机端进行交互使用,面对如此大的数据库信息对其研究具备极大的意义,目前大量的人工智能、数据挖掘、数据库和信息检索等多个领域已向手机系统方向进行发展,通过便捷的手机系统实现对大量信息的挖掘提取已成为众多技术人员攻克的技术难题。过去在信息提取方面,信息提取的wrapper主要是用于从网页中自动提取各类字段,比如对于一个图书网站,主要是提取图书的标题和价格,作者等等字段进行提取,然后一般基于xpath,建立wrapper,再通过一些机器学习的方法,自动调整wrapper,以实现整站数据的采集。但传统的方法对于APP采集数据完全无效,为此是否能发明提出一种APP采集的新方法,基于APP的界面XML构造wrapper,从而实现对于APP的数据采集。

发明内容

为了解决上述存在问题,本发明提供一种APP Wrapper的构造方法,通过设计APP打开目标activity,打开后的目标activity进行滚动处理,处理后在抽取数据时建立数据采集路径规则,在建立数据采集路径规则后搭建数据抽取规则,建立一个基于安卓app的数据解析机制,提出一种APP Wrappeer的构造方法,其特征在于,具体步骤如下:

一种APP Wrapper的构造方法,其特征在于:具体步骤如下:

(1)通过APP打开目标activity,通过外部直接构造的intent打开或通过uiautormator2框架在每个activity的界面上找到相对应的widget模拟点击打开;

将activity的exported属性为true或者定义了intent-filter的,通过外部直接构造的intent打开;将activity的exported属性为false或者规定了访问权限的,通过人工观察,寻找从application首页到目标activity的点击路径,通过uiautormator2框架在每个activity的界面上找到相对应的widget模拟发出点击的指令打开;

(2)通过试探算法模拟将屏幕swipe到目标界面,从中抽取数据;

滚动页面会刷新当前屏幕,需要将其打开的页面换成为安卓的xml结构,通过一个试探算法,一步一步模拟将屏幕swipe到目标界面,从中抽取数据;

(3)建立数据采集路径规则,通过直接组装url实现页面的遍历采集或通过挨个模拟点击app索引页面上的每一项;

将数据采集路径规则建立在目标页面上,对提供了exported的activity,通过直接组装url实现对于采集页面的遍历采集,其它类型的通过挨个模拟点击app索引页面上的每一项,不停的滚动来实现采集;

(4)搭建数据抽取规则,抽取规则设为三个部分:滚动的swipe的step数、屏幕固定不变的框架Xpath和数据Xpath;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金陵科技学院,未经金陵科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110051477.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top