[发明专利]一种基于人工辅助的数据源采集方法、装置及设备在审
申请号: | 201811299511.2 | 申请日: | 2018-10-30 |
公开(公告)号: | CN109299181A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 杨小龙 | 申请(专利权)人: | 郑州市景安网络科技股份有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 450000 河南省郑州*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采集规则 数据源 数据源采集 采集程序 人工辅助 采集 可读存储介质 设备计算机 装置及设备 采集数据 提示信息 提醒用户 预先设置 直接获取 兼容性 预设 重构 调用 查询 | ||
1.一种基于人工辅助的数据源采集方法,其特征在于,包括:
确定待采集的数据源;
判断是否存在预先为所述数据源设置的采集规则;
若存在预先为所述数据源设置的采集规则,则获取所述采集规则;
若不存在预先为所述数据源设置的采集规则,则生成提示信息以提醒用户为所述数据源设置采集规则;
调用预设采集程序根据所述采集规则对所述数据源进行采集。
2.如权利要求1所述的方法,其特征在于,所述确定待采集的数据源包括:
确定待采集的数据源的标识信息;
所述判断是否存在预先为所述数据源设置的采集规则包括:
根据所述标识信息,判断是否存在预先为所述数据源设置的采集规则。
3.如权利要求2所述的方法,其特征在于,所述根据所述标识信息,判断是否存在预先为所述数据源设置的采集规则包括:
遍历识别库,判断所述识别库中是否存在所述标识信息,其中,所述识别库为预先设置的,所述识别库保存有数据源的标识信息,还保存有与所述标识信息对应的采集规则;
若所述识别库中存在所述标识信息,则判断所述识别库中是否存在与所述标识信息对应的采集规则。
4.如权利要3所述的方法,其特征在于,在所述生成提示信息以提醒用户为所述数据源设置采集规则之后,还包括:
将用户为所述标识信息的数据源设置的采集规则保存到所述识别库中。
5.如权利要求1-4任意一项所述的方法,其特征在于,所述数据源包括以下数据类型中的任意一项或任意组合:文本、图片、视频、以及音频。
6.如权利要求1所述的方法,其特征在于,所述采集规则包括采集位置和/或采集顺序。
7.一种基于人工辅助的数据源采集装置,其特征在于,包括:
数据源确定模块:用于确定待采集的数据源;
判断模块:用于判断是否存在预先为所述数据源设置的采集规则;
采集规则获取模块:用于若存在预先为所述数据源设置的采集规则,则获取所述采集规则;
采集规则设置模块:用于若不存在预先为所述数据源设置的采集规则,则生成提示信息以提醒用户为所述数据源设置采集规则;
数据源采集模块:用于调用预设采集程序根据所述采集规则对所述数据源进行采集。
8.如权利要求7所述的装置,其特征在于,所述判断模块包括:
识别库遍历单元:用于遍历识别库,判断所述识别库中是否存在所述数据源的标识信息,其中,所述识别库为预先设置的,所述识别库保存有数据源的标识信息,还保存有与所述标识信息对应的采集规则;
采集规则判断单元:用于若所述识别库中存在所述标识信息,则判断所述识别库中是否存在与所述标识信息对应的采集规则。
9.一种基于人工辅助的数据源采集设备,其特征在于,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如权利要求1-6任意一项所述的一种基于人工辅助的数据源采集方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-6任意一项所述的一种基于人工辅助的数据源采集方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州市景安网络科技股份有限公司,未经郑州市景安网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811299511.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据仓库ETL操作系统
- 下一篇:数据库的会话连接的管理方法和装置