[发明专利]数据处理方法、装置、存储介质及电子设备有效
申请号: | 201710267544.8 | 申请日: | 2017-04-21 |
公开(公告)号: | CN107220283B | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 谢新强;张霞;纪勇;张德阳;于明光 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/242 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏嘉熹;南毅宁 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询模式 预处理 解析 抽取 目标数据 原始数据 存储介质 电子设备 数据处理 阈值时 信息技术领域 预设时间段 查询效率 动态解析 预设 查询 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
当利用第一查询模式进行查询时,获取所述第一查询模式在预设时间段内的解析频率,所述解析频率为所述第一查询模式在所述预设时间段内执行解析操作的频繁程度,所述解析操作包括动态解析或预处理抽取;
当所述解析频率大于或等于预设的解析频率阈值时,确定所述第一查询模式是否对原始数据已执行过预处理抽取;
当已执行过预处理抽取时,提取所述第一查询模式已抽取过的目标数据;
当未执行过预处理抽取时,根据所述第一查询模式对所述原始数据进行预处理抽取以提取所述目标数据;
当所述解析频率小于所述解析频率阈值时,根据所述第一查询模式对所述原始数据进行动态解析以提取所述目标数据;
在利用所述第一查询模式进行查询之前,所述方法还包括:
记录所述第一查询模式在所述预设时间段内每次执行所述解析操作的历史时间点,得到包括至少一个所述历史时间点的历史时间点序列;
获取当前时间点与所述历史时间点序列中的每个所述历史时间点的差值;
根据所述当前时间点与所述历史时间点序列中的每个所述历史时间点的差值确定每个所述历史时间点对应的权重;
根据每个所述历史时间点对应的权重,计算所述解析频率。
2.根据权利要求1所述的方法,其特征在于,所述根据所述当前时间点与所述历史时间点序列中的每个所述历史时间点的差值确定每个所述历史时间点对应的权重,包括:
将所述当前时间点与每个所述历史时间点的差值的倒数确定为每个所述历史时间点对应的权重;
所述根据每个所述历史时间点对应的权重,计算所述解析频率,包括:
根据每个所述历史时间点对应的权重,利用解析频率计算公式计算所述解析频率;其中,所述解析频率计算公式包括:
其中,f(s,tk)表示所述解析频率,tk表示所述当前时间点,ti表示所述时间序列中的历史时间点,k-1表示所述历史时间点序列中的所述历史时间点的数量,i≤k-1,i和k均为正整数。
3.根据权利要求1或2所述的方法,其特征在于,所述当已执行过预处理抽取时,提取所述第一查询模式已抽取过的目标数据,包括:
当已执行过预处理抽取时,获取所述第一查询模式对应的数据索引;
利用所述数据索引在已存储的数据中查找所述目标数据;
在查找到所述目标数据后,提取所述目标数据。
4.根据权利要求1或2所述的方法,其特征在于,所述当未执行过预处理抽取时,根据所述第一查询模式对所述原始数据进行预处理抽取以提取所述目标数据,包括:
当未执行过预处理抽取时,根据所述第一查询模式所定义的属性对所述原始数据执行预处理抽取,得到所述目标数据;
将所述目标数据进行存储,并为所述目标数据创建数据索引。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
在所述根据所述第一查询模式对所述原始数据进行预处理抽取以获取所述目标数据,或者所述根据所述第一查询模式对所述原始数据进行动态解析以抽取所述目标数据之后,更新所述解析频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710267544.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:流量测量装置
- 下一篇:一种基于全金属背盖智能手机的天线系统