[发明专利]数据处理方法、装置、计算机设备及存储介质在审
申请号: | 202210245124.0 | 申请日: | 2022-03-14 |
公开(公告)号: | CN114625936A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 沈卫 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;罗燕 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 计算机 设备 存储 介质 | ||
本申请为数据处理技术领域,提供了一种数据处理方法、装置、计算机设备及存储介质,其中,所述方法包括:每隔预设时间段从数据源获取数据流,对数据流中的数据进行解析,得到多个指定结构的目标数据,确定数据流的多个数据处理节点和数据流流经多个数据处理节点的流经顺序;按照流经顺序将多个数据处理节点进行连接得到数据处理通道,将多个目标数据导入数据处理通道进行数据处理,在数据处理通道中,分别对每个目标数据进行分析处理,得到每个目标数据对应的处理结果,以对不断流入的数据流在进行解析处理后得到指定结构的目标数据,并在数据处理通道中分别对每个目标数据进行自动分析处理,提高数据处理效率。
技术领域
本申请涉及数据处理技术领域,具体而言,本申请涉及一种数据处理方法、装置、计算机设备及存储介质。
背景技术
随着互联网技术的不断发展,互联网大数据的趋势日益显著,每一条互联网的业务线都在不断地产生新的数据,对产生的数据进行进一步地处理以对互联网业务的运行进行反馈是相当重要的工作之一。
现有技术中,当用户希望对某一数据源输出的数据流进行处理时,需要根据相应的处理需求手动编写数据处理程序,不同的数据处理需求需要重新编写不同的程序,十分费时费力,使得数据处理效率低下,不符合大数据发展趋势。
发明内容
本申请的主要目的为提供一种数据处理方法、装置、计算机设备及存储介质,以提高数据处理效率。
为了实现上述发明目的,本申请提供一种数据处理方法,其包括:
每隔预设时间段从数据源获取数据流;
对所述数据流中的数据进行解析,得到多个指定结构的目标数据;
确定所述数据流的多个数据处理节点和所述数据流流经所述多个数据处理节点的流经顺序;
按照所述流经顺序将所述多个数据处理节点进行连接得到数据处理通道,将多个所述目标数据导入所述数据处理通道进行数据处理;
在所述数据处理通道中,分别对每个所述目标数据进行分析处理,得到每个所述目标数据对应的处理结果。
优选地,所述确定所述数据流的多个数据处理节点和所述数据流流经所述多个数据处理节点的流经顺序,包括:
为多个所述目标数据设定缓存时间节点,按照相应的所述缓存时间节点将多个所述目标数据分别缓存至数据库中;
当到达预设统计周期时,判断所述数据库中的所述目标数据的数据量是否大于预设数据量阈值;
若是,则确定所述数据流的多个数据处理节点和所述数据流流经所述多个数据处理节点的流经顺序。
优选地,所述对所述数据流中的数据进行解析,得到多个指定结构的目标数据,包括:
对所述数据流中的数据进行解析,得到多个数据;
确定每个所述数据的字段,得到多个字段;
统计每个字段在所述数据流中出现的次数,从所述多个字段中筛选出排在前N位的字段,得到多个目标字段;其中,所述N2;
确定每个所述目标字段的数据,得到多个指定结构的目标数据。
优选地,所述确定每个所述数据的字段,得到多个字段,包括:
从所述数据流中提取携带有字段相关信息的特征值;
根据所述特征值确定每个所述数据的字段,得到多个字段。
优选地,所述分别对每个所述目标数据进行分析处理,得到每个所述目标数据对应的处理结果,包括:
当确定所述目标数据为目标用户的用户数据时,对所述用户数据进行词特征提取,得到多个特征词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210245124.0/2.html,转载请声明来源钻瓜专利网。