[发明专利]在知识图谱中进行数据处理的方法、系统、装置和介质有效
| 申请号: | 202210308478.5 | 申请日: | 2022-03-28 |
| 公开(公告)号: | CN114416891B | 公开(公告)日: | 2022-07-15 |
| 发明(设计)人: | 阳进 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2455;G06F16/23;G06F16/21 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 段登新 |
| 地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 图谱 进行 数据处理 方法 系统 装置 介质 | ||
1.一种在知识图谱中进行数据处理的方法,包括:
获取用于知识图谱的原始数据,所述原始数据包括涉及多个实体和/或所述多个实体间的多个关系的属性值,其中一个或多个属性值为时变属性值,其中获取所述原始数据包括获取所述时变属性值的历史明细数据;
使用数据流有状态计算引擎的批执行模式将所述时变属性值的历史明细数据存储在多版本数据库中,所述多版本数据库具有在线多版本能力,其中所述多版本数据库中所述时变属性值的历史明细数据的版本与该历史明细数据的时间相关联;
使用所述多版本数据库,基于所述时变属性值的历史明细数据计算所述时变属性值的指定统计指标值;
生成或更新知识图谱,其中所述多个实体为所述知识图谱中的顶点,所述多个关系为所述知识图谱中的边,且所述指定统计指标值作为与所述实体相对应的顶点的属性值或与所述关系相对应的边的属性值;
实时或准实时地获取新原始数据,所述新原始数据包括新属性值;以及
使用数据流有状态计算引擎的流执行模式将所述新属性值存储在所述多版本数据库中。
2. 如权利要求1所述的方法,进一步包括:
至少部分地基于所述新属性值,计算经更新的指定统计指标值作为经更新的统计属性;以及
将所述经更新的统计属性更新到所述知识图谱。
3.如权利要求1所述的方法,其中一个或多个属性值为非时变属性值,且其中所述非时变属性值按照无版本或单版本的方式保存在所述多版本数据库中。
4.如权利要求3所述的方法,不计算所述非时变属性值的统计指标值,和/或不在所述知识图谱中更新所述非时变属性值的统计指标值。
5.如权利要求1所述的方法,其中所述数据流有状态计算引擎为Blink引擎或Flink引擎。
6.如权利要求1所述的方法,其中所述多版本数据库为Geabase数据库和/或HBase数据库。
7.如权利要求1所述的方法,其中所述指定统计指标值为在任意指定时间段上计算的指定类别的统计指标的值。
8. 如权利要求7所述的方法,进一步包括:
接收来自用户的输入;以及
所述指定统计指标值基于所述来自用户的输入。
9.如权利要求1所述的方法,进一步包括:
使用所述数据流有状态计算引擎的流执行模式来对所述新原始数据执行检查点处理。
10.一种分析用户对功能或服务的行为的方法,包括:
接收用户对功能或服务的行为的历史数据,其中所述历史数据包括涉及用户、功能、服务或行为的属性值,其中一个或多个属性值为时变属性值;
使用数据流有状态计算引擎的批执行模式将所述时变属性值的历史明细数据存储在多版本数据库中,所述多版本数据库具有在线多版本能力,其中所述多版本数据库中所述时变属性值的历史明细数据的版本与该历史明细数据的时间相关联;
使用所述多版本数据库,基于所述时变属性值的历史明细数据计算所述时变属性值的指定统计指标值;
生成或更新知识图谱,其中所述用户和功能或服务与所述知识图谱中的顶点相对应,所述行为与所述知识图谱中的边相对应,且所述指定统计指标值作为相应顶点或边的属性值;实时或准实时地获取新用户行为数据,所述新用户行为数据包括新属性值;以及
使用数据流有状态计算引擎的流执行模式将所述新属性值存储在所述多版本数据库中。
11. 如权利要求10所述的方法,进一步包括:
至少部分地基于所述新属性值,计算经更新的指定统计指标值作为经更新的统计属性;以及
将所述经更新的统计属性更新到所述知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210308478.5/1.html,转载请声明来源钻瓜专利网。





