[发明专利]在知识图谱中进行数据处理的方法、系统、装置和介质有效
| 申请号: | 202210308478.5 | 申请日: | 2022-03-28 |
| 公开(公告)号: | CN114416891B | 公开(公告)日: | 2022-07-15 |
| 发明(设计)人: | 阳进 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2455;G06F16/23;G06F16/21 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 段登新 |
| 地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 图谱 进行 数据处理 方法 系统 装置 介质 | ||
公开了一种在知识图谱中进行数据处理的方法,包括:获取原始数据,包括获取实体和/或关系的时变属性值的历史明细数据;将该时变属性值的历史明细数据存储在在线多版本数据库中,该多版本数据库中该时变属性值的历史明细数据的版本与该历史明细数据的时间相关联;使用该多版本数据库,计算该时变属性值的指定统计指标值;生成或更新知识图谱。还公开了分析用户对功能或服务的行为的方法;还公开了相应的系统、装置和介质。本申请的方案能够高效、灵活地计算知识图谱中的属性值的统计指标值。
技术领域
本申请涉及知识图谱,尤其涉及用于在知识图谱中进行数据处理的方法、系统、装置和介质。
背景技术
如今,知识图谱已经得到了广泛的利用。例如,知识图谱已被应用于用户行为理解、智能客服、信贷理财等等各种应用场景。知识图谱通常由顶点和边组成,其中顶点和边分别表示实体和实体间的关系。一些实体和边可能具有属性。
在一些应用场景中,一些实体和/或边的属性的值(简称“属性值”)可能随时间而变化。例如,在用户行为分析场景中,用户和用户所使用的服务可能作为实体,而用户对服务所做的动作可以是这两类实体间的关系。例如,假设用户“张三”对某一服务(例如“滴滴出行”)执行了点击动作。在此情形下,用户“张三”可作为起点实体,服务“滴滴出行”可作为终点实体,而动作“点击(click)”可作为关系,而“点击”这一关系可具有属性值,即“点击数”。随着时间增长,用户可能多次点击服务,从而导致该关系“点击”的属性值发生变化(例如,总点击次数增加)。
为了更深入地理解用户对服务的点击关系,可能需要获得属性值的一种或多种统计指标。因此,存在高效、灵活、甚至实时地在知识图谱中获得属性值的统计指标的需求。
发明内容
为了克服现有技术的缺陷,本说明书的一个或多个实施例通过使用多版本数据库以及数据流有状态计算引擎并结合新颖方法实现了能够高效、灵活的获得知识图谱中的属性值的统计指标的方案。
本说明书的一个或多个实施例通过以下技术方案来实现其上述目的。
在一个方面中,提供了一种在知识图谱中进行数据处理的方法,包括:获取用于知识图谱的原始数据,该原始数据包括涉及多个实体和/或该多个实体间的多个关系的属性值,其中一个或多个属性值为时变属性值,其中获取该原始数据包括获取该时变属性值的历史明细数据;使用数据流有状态计算引擎的批执行模式将该时变属性值的历史明细数据存储在多版本数据库中,该多版本数据库具有在线多版本能力,其中该多版本数据库中该时变属性值的历史明细数据的版本与该历史明细数据的时间相关联;使用该多版本数据库,基于该时变属性值的历史明细数据计算该时变属性值的指定统计指标值;生成或更新知识图谱,其中该多个实体为该知识图谱中的顶点,该多个关系为该知识图谱中的边,且该指定统计指标值作为与该实体相对应的顶点的属性值或与该关系相对应的边的属性值。
优选地,该方法进一步包括:实时或准实时地获取新原始数据,该新原始数据包括新属性值;以及使用数据流有状态计算引擎的流执行模式将该新属性值存储在该多版本数据库中。
优选地,该方法进一步包括:至少部分地基于该新属性值,计算经更新的指定统计指标值作为经更新的统计属性;以及将该经更新的统计属性更新到该知识图谱。
优选地,其中一个或多个属性值为非时变属性值,且其中该非时变属性值按照无版本或单版本的方式保存在该多版本数据库中。
优选地,不计算该非时变属性值的统计指标值,和/或不在该知识图谱中更新该非时变属性值的统计指标值。
优选地,其中该数据流有状态计算引擎为Blink引擎或Flink引擎。
优选地,其中该多版本数据库为Geabase数据库和/或HBase数据库。
优选地,其中该指定统计指标值为在任意指定时间段上计算的指定类别的统计指标的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210308478.5/2.html,转载请声明来源钻瓜专利网。





