[发明专利]一种基于事件图谱的事件链接压缩方法在审
申请号: | 202111550987.0 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114168755A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 史晔翎 | 申请(专利权)人: | 南京微著信息科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31 |
代理公司: | 北京沁优知识产权代理有限公司 11684 | 代理人: | 陈坚 |
地址: | 215000 江苏省南京市经济技术*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 事件 图谱 链接 压缩 方法 | ||
本发明公开了一种基于事件图谱的事件链接压缩方法,涉及数据处理领域,针对大量的相似事件型链接数据给图数据库带来存储压力的同时并没有提升实际业务价值,反而会导致查询性能的降低等问题,现提出如下方案,包括事件链接数据处理系统以及以下步骤:S1、所述事件链接数据处理系统构建数组A,并确定数组A中所需要保留的特征属性B,所述数组A包括头实体以及尾实体,所述头实体指向尾实体;S2、所述事件链接数据处理系统读取事件图谱中的所有事件链接C,并判断事件链接C的指向。本发明提出一种基于事件图谱的事件链接压缩方法,能够减少事件图谱的邻接关系数据体积,有效的降低存储资源的占用,极大的提升图谱数据查询性能。
技术领域
本发明涉及数据处理领域,尤其涉及一种基于事件图谱的事件链接压缩方法。
背景技术
随着大数据时代的到来,知识工程受到了广泛关注,而如何从海量的数据中提取有用的知识,成为大数据分析的关键。知识图谱的概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎。知识图谱本质上并不是一个新概念,它是一种语义网络的知识库,即具有有向图结构的一个知识库,其中图的顶点代表实体/概念,而图的边代表实体/概念之间的各种语义关系。知识图谱的来源于对海量的结构化数据和非结构或半结构化数据的挖掘和分析,根据基础数据语料集覆盖范围的不同,可分为通用知识图谱和特定领域的知识图谱。
挖掘分析得到图谱数据,通常用(头实体,关系,尾实体)的三元组形式表达事物的属性以及事物之间的语义关系,这种形式的数据很适合用图数据库进行存储和处理。其中,图谱实体之间的关系按其语义可分为描述某种状态是否成立的关系链接和描述实体之间交互事件的链接。在特定领域的知识图谱中,实体、关系型链接和事件型链接的数据量呈指数级上升的分布关系,给存储知识图谱的图数据库带来巨大的读写压力和资源消耗。
然而,特定领域的知识图谱中,某些事件型链接的主要应用价值在于其发生的事件和某一两个特征值,并且上层分析应用,在执行分析计算时通常只关心事件的该特征值的统计结果和分布情况。因此大量的相似事件型链接数据给图数据库带来存储压力的同时并没有提升实际业务价值,反而会导致查询性能的降低。
发明内容
(一)发明目的
为解决背景技术中存在的技术问题,本发明提出一种基于事件图谱的事件链接压缩方法,能够减少事件图谱的邻接关系数据体积,有效的降低存储资源的占用,极大的提升图谱数据查询性能。
(二)技术方案
本发明提供了一种基于事件图谱的事件链接压缩方法,提供事件链接数据处理系统以及以下步骤:
S1、通过所述事件链接数据处理系统构建数组A,并确定数组A中所需要保留的特征属性B,所述数组A包括头实体以及尾实体,所述头实体指向尾实体;
S2、通过所述事件链接数据处理系统读取事件图谱中的所有事件链接C,并判断事件链接C的指向,对同一指向的事件链接C标识为事件链接D;
S3、通过所述事件链接数据处理系统遍历事件链接D,并提取具有特征属性B的事件链接D标识为事件链接E,去除不具有特征属性B的事件链接D,并记录事件链接E的频次F;
S4、通过所述事件链接数据处理系统提取事件链接E中除特征属性B的其他特征G,所述其他特征G包括事件链接E的发生时间H、中间时间I以及结束时间J,并对事件链接E进行压缩,得到事件链接L;
S5、将事件链接L插入进数组A中,并从对应头实体指向对应尾实体,得到数组N。
S6、将多个所述数组N组合,得到压缩图谱M。
进一步而言:步骤S1中,所述头实体和尾实体为两个独立的账户,所述头实体为发起事件链接的账户,所述尾实体为接收事件链接的账户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京微著信息科技有限公司,未经南京微著信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111550987.0/2.html,转载请声明来源钻瓜专利网。