[发明专利]一种基于图计算的人员关系构建和分析方法在审
申请号: | 202011618324.3 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112749237A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 张天际;李继征;林嘉俊 | 申请(专利权)人: | 广州金越软件技术有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/901 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 计算 人员 关系 构建 分析 方法 | ||
本发明公开了一种基于图计算的人员关系构建,第一步是关系数据的提取,通过整合内外数据,提炼出关系信息的最细粒度数据,存储到图数据库中;第二步是关系模型的构建,通过梳理关系类型,遍历图数据库中存储的顶点与边实现关系重组,形成关系模型。如前文背景技术提到的方式一,在关系模型中会转变为“该目标手机乘车前后N天(默认时间)的联系手机,该手机户主的身份证也有订该次车”。关系分析的灵活度的提高,由于引入了关系模型的概念,关系分析过程中可以灵活的调用一个或多个关系模型,通过传入不同的参数得到不同的关系分析结果。
技术领域
本发明涉及一种人员关系图谱构建和分析方法,具体是一种基于图计算的人员关系构建和分析方法。
背景技术
目前关系图谱构建和分析的方法,一般基于固定数据模型提取,以下对人员同车关系在基于固定数据模型的提取方式说明:
方式一:该目标手机乘车前后3天(默认时间)的联系手机,该手机户主的身份证也有订该次车;
方式二:该车次上与目标起始地相同的人员,其与目标同入住相同旅业;
方式三:除本次外,在3个月内(默认时间)与目标坐过同一趟车(同一航班)的人;
方式四:模糊查询方式,该车次上与目标起始地相同的人员,其身份证号码前六位与目标相同;
方式五:模糊查询方式,目标临近座位,起始地相同,且购票时间相近(如10分钟内)。
目前基于固定数据模型提取关系数据的方法,是通过将关系数据持久化,再对外提供查询服务的方法,很难支撑复杂多变的关系分析场景。比如方式一中,当需要把“乘车前后3天”换成“乘车前后5天”时,就需要对关系数据进行重新提取,造成大量的关系运算和存储开销;又比如方式三中,“在3个月内”换成“在1个月内”,同样存在关系数据需要重新生成的问题。
因此,本发明提供了一种基于图计算的人员关系构建和分析方法,以解决上述背景技术中提出的问题。
发明内容
针对目前方法的不足,本发明运用了图数据库在图运算的先天优势,将关系分析转换成图计算,基于深度优先遍历算法和广度优先遍历算法,将关系分析实时化,使得最终需要呈现的关系数据是通过图计算得到了,解决了关系数据持久化带来的分析受限问题。
为实现上述目的,本发明提供如下技术方案:
本方案采用百度开源的HugeGraph作为图数据库,HugeGraph是一款易用、高效、通用的开源图数据库系统(Graph Database,GitHub项目地址),实现了Apache TinkerPop3框架及完全兼容Gremlin查询语言,具备完善的工具链组件,助力用户轻松构建基于图数据库之上的应用和产品。
HugeGraph支持百亿以上的顶点和边快速导入,并提供毫秒级的关联关系查询能力 (OLTP),并可与Hadoop、Spark等大数据平台集成以进行离线分析(OLAP)。
一种基于图计算的人员关系构建,包括如下步骤:
一、关系数据的提取;
a)通过SparkSql从内外部系统数据库中,提取人员基本信息、轨迹信息、话单信息等,将人员、列车、酒店、手机号码等实体作为顶点,将事件或从属关系作为边,将关系型数据库转换为图数据文件,写入到分布式存储系统HDFS中;
b)借助HugeGraph提供的HugeGraph-Loader工具,将图数据文件导入到图数据库中。
二、关系模型的构建;通过SpringBoot+Vue+ElementsUi的前后端分离框架,前端通过Vue+ElementUI配置关系模型,后端通过SpringBoot开发的持久化接口实现关系模型的持久化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州金越软件技术有限公司,未经广州金越软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011618324.3/2.html,转载请声明来源钻瓜专利网。