[发明专利]一种目标对象多维图谱的生成方法、装置和存储介质在审
申请号: | 202210112165.2 | 申请日: | 2022-01-29 |
公开(公告)号: | CN114547331A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 佟德超 | 申请(专利权)人: | 北京金堤科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 贾银秋 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 对象 多维 图谱 生成 方法 装置 存储 介质 | ||
1.一种目标对象多维图谱的生成方法,包括:
响应于接收到针对目标对象的搜索请求,获取与所述目标对象对应的非企业相关数据和企业相关数据,所述非企业相关数据包括与所述目标对象具有亲属关系、好友关系和配偶关系中的至少之一的至少一个第一关联对象的相关数据,所述企业相关数据包括与所述目标对象具有投资关系和/或任职关系的至少一个第二关联对象的相关数据;以及
基于所述非企业相关数据和所述企业相关数据,生成以所述目标对象、所述至少一个第一关联对象和所述至少一个第二关联对象为节点、以及对应的关联关系为边的目标对象多维图谱。
2.根据权利要求1所述的方法,其中,
所述关联关系包括与所述目标对象具有的投资关系和与所述目标对象具有的任职关系以及与所述目标对象具有以下关系中的至少一项的:亲属关系、好友关系、配偶关系。
3.根据权利要求2所述的方法,其中,所述获取与所述目标对象对应的非企业相关数据和企业相关数据,包括:
从多个数据源获取与所述目标对象对应的非企业相关数据;和/或
从企业信息库中获取与所述目标对象对应的企业相关数据。
4.根据权利要求3所述的方法,其中,所述从多个数据源获取与目标对象对应的非企业相关数据,包括:
从所述多个数据源获取目标对象的第一基本数据和关于目标对象的第一关系数据;
根据所述第一基本数据和所述第一关系数据,确定与所述目标对象具有亲属关系和/或好友关系和/配偶关系的至少一个第一相关对象;
获取每个第一相关对象分别对应的第二基本数据和第二关系数据。
5.根据权利要求4所述的方法,其中,在所述获取每个第一相关对象分别对应的第二基本数据和第二关系数据之后,还包括:
针对所述至少一个第一相关对象中的每个,获取并根据获取的当前相关对象对应的第二基本数据和第二关系数据,确定与当前相关对象具有亲属关系和/或好友关系和/或配偶关系的至少一个第二相关对象;
获取每个第二相关对象分别对应的第三基本数据和第三关系数据。
6.根据权利要求4所述的方法,其中,从多个数据源获取与所述目标对象对应的非企业相关数据,包括:当所述数据源包括第一数据源时,
从所述第一数据源获取与所述目标对象具有亲属关系和/或好友关系和/或配偶关系的非企业相关数据。
7.根据权利要求6所述的方法,其中,在获取与所述目标对象具有亲属关系和/或好友关系和/或配偶关系的非企业相关数据之后,还包括:
针对所述目标对象,通过预设正则表达式和预设抽取组合模型,对与所述目标对象具有亲属关系和/或好友关系和/或配偶关系的非企业相关数据进行关系抽取,生成对应的关系三元组,
其中,所述关系三元组用于表征所述目标对象与相关对象之间的亲属关系和/或好友关系和/或配偶关系。
8.根据权利要求3所述的方法,其中,所述从多个数据源获取与所述目标对象对应的非企业相关数据之后,还包括:
对所述非企业相关数据进行数据处理,得到处理后的非企业相关数据。
9.根据权利要求8所述的方法,其中,所述对所述非企业相关数据进行数据处理,得到处理后的非企业相关数据,包括:
对所述非企业相关数据进行脏数据过滤和脏数据清洗,得到处理后的非企业相关数据。
10.根据权利要求9所述的方法,其中,
所述非企业相关数据中的脏数据包括以下至少一项:爬取所述非企业相关数据时获取的超文本标记语言标签、所述非企业相关数据中包含的无法识别的乱码和冗余的标点符号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金堤科技有限公司,未经北京金堤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210112165.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:http请求过程数据展示方法及装置
- 下一篇:后台数据展示方法及装置