[发明专利]知识图谱生成方法、装置、数据处理设备及存储介质有效
申请号: | 201911336710.0 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111125376B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 吴明平;梁新敏;陈羲;吴明辉 | 申请(专利权)人: | 秒针信息技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06Q30/0601 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 刘静 |
地址: | 100000 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 生成 方法 装置 数据处理 设备 存储 介质 | ||
本申请提供一种知识图谱生成方法、装置、数据处理设备及存储介质。该方法根据第一知识图谱中各用户的特征向量与第二知识图谱中各用户的特征向量,将第一知识图谱中的用户与第二知识图谱中的用户进行融合,继而使得融合后的知识图谱能够统一表示同一用户在第一类型数据以及第二类型数据中的属性信息以及行为信息,继而能够提高基于该融合后的知识图谱的各项策略的执行效果。
技术领域
本申请涉及数据处理领域,具体而言,涉及一种知识图谱生成方法、装置、数据处理设备及存储介质。
背景技术
随着互联网的发展,网络数据内容呈现爆炸式增长的态势。知识图谱以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。
例如,通过知识图谱在电商领域进行商品推荐也变得越来越广泛。然而,通过知识图谱在电商领域进行商品推荐时,针对一些不仅拥有线上门店,而且还拥有线下门店的品牌,由于其线下门店与线上门店的销售模式的差异,使得线上门店与线下门店之间,无论是数据的类型还是数据的组织方式都不相同。数据的类型的不同以及数据组织方式的不能导致线下门店的数据与线上门店的数据不能很好的通过知识图谱进行整合用以分析用户的消费行为。
发明内容
为了克服现有技术中的至少一个不足,本申请实施例的目的之一在于提供一种知识图谱生成方法,应用于数据处理设备,所述方法包括:
获取记录有用户属性及行为信息的第一类型数据以及第二类型数据;
生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱;
获取所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量;
根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度;
将所述相似度大于预设融合阈值的第一知识图谱中的用户与第二知识图谱中的用户进行融合,获得融合后的知识图谱。
可选地,所述获取所述第一知识图谱中的用户的特征向量与所述第二知识图谱中的用户的特征向量的步骤,包括:
通过图嵌入算法对第一知识图谱中各用户的数据以及第二知识图谱中各用户的数据进行分析,获得所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量。
可选地,所述根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度的步骤,包括:
根据所述特征向量,通过余弦相似度算法计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度。
可选地,所述生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱的步骤,包括:
基于预设的数据关系的描述,对所述第一类型数据以及所述第二类型数据进行解析,生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱。
可选地,所述第一类型数据与所述第二类型数据属于同一品牌,其中,第一类型数据为该品牌线上门店的用户访问数据,所述第二类型数据为该品牌线下门店的用户访问数据。
本申请实施例的目的之二在于提供一种知识图谱生成装置,应用于数据处理设备,该知识图谱生成装置包括数据获取模块、图谱生成模块、向量获取模块、相似度计算模块以及用户融合模块;
所述数据获取模块用于获取记录有用户属性及行为信息的第一类型数据以及第二类型数据;
所述图谱生成模块用于生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱;
所述向量获取模块用于获取所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于秒针信息技术有限公司,未经秒针信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911336710.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能的计算机显示屏
- 下一篇:一种汽车有限元模型组装方法