[发明专利]一种知识图谱自动嵌入的方法及系统在审
申请号: | 202110807811.2 | 申请日: | 2021-07-16 |
公开(公告)号: | CN113505242A | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 陈海林;张蓬;赵绪龙 | 申请(专利权)人: | 珍岛信息技术(上海)股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/332 |
代理公司: | 合肥正则元起专利代理事务所(普通合伙) 34160 | 代理人: | 匡立岭 |
地址: | 200000 上海市静安区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 自动 嵌入 方法 系统 | ||
1.一种知识图谱自动嵌入系统,其特征在于,包括企业数据库、数据采集端、数据处理模块、知识建模模块、可视化模块、图谱服务模块以及信息查询模块;
所述企业数据库用于存储企业信息以及企业对应的产品信息;
所述知识建模模块用于根据企业数据库内存储的企业信息以及产品信息进行建立知识图谱;
所述数据采集端用于实现企业信息以及产品信息的提取;
所述数据处理模块用于对数据采集端提取的信息进行处理;
所述图谱服务模块用于辅助完成知识图谱的建立;
所述可视化模块用于用户通过信息查询模块进行信息查询时进行可视化显示。
2.根据权利要求1所述的一种知识图谱自动嵌入系统,其特征在于,所述企业信息包括企业所属行业、节点属性和企业标签。
3.根据权利要求1所述的一种知识图谱自动嵌入系统,其特征在于,知识建模模块进行知识图谱的建立过程包括:
数据采集端从企业数据库内提取企业数据,并将企业数据发送至数据处理模块进行处理;
知识建模模块确定节点属性或标签;
确定关联关系;
通过节点链接技术,实现围绕节点的多种类型数据的关联存储;
采用平移距离模型、语义匹配模型等向量嵌入方法和评分函数,实现图谱的自动嵌入。
4.根据权利要求3所述的一种知识图谱自动嵌入系统,其特征在于,节点确定的过程包括:
多源数据融合:根据企业数据库内的数据,确定企业行业的分组,并根据行业分组对属性计算编辑距离和Jaccard相似性;
对文档通过tf-idf找出关键词,再通过余弦相似度计算文档的相似程度;
根据Jaccard相似性和文档的相似程度,结合逻辑回归或K-Means聚类算法实现节点确定。
5.根据权利要求3所述的一种知识图谱自动嵌入系统,其特征在于,知识建模模块利用节点与节点的关系或者自定义节点与节点的关系来描述知识图谱内各个节点数据之间的关系;所述关系包括生产关系、上下游关系和包含关系。
6.根据权利要求1所述的一种知识图谱自动嵌入系统,其特征在于,图谱服务模块基于企业数据库,通过企业数据清洗与治理,获取企业产业属性,结合产业链关系模板,生成企业实体或产品实体,并结合外部数据企业属性匹配形成的新产品实体,辅助完成企业产品产业链关系图谱的建立。
7.根据权利要求1所述的一种知识图谱自动嵌入系统,其特征在于,用户通过输入与企业相关的关键词至信息查询模块,信息查询模块将用户输入的关键词进行确定属性或者标签;
信息查询模块将确定的属性或者标签输入知识图谱,获取属性或者标签对应的节点进而链接企业数据库;
知识图谱将企业数据库内与输入的关键词有联系的信息通过可视化模块进行展示。
8.一种知识图谱自动嵌入的方法,其特征在于,包括以下步骤:
步骤一:知识建模模块发送信息提取信号至数据采集端,数据采集端从企业数据库提取企业数据;并将企业数据发送至数据处理模块进行处理;
步骤二:预处理的过程包括节点的确定以及确定节点属性或标签;
步骤三:确定关联关系;
步骤四:通过节点链接技术,实现围绕节点的多种类型数据的关联存储;
步骤五:采用平移距离模型、语义匹配模型等向量嵌入方法和评分函数,实现图谱的自动嵌入;
步骤六:用户通过输入与企业相关的关键词至信息查询模块,信息查询模块将用户输入的关键词进行确定属性或者标签;
信息查询模块将确定的属性或者标签输入知识图谱,获取属性或者标签对应的节点进而链接企业数据库;
步骤七:知识图谱将企业数据库内与输入的关键词有联系的信息通过可视化模块进行展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珍岛信息技术(上海)股份有限公司,未经珍岛信息技术(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110807811.2/1.html,转载请声明来源钻瓜专利网。