[发明专利]一种基于云计算的知识图谱架构实现方法及系统在审
申请号: | 201911413712.5 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111259086A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 张福强 | 申请(专利权)人: | 的卢技术有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/36;G06F16/951 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 王晓东 |
地址: | 211103 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 计算 知识 图谱 架构 实现 方法 系统 | ||
1.一种基于云计算的知识图谱架构实现方法,其特征在于:包括以下步骤,
数据获取模块(100)获取数据资源并存储;
实体抽取模块(200)从数据资源中进行实体抽取,得到实体信息;
将实体信息传输至知识存储模块(400),并进行存储;
实体关联模块(300)从数据资源中进行实体关系抽取;
将建立的实体关系传输至知识存储模块(400),并进行存储;
图谱展示模块(500)根据知识存储模块(400)存储内容进行数据展示。
2.如权利要求1所述的基于云计算的知识图谱架构实现方法,其特征在于:所述数据获取模块(100)通过解析网页来获取数据资源。
3.如权利要求2所述的基于云计算的知识图谱架构实现方法,其特征在于:所述解析网页还包括以下步骤,
通过http请求获取网页,并将获取到的网页进行解析,从而得到网页中所有的链接地址;
将得到的所有的url放入消息队列中;
读取存放url的消息队列从而获取url,根据url请求网页内容,获取到网页的内容数据,将得到的数据信息存储在数据库中;
从消息队列中依次取网页的url链接地址,并重复以上步骤。
4.如权利要求2或3所述的基于云计算的知识图谱架构实现方法,其特征在于:所述实体抽取模块(200)进行实体抽取还包括以下步骤,
将接收到的数据资源进行转化为Html Document格式;
从Document对象中提取对应的实体信息。
5.如权利要求4所述的基于云计算的知识图谱架构实现方法,其特征在于:所述实体信息包括实体名称以及属性信息,属性信息包括实体基本属性、实体标签和实体描述信息。
6.如权利要求5所述的基于云计算的知识图谱架构实现方法,其特征在于:所述实体关联模块(300)的实体关系抽取还包括以下步骤,
读取从数据获取模块(100)接收的数据资源;
解析数据资源,得到该数据资源与其他实体的关系;
根据该数据资源与其他实体的关系,结合实体抽取模块(200)中的抽取的实体进行关系关联,建立实体关系。
7.如权利要求5或6所述的基于云计算的知识图谱架构实现方法,其特征在于:所述知识存储模块(400)基于图数据库Neo4j实现,进行数据的存储。
8.如权利要求7所述的基于云计算的知识图谱架构实现方法,其特征在于:所述知识存储模块(400)的实现还包括以下步骤,
根据实体关联模块(300)的建立的实体关系,构建实体关系语句;
执行实体关系语句,构建实体之间的关联。
9.一种基于云计算的知识图谱架构实现系统,其特征在于:包括,
数据获取模块(100),所述数据获取模块(100)为一套爬虫系统,能够从网络上爬取数据资源并存储;
实体抽取模块(200),所述实体抽取模块(200)能够从数据资源中进行进行实体的抽取;
实体关联模块(300),所述实体关联模块(300)能够从数据资源中进行实体关系的抽取;
知识存储模块(400),所述知识存储模块(400)用于存储抽取出来的实体数据和实体关系;
图谱展示模块(500),所述图谱展示模块(500)能够根据知识存储模块(400)存储内容进行数据展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于的卢技术有限公司,未经的卢技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911413712.5/1.html,转载请声明来源钻瓜专利网。