[发明专利]一种知识图谱构建方法及构建系统在审
申请号: | 202210584768.2 | 申请日: | 2022-05-26 |
公开(公告)号: | CN114925171A | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 尹莉丽 | 申请(专利权)人: | 上海麦开信息科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 北京中索知识产权代理有限公司 11640 | 代理人: | 朱晓丹 |
地址: | 202172 上海市崇明区新村乡*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 构建 方法 系统 | ||
1.一种知识图谱构建系统,其特征在于,包括数据挖掘模块、逻辑连接建立模块、体系连接模块和应用模块;
数据挖掘模块包括信息挖掘单元和分类单元,采用集成爬取工具对用户信息挖掘以及产品信息的挖掘,得到相关信息点,将信息点分类为实体(实体1、实体2...实体n)和属性(属性1、属性2...属性n);
逻辑连接建立模块包括数据库建立单元、数据整合单元和信息抽取单元,通过对实体和属性进行信息提取、合并,得到结构化数据集和非结构化数据集,再分别对两个数据集进行数据整合和信息抽取,提取出相关联的实体、关系、属性信息,并以SPO三元组形式形成完整的数据库;
体系连接模块包括信息融合单元、信息更新单元和知识图谱构建单元,通过在同一框架规范下进行信息的异构数据整合,对不同实体的要素进行信息融合,消除实体、关系、属性与事实对象之间的歧义,达到信息融合的目的,最终形成知识图谱;
应用模块包括输入单元、智能搜索单元、语音搜索单元和输出单元。
2.根据权利要求1所述的一种知识图谱构建系统,其特征在于,用户信息包括商家的背景信息、作品风格、销售策略和市场评价。
3.根据权利要求1所述的一种知识图谱构建系统,其特征在于,产品信息包括产品特点、受众群体、市场反馈和销售记录。
4.根据权利要求1所述的一种知识图谱构建系统,其特征在于,逻辑连接建立模块包括模式连接与数据连接;数据连接主由一系列的事实组成,而信息点将以事实为单位进行存储;模式连接构建在数据连接上,通过最终的数据库来规范数据连接的一系列事实表达。
5.根据权利要求1所述的一种知识图谱构建系统,其特征在于,信息抽取单元主要是面向开放的链接数据,通过自动化的技术抽取出可用的信息单元,有三个主要工作:实体抽取、关系抽取和属性抽取。
6.根据权利要求1所述的一种知识图谱构建系统,其特征在于,实体抽取是从结构化数据集和非结构化数据集中自动识别出命名实体。由于实体是知识图谱中的最基本元素,其抽取的完整性、准确、召回率等将直接影响到知识库的质量。
7.根据权利要求1所述的一种知识图谱构建系统,其特征在于,关系抽取通过提前建立关系模型,设置预定义的语法与规则,解决实体间语义链接的问题。
8.根据权利要求1所述的一种知识图谱构建系统,其特征在于,知识图谱构建单元需要进行实体对齐,将其相关属性进行交叉连接,做出修正后,再完成本体构建;同时知识图谱通过知识更新单元定期进行自我修正。
9.根据权利要求1所述的一种知识图谱构建系统,其特征在于,应用与特定领域的垂直行业信息分析。
10.一种包括权利要求1-9任一项所述的知识图谱构建方法,其特征在于,步骤如下:。
S1、采用集成爬取工具对用户信息挖掘以及产品信息的挖掘,得到相关信息点,将信息点分类为实体(实体1、实体2...实体n)和属性(属性1、属性2...属性n);
S2、通过对实体和属性进行信息提取、合并,得到结构化数据集和非结构化数据集,再分别对两个数据集进行数据整合和信息抽取,提取出相关联的实体、关系、属性信息,完成模式连接与数据连接,以SPO三元组形式形成完整的数据库;
S3、通过在同一框架规范下进行信息的异构数据整合,对不同实体的要素进行信息融合,消除实体、关系、属性与事实对象之间的歧义,达到信息融合的目的,最终形成知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海麦开信息科技有限公司,未经上海麦开信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210584768.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:绿光打标结构和激光打标装置
- 下一篇:一种微电网配电柜用散热结构及散热方法