[发明专利]一种基于深度学习的人物关系图谱构建方法及系统有效
申请号: | 202010358399.6 | 申请日: | 2020-04-29 |
公开(公告)号: | CN111538849B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 李瑞轩;张纯鹏;辜希武;李玉华 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/34;G06F40/186;G06N3/0455;G06N3/08 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 人物 关系 图谱 构建 方法 系统 | ||
本发明公开了一种基于深度学习的人物关系图谱构建方法及系统,所属方法包括:爬取电子文本,得到初始语料,所述初始语料包括人物信息;对所述初始语料中人物属性进行标注,得到样本数据并进行预处理;设置模型超参数,结合预处理后的样本数据建立深度学习模型;定义具有层次化的人物信息模板,并基于所述深度学习模型提取人物属性信息,对所述人物属性信息进行筛选,并填充所述人物信息模板;利用填充好的人物信息模板以及预先定义好的人物关系实体,构建人物关系图谱。如此,本发明能够解决多值人物属性以及存在于分散文本的人物关系发现与提取问题,进而提高了人物关系图谱构建的准确性和信息丰富度。
技术领域
本发明涉及人工智能技术领域,更具体地,涉及一种基于深度学习的人物关系图谱构建方法及系统。
背景技术
人物关系图谱,即从文本中抽取出人物的各种属性,以结构化的形式描述客观世界中与人物相关的概念、实体及其关系。伴随着互联网的发展,信息呈现爆炸式增长的态势,依靠人工分析、处理和理解海量文本数据,已经不现实。人物关系图谱为人们从海量文本中高效分析、处理和理解人物之间的关系提供了解决方案,在金融、法律、科研等多个行业扮演着越来越重要的角色,为智能问答、决策分析等应用提供可靠的依据,成为了学术界和工业界的研究热点。
现有的人物关系图谱的构建主要包含以下步骤:
1.人物关系图谱的模式层构建,从最顶层的概念开始定义人物的各种属性,以及人物之间的各种关系。
2.知识抽取,利用模式识别或者机器学习等相关技术自动或者半自动的从一些开放的多源数据中提取人物关系图谱的关系、人物属性等要素;知识抽取的准确率和召回率将直接影响人物关系图谱的质量。
3.模式填充,将知识抽取得到的关系及人物属性匹配填充到所构建的模式层中,完成数据的填充。
以上流程构建的人物关系图谱,存在着一些问题,即人物属性值大多为单值,无法准确表示出含有多值属性的情况;其次人物关系的提取大多直接从文本中发现人物之间的关系,然而大部分情况下,人物关系信息零散的分布在多个文本中,无法直接提取到。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种基于深度学习的人物关系图谱构建方法及系统,其目的在于解决现有的人物关系图谱构建方法无法准确表示出含有多值属性,以及如何发现与提取存在于分散文本的人物关系的技术问题。
为实现上述目的,本发明提供了一种基于深度学习的人物关系图谱构建方法,包括以下步骤:
S1:爬取电子文本,得到初始语料,所述初始语料包括人物信息;对所述初始语料中人物属性进行标注,得到样本数据并进行预处理;
S2:设置模型超参数,结合步骤S1预处理后的样本数据建立深度学习模型;
S3:定义具有层次化的人物信息模板,所述人物信息模板包括多个元组,所述元组由一个或多个人物属性组成;基于所述深度学习模型提取人物属性信息,对所述人物属性信息进行筛选,并填充所述人物信息模板;
S4:利用步骤S3填充好的人物信息模板以及预先定义好的人物关系实体,构建人物关系图谱。
进一步地,所述步骤S1中对样本数据进行预处理包括:
S11:定义人物属性标签集合,记为L={l1,l2,…,lm},其中m为标签数量;
S12:将每个样本数据的文本信息e,按照句子s进行分割,即e={s1,s2,…,sp},其中p为句子数量;再对句子s,按照每个字符t进行分割,即s={t1,t2,…,tq},其中q为句子中字符的数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010358399.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种乙酰酯化大米淀粉纳米晶复合膜及其制备方法
- 下一篇:疲劳试验工装