[发明专利]文本到知识图谱实体的映射方法、装置、设备及存储介质在审

专利信息
申请号: 202110848694.4 申请日: 2021-07-27
公开(公告)号: CN113297854A 公开(公告)日: 2021-08-24
发明(设计)人: 黄宇翔;王健宗;倪子凡 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F40/242;G06N3/04
代理公司: 深圳市力道知识产权代理事务所(普通合伙) 44507 代理人: 张传义
地址: 518057 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 知识 图谱 实体 映射 方法 装置 设备 存储 介质
【说明书】:

本申请涉及文本语义处理领域,具体涉及文本到知识图谱实体的映射方法、装置、设备及存储介质,通过对知识图谱进行拓展和构建向量空间实现了文本到实体的映射。从预设的语料库中获取知识图谱中的实体的描述性文本并将其用于对知识图谱进行拓展。以拓展知识图谱中的实体作为起始节点通过随机游走得到预设数量个预设长度的随机游走序列,将其输入Skip‑Gram模型对模型进行训练。将知识图谱中的实体输入训练好的Skip‑Gram模型输出的实体词向量并与模型的参数生成知识图谱向量空间。将待映射的文本输入Multi‑Sense LSTM模型得到的预测词向量在向量空间中确定最接近的实体词向量,根据最接近的实体词向量确定映射的实体。

技术领域

本申请涉及互联网技术领域,尤其涉及一种文本到知识图谱实体的映射方法、装置、计算机设备及存储介质。

背景技术

在自然语言处理领域,常常需要将自然语言的语句和文本对应到相关的动作、概念或者知识中。知识图谱作为是语义网络的知识库,若将文本和知识图谱中的实体关联则可以完成问答、信息检索等任务。将文本映射到知识图谱实体的目的是对文本的重点进行简洁的表述。例如,输入文本“无法入睡,太累以致无法思考”将映射到医学知识图谱中的“失眠”实体。现有技术未考虑利用文本特征改善实体向量。

发明内容

本申请提供了一种文本到知识图谱实体的映射方法、装置、计算机设备及存储介质,通过获取知识图谱实体的描述性文本对知识图谱进行了拓展,并将知识图谱所转化的向量空间作为文本映射到实体的目标,有效地实现了文本到实体的映射。

第一方面,本申请提供了一种文本到知识图谱实体的映射方法,所述方法包括:

针对知识图谱中的实体,从预设的语料库中获取所述实体的描述性文本,根据所述描述性文本对所述知识图谱进行拓展,得到拓展知识图谱;

以所述拓展知识图谱中的实体为起始节点,通过随机游走得到预设数量个预设长度的随机游走序列;

将所述随机游走序列输入Skip-Gram模型,对所述Skip-Gram模型进行训练,得到训练好的Skip-Gram模型,将所述知识图谱中的实体输入所述训练好的Skip-Gram模型,输出实体词向量;

根据所述实体词向量和所述训练好的Skip-Gram模型的参数生成知识图谱向量空间;

将待映射的文本输入训练好的Multi-Sense LSTM模型,得到第一预测词向量;

根据所述第一预测词向量在所述知识图谱向量空间中确定最接近的实体词向量,根据所述最接近的实体词向量确定所述待映射的文本映射的知识图谱实体。

第二方面,本申请还提供了一种文本到知识图谱实体的映射装置,所述装置包括:

知识图谱拓展模块,用于针对知识图谱中的实体,从预设的语料库中获取所述实体的描述性文本,根据所述描述性文本对所述知识图谱进行拓展,得到拓展知识图谱;

随机游走序列生成模块,用于以所述拓展知识图谱中的实体为起始节点,通过随机游走得到预设数量个预设长度的随机游走序列;

实体词向量生成模块,用于将所述随机游走序列输入Skip-Gram模型,对所述Skip-Gram模型进行训练,得到训练好的Skip-Gram模型,将所述知识图谱中的实体输入所述训练好的Skip-Gram模型,输出实体词向量;

知识图谱向量空间生成模块,用于根据所述实体词向量和所述训练好的Skip-Gram模型的参数生成知识图谱向量空间;

预测词向量生成模块,用于将待映射的文本输入训练好的Multi-Sense LSTM模型,得到预测词向量;

实体映射模块,用于根据所述预测词向量在所述知识图谱向量空间中确定最接近的实体词向量,根据所述最接近的实体词向量确定所述待映射的文本映射的知识图谱实体。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110848694.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top