[发明专利]基于知识图谱的描述文本生成方法、装置及电子设备在审
申请号: | 202010310669.6 | 申请日: | 2020-04-20 |
公开(公告)号: | CN113536742A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 程丽颖;邴立东;司罗 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F16/36 |
代理公司: | 北京市惠诚律师事务所 11353 | 代理人: | 刘子敬 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 描述 文本 生成 方法 装置 电子设备 | ||
本发明实施例提供了一种基于知识图谱的描述文本生成方法、装置及电子设备,该方法包括:获取知识图谱;从知识图谱中提取多个不同角度的图结构关系特征,生成第一图嵌入数据;对所述第一图嵌入数据进行基于自然语言的解码处理,生成描述文本。本发明实施例通过将知识图谱作为输入数据,提取知识图谱中的图结构关系特征,然后通过机器学习模型的编解码处理,生成基于自然语言的文本描述。在上述的自然语言转换过程中,基于知识图谱中的图结构关系来驱动编解码处理,从而能够充分抓取到知识图谱中的内容要点,生成能够更加充分地体现出知识图谱的主要内容的自然语言描述。
技术领域
本申请涉及一种基于知识图谱的描述文本生成方法、装置及电子设备,属于计算机技术领域。
背景技术
现实生活和商业实际应用中,经常需要将一些结构化的数据进行自然语言的描述,从而让人们能够快速了解到这些数据表示的含义。随着知识图谱技术的发展,大量的信息以知识图谱的形态存储在数据库中,当需要获知某些信息内容时,需要将这些知识图谱形态的数据转换为自然语言的描述文档,从而便于用户快速了解信息内容。
在现有技术中,在知识图谱数据到自然语言的转化过程中,一般将知识图谱中信息转换为信息序列,然后用序列到序列的文本生成模型生成描述文本。这样的生成方式会丢失较多的信息,无法获得理想的文本描述。
发明内容
本发明实施例提供一种基于知识图谱的描述文本生成方法、装置及电子设备,以基于知识图谱生成更加丰富的文本描述内容。
为了实现上述目的,本发明实施例提供了一种基于知识图谱的描述文本生成方法,包括:
获取知识图谱;
从知识图谱中提取多个不同角度的图结构关系特征,生成第一图嵌入数据;
对所述第一图嵌入数据进行基于自然语言的解码处理,生成描述文本。
本发明实施例还提供了一种基于知识图谱的描述文本生成装置,包括:
图数据获取模块,用于获取知识图谱;
编码器模块,用于从所述知识图谱中提取多个不同角度的图结构关系特征,生成第一图嵌入数据;
解码器模块,用于对所述第一图嵌入数据进行基于自然语言的解码处理,生成描述文本。
本发明实施例还提供了一种电子设备,包括:
存储器,用于存储程序;
处理器,用于运行所述存储器中存储的所述程序,以执行前述的基于知识图谱的描述文本生成方法。
本发明实施例通过将知识图谱作为输入数据,提取知识图谱中的图结构关系特征,然后通过机器学习模型的编解码处理,生成基于自然语言的文本描述。在上述的自然语言转换过程中,基于知识图谱中的图结构关系来驱动编解码处理,从而能够充分抓取到知识图谱中的内容要点,生成能够更加充分地体现出知识图谱的主要内容的自然语言描述。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
图1为本发明实施例的示例性的模型框架结构示意图;
图2为本发明实施例的多图卷积神经网络层的模型结构示意图;
图3为本发明实施例的图编码器的图结构关系特征处理的示意图;
图4为本发明实施例的一个知识图谱的检索示例的示意图;
图5为本发明实施例的基于知识图谱的描述文本生成方法的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010310669.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基站天线及通信基站系统
- 下一篇:一种自适应自对中的动态导向装置