[发明专利]知识图谱构建方法、装置和可读存储介质在审
| 申请号: | 202111676378.X | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114398494A | 公开(公告)日: | 2022-04-26 |
| 发明(设计)人: | 陈伟;陶冶 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332;G06F16/33 |
| 代理公司: | 北京星通盈泰知识产权代理有限公司 11952 | 代理人: | 夏晶 |
| 地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 图谱 构建 方法 装置 可读 存储 介质 | ||
本发明公开了知识图谱构建方法、装置和可读存储介质,其方法包括获取待标注数据,利用知识获取模型从所述待标注数据中提取图谱知识,并将所述图谱知识转换成待确认的问题;利用信息传播网络将所述待确认问题推送给用户进行作答;获取用户作答结果,基于所述用户作答结果构建知识图谱。本发明公开实施例提供的技术方案,能够针对用户之间的信息的动态交互生成信息传播网络,并利用信息传播网络构建社交知识图谱。
技术领域
本发明涉及计算机技术领域,具体是知识图谱构建方法、装置和可读存储介质。
背景技术
作为人工智能技术的一项重要分支,知识图谱是将海量、庞杂的知识信息,转化为实体、关系、属性等构成的结构化的三元组的形式,从而有利于知识的检索、分析、可视化等方面的应用。
目前,知识图谱的构建主要是基于语料库,基于预定义的图谱结构,利用标注工具对语料文本中的知识进行大量人工标注,继而利用标注的语料文本进行知识提取模型的训练;经训练合格后,利用知识提取模型从未经标注的其它语料中自动提取结构化的三元组形态的知识信息,再将提取的知识信息构建为知识图谱。
随着技术的发展,公开号为CN111753021A、CN111753022A等现有专利公开了知识获取模型利用标注的语料文本提取图谱知识,并将其转换为待确认的问题,推送给用户进行作答,基于做答结果构建知识图谱。以上问答式的知识图谱构建机制简化了知识图谱构建的复杂程度,提高构建效率。
随着以电子邮件、微博、即时聊天等为代表的社交网络媒体应用迅速普及,用户参与踊跃,正成为人们获取信息,表达意见和交流观点的重要场所。由于社交网络与用户社会关系的高度结合性及其信息传播的快速实时性,因此也成为了生成、传播、获取知识信息的重要途径。如果能够对社交网络媒体上面传播的知识信息构建知识图谱,显然能够极大扩展知识图谱的应用场景和覆盖范围,
然而,由于社交网络兼具关系网络和动态交互网络,社交网络上面传播的知识信息,具备多变性、实效性、碎片化的特征,传统的知识图谱构建方面无法充分适应其中的知识信息及其传播的规律。
可见,如何针对社交网络媒体中用户之间的信息动态交互,准确高效构建知识图谱,成为了现有技术中亟待解决之问题。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明公开提供了知识图谱构建方法、装置和可读存储介质。
为了实现上述发明目的,在第一个方面,本发明提供了知识图谱构建方法,包括:
获取待标注数据,利用知识获取模型从所述待标注数据中提取图谱知识,并将所述图谱知识转换成待确认的问题;
利用信息传播网络将所述待确认问题推送给用户进行作答;
获取用户作答结果,基于所述用户作答结果构建知识图谱。
在一些实施例中,所述利用知识获取模型从所述待标注数据中提取图谱知识,并将所述图谱知识转换成待确认的问题,包括:
获取待标注数据,通过人工标注界面对所述待标注数据中的部分信息数据进行标注,生成数据标注结果;
基于所述数据标注结果对知识获取模型进行训练,并利用训练后的知识获取模型从所述待标注数据中提取图谱知识;
将所述图谱知识转换成待确认的问题。
在一些实施例中,所述利用信息传播网络将所述待确认问题推送给用户进行作答,包括:
获取用户数据,基于所述用户数据与所述待标注数据计算传播影响力,并基于所述传播影响力确定传播数据;
将所述传播数据与所述待确认问题进行绑定,生成转发信息;
利用所述信息传播网络将所述转发信息推送给所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111676378.X/2.html,转载请声明来源钻瓜专利网。





