[发明专利]一种文本知识提取方法、装置、设备及存储介质在审
申请号: | 201910178007.5 | 申请日: | 2019-03-08 |
公开(公告)号: | CN109871542A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 王涛;王静;张凡龙 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于知识图谱的文本知识提取方法,涉及知识图谱技术领域,为每个实体构建两种表示数据,基于结构的表示以及基于描述的表示,将实体结构化数据与实体描述数据进行信息融合,基于结构的表示能够挖掘实体名字中有相同单词的相似实体之间可能存在的潜在关系,而描述表示能够作为知识图谱中置信度较高的结构化信息的辅助帮助模型构建更准确的知识表示,将实体的描述信息与知识图谱自身的结构信息结合起来,充分考虑了实体描述信息中深入的细节描述作为知识图谱中已有结构化信息的辅助与补充,构建了更全面的知识表示。本发明还公开了一种基于知识图谱的文本知识提取装置、设备及一种可读存储介质,具有上述有益效果。 | ||
搜索关键词: | 图谱 文本知识 结构化信息 描述信息 知识表示 构建 可读存储介质 表示数据 存储介质 结构信息 描述数据 模型构建 潜在关系 实体结构 提取装置 细节描述 信息融合 置信度 单词 挖掘 名字 补充 帮助 | ||
【主权项】:
1.一种基于知识图谱的文本知识提取方法,其特征在于,包括:对输入的知识图谱进行数据筛选,得到实体描述的文本信息;将所述实体描述的文本信息输入至描述表示构建模型进行基于描述的知识表示的构建,生成实体描述数据;其中,所述描述表示构建模型为预训练的基于神经网络的描述编码器;将根据所述知识图谱提取的实体结构化数据与所述实体描述数据进行信息融合,得到融合数据,并将所述融合数据作为所述知识图谱数据的知识表示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910178007.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于多语言多领域的命名实体识别方法
- 下一篇:一种意图获取方法及系统