[发明专利]基于知识图谱的对齐方法、装置及介质有效
申请号: | 201811351586.0 | 申请日: | 2018-11-14 |
公开(公告)号: | CN109614497B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 刘学梁;刘旭;王琛;季思伟 | 申请(专利权)人: | 金色熊猫有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 郑特强;章侃铱 |
地址: | 中国香港铜锣湾希慎*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 对齐 方法 装置 介质 | ||
1.一种基于知识图谱的对齐方法,包括:
获取至少两个文本,所述文本包括核心语义成份;
根据知识图谱,将所述至少两个文本之间具有同义关系、反义关系、同位关系、上下位关系的核心语义成份进行对齐,得到所述至少两个文本之间的核心成份的第一对齐关系,所述知识图谱是利用算法从语料中学习得到,所述知识图谱包含各种实体以及实体间的各种关系,所述实体间的各种关系至少包括所述同义关系、所述反义关系、所述同位关系、所述上下位关系;
根据所述至少两个文本之间的核心语义成份的第一对齐关系和预设的语法关系,将所述至少两个文本之间具有主谓关系、动宾关系、形名关系的核心语义成份进行对齐,得到所述至少两个文本之间的核心语义成份的第二对齐关系;
存储所述至少两个文本之间的核心语义成份的第一对齐关系和第二对齐关系;
其中,将所述至少两个文本之间具有主谓关系、动宾关系、形名关系的核心语义成份进行对齐,包括:
若两个文本之间的主语具有第一对齐关系,则把对齐的主语对应的谓语建立起第二对齐关系;若两个文本间的动词具有第一对齐关系,则把对齐的动词对应的宾语建立起第二对齐关系;若两个文本间的名词具有第一对齐关系,则把对齐的名词对应的形容词建立起第二对齐关系。
2.根据权利要求1所述的方法,其特征在于,所述文本还包括非核心语义成份,所述方法还包括:
基于IBM model的统计翻译模型对所述至少两个文本之间的非核心语义成份进行对齐,得到所述至少两个文本之间的非核心语义成份的第三对应关系,所述非核心语义成份包括不具有所述第一对齐关系和不具有所述第二对齐关系的短语。
3.一种基于知识图谱的对齐装置,包括:
获取模块,用于获取至少两个文本,所述文本包括核心语义成份;
第一确定模块,用于根据知识图谱,将所述至少两个文本之间具有同义关系、反义关系、同位关系、上下位关系的核心语义成份进行对齐,得到所述至少两个文本之间的核心语义成份的第一对齐关系,所述知识图谱是利用算法从语料中学习得到,所述知识图谱包含各种实体以及实体间的各种关系,所述实体间的各种关系至少包括所述同义关系、所述反义关系、所述同位关系、所述上下位关系;
第二确定模块,用于根据所述至少两个文本之间的核心语义成份的第一对齐关系和预设的语法关系,将所述至少两个文本之间具有主谓关系、动宾关系、形名关系的核心语义成份进行对齐,得到所述至少两个文本之间的核心语义成份的第二对齐关系;
存储模块,用于存储所述至少两个文本之间的核心语义成份的第一对齐关系和第二对齐关系;
其中,所述第二确定模块在将所述至少两个文本之间具有主谓关系、动宾关系、形名关系的核心语义成份进行对齐时,用于若两个文本之间的主语具有第一对齐关系,则把对齐的主语对应的谓语建立起第二对齐关系;若两个文本间的动词具有第一对齐关系,则把对齐的动词对应的宾语建立起第二对齐关系;若两个文本间的名词具有第一对齐关系,则把对齐的名词对应的形容词建立起第二对齐关系。
4.根据权利要求3所述的装置,其特征在于,所述文本还包括非核心语义成份,所述装置还包括:
对齐模块,基于IBM model的统计翻译模型对所述至少两个文本之间的非核心语义成份进行对齐,得到所述至少两个文本之间的非核心语义成份的第三对应关系,所述非核心语义成份包括不具有所述第一对齐关系和不具有所述第二对齐关系的短语。
5.一种基于知识图谱的对齐装置,包括:
一个或多个处理器;以及
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~2任意一项所述的方法。
6.一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~2任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金色熊猫有限公司,未经金色熊猫有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811351586.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于知识图谱的低保鉴别方法
- 下一篇:知识库构建方法及装置