[发明专利]一种自然语言句子的语义关系树的构造和比较方法无效
申请号: | 200810243607.7 | 申请日: | 2008-12-10 |
公开(公告)号: | CN101446944A | 公开(公告)日: | 2009-06-03 |
发明(设计)人: | 周国栋;钱培德;朱巧明;李培峰;李军辉;孔芳;王红玲;钱龙华 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 苏州创元专利商标事务所有限公司 | 代理人: | 陶海锋 |
地址: | 215123江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种自然语言句子的语义关系树的构造方法,其特征在于,对于句子中待建立语义关系树的两个实体,首先构建最短路径包含树;如果两实体之间的结构类型不是谓词结构,则最短路径包含树即为所需的语义关系树;如果两实体之间的结构类型是谓词链接结构,则扩展与谓词相关的上下文信息,得到上下文相关的路径包含树,作为语义关系树。本发明的方法获得的语义关系树,既能涵盖关键的结构化句法信息,又能减少不必要的噪音,能在基本不影响关系抽取速度的前提下,提高关系抽取的性能;采用该语义关系树进行比较,结果更具有普遍性。 | ||
搜索关键词: | 一种 自然语言 句子 语义 关系 构造 比较 方法 | ||
【主权项】:
1. 一种自然语言句子的语义关系树的构造方法,其特征在于,对于句子中待建立语义关系树的两个实体,采用下列构造方法:(1)采用语法分析器产生与句子相对应的句法树;(2)在句法树中确定两个实体的位置,方法是,依据两个实体的外延范围在句法树中从词汇结点向上寻找,直到发现一个共同结点,即把它确定为实体在句法树中的位置;(3)在句法树中找出连接两实体的最短路径,分别从两个实体结点出发,向上搜索,并记录经过的路径,直到发现一个最近的共同祖先结点,此时搜索过程中记录下的连接两实体的路径即为最短路径;(4)在语义关系树中,保留最短路径及其所包含的部分,裁剪掉其余部分,最后得到的最小的语义关系树即为最短路径包含树;(5)确定句法树中两实体之间存在的结构类别,如果两个实体之间用一个逗号分隔,则为半结构化;如果第二个实体是以介词短语形式修饰第一个实体,则为PP附属结构;如果第二个实体的外延包含了第一个实体,则为嵌入式结构;如果两个实体作为名词短语紧接在一起,则为描述性结构;除此之外的所有结构均视作谓词链接结构;(6)如果两实体之间的结构类型不是谓词结构,则最短路径包含树即为我们所需要的语义关系树;如果两实体之间的结构类型是谓词链接结构,则扩展与谓词相关的上下文信息,得到上下文相关的路径包含树,其方法是,首先从最短路径包含树的根节点开始向上移动直到找到一个以谓词为中心词的节点,然后沿着以该谓词为中心词的路径找到该谓词,这样被最短路径包含树和该谓词查找路径所涵盖的子树即我们要找的动态语义关系树。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810243607.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种障碍物分割方法及装置
- 下一篇:存储设备操作的方法、控制器及通信系统