[发明专利]一种基于语义空间映射的语义关系表征、聚类及识别的方法和系统有效
申请号: | 201410255166.8 | 申请日: | 2014-06-10 |
公开(公告)号: | CN104008092B | 公开(公告)日: | 2017-01-18 |
发明(设计)人: | 王晓平;肖仰华;汪卫 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 上海正旦专利代理有限公司31200 | 代理人: | 陆飞,盛志范 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于文本语义处理技术领域,具体为一种基于语义空间映射的语义关系表征、聚类及识别的方法和系统。本发明对于待抽取关系的实体对首先对包含二者的语句进行语法依存分析;然后将分析结果视作Graph,并计算Graph中对应这两个实体的结点间最短路径,来抽取出实体间关系;继而将路径上的词语向语义空间投影并进行累积,获得该关系在语义空间上的向量表示;对于多组实体对的场景,使用聚类方法对关系进行聚类并构建关系模型;依据表征输入实体对间关系的语义向量与关系模型之间的语义相似度实现关系的识别。本发明克服了传统方法在进行实体间关系比较时对词语变形、同义词变化、语法形式变化等因素敏感的缺点,提高了关系比较准确性和处理的灵活性。 | ||
搜索关键词: | 一种 基于 语义 空间 映射 关系 表征 识别 方法 系统 | ||
【主权项】:
一种基于语义空间映射的语义关系表征、聚类及识别的方法,其特征在于具体步骤如下:(1)输入实体对及语句,即输入待查询的实体对,及同时包含该对实体的语句;(2)抽取实体间关系,即对于待抽取关系的实体对,对同时包含它们的语句进行语法依存关系分析;包括语法依存关系分析和最短路径计算;其中:语法依存关系分析是对输入的语句进行语法依存分析,获得文本单元间的语法依赖关系;最短路径计算是将语法依存树看作是一个Graph,并将输入实体对看作是Graph中的两个感兴趣结点,同时令各结点间的边的权值均为1;采用最短路径算法求解出该两个感兴趣结点间的最短路径,并用该路径来描述两个结点之间发生关系的实质内容;(3)关系语义向量表征,即对路径上的词语进行过滤处理,去除其中无语义的停用词;然后对每一个单词,获取其在语义空间中的投影向量,并将这些语义向量进行累加,获得该关系在语义空间上的向量表示;(4)关系聚类,在关系向量化的基础上,对于多实体对的场景,使用聚类方法并结合向量相似性度量,进行关系聚类;(5)关系模型构建模块,对于完成聚类的实体对的每一类关系,根据其向量集合构建关系模型,(6)最后,进行关系识别,即依据该向量与预先标定关系的语义距离实现关系的识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410255166.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种铁路隧道防灾紧急通道
- 下一篇:井下可视化方法