[发明专利]一种基于向量空间模型的关系词映射方法有效
申请号: | 201711453984.9 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108153736B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 温延龙;刘云鹏;袁晓洁 | 申请(专利权)人: | 南开大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06F40/284 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 张耀 |
地址: | 300071 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种基于向量空间模型的关系词映射方法,属于自然语言处理领域。本发明方法的基本步骤如下:首先采用关系词与实体对之间的对应关系,通过统计实体对出现的频率及特异性构造每个关系词的特征向量。其次采用向量空间模型计算关系词与对应谓语的相似度,选取相似度值较高的谓语作为关系词的候选。最后将所有关系词的候选排序,选取具有最高可信度的谓语候选构造映射词典。本发明提出的关系词谓语映射方法,能够为自然语言中关系词与RDF图数据中谓语的自动映射提供一种有效的解决方案,达到使自然语言转换为图数据进行相应匹配的目的。 | ||
搜索关键词: | 一种 基于 向量 空间 模型 系词 映射 方法 | ||
【主权项】:
一种基于向量空间模型的关系词映射方法,其特征在于该方法包括:第1、利用RDF图数据中实体对之间的路径,确定每一个关系词的可能候选谓语或谓语路径;第2、将候选的谓语路径,根据他们的顶点对,构造特征向量,用以表征每一个谓语候选,同时用于计算与关系词的相似度;第3、使用自然语言中的实体对,也可以生成关系词对应的文档集,从而构造关系词的特征向量;第4、对一个关系词的每一个谓语候选,按照第2步、第3步得到特征向量,分别计算对应的相似度,最后按照得到结果进行排序,选取相似度较高的谓语作为候选。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711453984.9/,转载请声明来源钻瓜专利网。