[发明专利]基于位置描述的显著性结构的位置概念结构化提取方法有效
申请号: | 201611219611.0 | 申请日: | 2016-12-26 |
公开(公告)号: | CN106855886B | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 朱欣焰;呙维;佘冰;胡涛;顾芷宁 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/29 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 位置 描述 显著 结构 概念 提取 方法 | ||
1.一种基于位置描述的显著性结构的位置概念结构化提取方法,其特征在于,包括以下步骤:
步骤1:基于位置描述结构本体建模,总结位置概念显著性结构及其顺序,自定义显著性语法语言,在程序初始化时读取并生成相应的类;实现显著性结构打分方法构建,为同一位置概念的不同显著性结构表达寻求一个最佳匹配结果,获得位置描述模型;
步骤2:映射位置结构概念本体生成规则类,每一条规则类对应一个位置实体概念本体,最终生成规则集合;
位置概念本体代表与位置有关对象的基本组成和层次关系,分为位置基础概念本体和位置实体概念本体,其中位置实体概念本体对应实际的空间实体或空间关系;位置结构概念本体是对位置实体概念本体具体组成方式的句法模式表达,其代表了这个位置实体概念本体的组成规则;
步骤3:对规则集合进行分类,重新划分为若干个规则组,形成规则检索依赖图;
步骤4:以任意自然语言文本位置描述语句和原始的自然语言文本位置描述语句作为输入,利用基于位置描述显著性结构的规则匹配算法进行匹配,通过打分排序完成位置信息的结构化提取。
2.根据权利要求1所述的基于位置描述的显著性结构的位置概念结构化提取方法,其特征在于,步骤3中所述对规则集合进行分类,是利用规则分组依赖图,首先对所有节点之间依赖关系建立节点,然后采用贪婪的形式建立规则组,通过规则组的依赖关系合并存在交叉依赖的规则组;其中,每个节点对应一个规则集合,所构建的规则检索依赖图中上层规则组和下层规则组的位置基础概念本体存在交集,且上层规则组和下层规则组中的位置实体概念本体不存在交集。
3.根据权利要求1所述的基于位置描述的显著性结构的位置概念结构化提取方法,其特征在于,步骤4中所述基于位置描述显著性结构的规则匹配算法进行匹配,其具体实现包括以下子步骤:
步骤4.1:输入位置基础概念本体的S实例、原子概念集W,将作为位置基础概念本体的S和原子概念集合W进行匹配,得出待选集合G;其中,原子概念集是位置基础概念本体对应语义位置的原子组成词汇的集合;
将位置基础概念本体的S实例和W进行匹配,根据规则匹配生成匹配树集,将匹配树与相应概念的显著性结构进行选择、过滤和查询,获取具备显著特征的候选假对象;基于具备显著性特征的候选假对象,对其进行概念集、感兴趣类型、显著性概念集合和显著性结构要求的判断,获取最终候选假对象实例并加入待选集合G中;
步骤4.2:基于待选集合G中候选假对象实例,根据各类位置概念显著性结构优先级,调用显著性结构评分函数对精确符合显著性结构的实例对象的进行评分与排序;按照排序结果,采用裁剪对象查询选择最优评分的对象作为最终实例。
4.根据权利要求3所述的基于位置描述的显著性结构的位置概念结构化提取方法,其特征在于,步骤4.1中所述获取具备显著特征的候选假对象,其具体实现包括以下子步骤:
步骤4.1.1:遍历G中源节点N,获取N下的子节点n;如果n符合概念节点C要求,则被纳入概念集类型f中;否则,继续遍历下一个节点;其中,概念节点C由两部分形成:一部分为LO-Trie中查询到的基础概念对象,另一部分为规则匹配得出的实体概念对象;
步骤4.1.2:判断当前n的概念集类型f是否为感兴趣类型;如果是,标识flag为true;否则默认为false;其中,flag表示判断后结果存储的地方;
步骤4.1.3:判断概念集类型f是否为显著性概念集合;如果是,继续判断f作为一个假对象是否满足显著性结构条件,如果满足条件,则作为候选假对象实例i,加入到规则匹配图中。
5.根据权利要求3所述的基于位置描述的显著性结构的位置概念结构化提取方法,其特征在于,步骤4.2的具体实现包括以下子步骤:
步骤4.2.1:获取符合组内假对象的显著性结构s,并创建用于存储实例显著性概念集合g;
步骤4.2.2:遍历s获取相应显著性名称所对应的实例显著性概念对象ss;如果ss不为空,则继续对其遍历判断是否精确符合显著性结构s,如果判断结果不为空,将ss添加到实例显著性概念集合g中;
步骤4.2.3:判断g是否为空;如果不为空,再调用显著性结构评分函数,获取假对象显著性分数并排序;
所述显著性结构评分函数是依据概念型分类和排序,同类概念的显著性结构之间再进行打分排序;分组相同时,根据匹配的有效字符串长度进行排序;
步骤4.2.4:按照排序结果,采用裁剪对象进行查询选择最高评分的对象作为最终结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611219611.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种浏览器的页面处理方法及终端
- 下一篇:一种文件管理的方法、装置和终端