[发明专利]基于位置描述的显著性结构的位置概念结构化提取方法有效
申请号: | 201611219611.0 | 申请日: | 2016-12-26 |
公开(公告)号: | CN106855886B | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 朱欣焰;呙维;佘冰;胡涛;顾芷宁 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/29 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 位置 描述 显著 结构 概念 提取 方法 | ||
本发明公开了一种基于位置描述的显著性结构的位置概念结构化提取方法,首先基于位置描述结构本体建模,总结位置概念显著性结构,自定义显著性语法语言,程序初始化时读取并生成相应的类;然后自动化映射位置结构概念本体生成规则类,每一条规则类对应一个位置实体概念本体,最终生成规则集合;接着对规则集合进行分类,重新划分为若干个规则组,形成规则检索依赖图;最后以任意自然语言文本位置描述语句和原始的自然语言文本位置描述语句作为输入,利用基于位置描述显著性结构的规则匹配算法进行匹配,通过打分排序完成位置信息的结构化提取。本发明显著性结构是对地名结构语义信息知识表达的一种补充和优化,有利于提高匹配结果的准确性。
技术领域
本发明属于自然语言位置提取技术领域,特别是涉及一种基于位置显著性描述的位置概念结构化提取方法。
背景技术
多源异构地名数据大量增加,为了对不同来源不同结构的位置数据进行共享和集成,并根据位置名称检索精确获取准备的查询结果,需要从人们认知习惯角度出发,对大量标准及非标准地名描述进行分析,总结位置名称结构特征和空间关系,对地名结构语义信息进行概念和形式化表达,实现位置概念结构化建模。在此基础上要对位置名称和位置关系识别进而获得精确的位置概念描述,需要利用位置概念匹配的解析方式对位置概念模型化实例依照相应组合对象级规则进行处理,实现位置概念对象的高效抽取,获取准确的位置概念类型。
由于实际的位置描述中可能出现表达错误、知识库不完备等原因,通过位置概念匹配方法得到的地名描述对象中,有许多程序是中间结果或者相对于其他结果此结果不够显著的代表此位置概念。一般的位置概念匹配只能对字符串信息进行匹配,难以灵活地融入地名实体和关系词汇之间的语义关系,更忽略了人们对地名的认知情况和对地名的描述习惯。此外,在规则数量较多且匹配细尺度的地名时,匹配效率很低,因此需要定义地名描述的显著性结构来对位置概念匹配生成的不显著匹配结果进行粗过滤。显著性结构是对地名结构语义信息知识表达的一种补充和优化,也是对地名结构的约束,有效提高了匹配结果的准确性,使其更符合人们认知和描述习惯。
发明内容
为了解决上述技术问题,本发明提出了一种基于位置描述显著性结构的位置概念结构化提取方法,对程序解析匹配的不显著性结果进行过滤,得到更能显著性代表位置概念及符合人们认知习惯的位置描述,有效提高匹配结果的准确性。
本发明所采用的技术方案是:一种基于位置描述的显著性结构的位置概念结构化提取方法,其特征在于,包括以下步骤:
步骤1:基于位置描述结构本体建模,总结位置概念显著性结构及其顺序,自定义显著性语法语言,在程序初始化时读取并生成相应的类;实现显著性结构打分方法构建,为同一位置概念的不同显著性结构表达寻求一个最佳匹配结果,获得位置描述模型;
步骤2:映射位置结构概念本体生成规则类,每一条规则类对应一个位置实体概念本体,最终生成规则集合;
位置概念本体代表与位置有关对象的基本组成和层次关系,分为位置基础概念本体和位置实体概念本体,其中位置实体概念本体对应实际的空间实体或空间关系;位置结构概念本体是对位置实体概念本体具体组成方式的句法模式表达,其代表了这个位置实体概念本体的组成规则;
步骤3:对规则集合进行分类,重新划分为若干个规则组,形成规则检索依赖图;
步骤4:以任意自然语言文本位置描述语句和原始的自然语言文本位置描述语句作为输入,利用基于位置描述显著性结构的规则匹配算法进行匹配,通过打分排序完成位置信息的结构化提取。
本发明提出的基于位置描述显著性结构的位置概念结构化提取方法中,显著性结构是对地名结构语义信息知识表达的一种补充和优化,是对地名结构的一种约束,有利于提高匹配结果的准确性;对程序解析匹配生成的不显著匹配结果进行过滤,得到更能显著代表位置概念以及符合人们认知习惯的位置描述。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611219611.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种浏览器的页面处理方法及终端
- 下一篇:一种文件管理的方法、装置和终端