[发明专利]一种基于问题本体的语义标注和检索方法无效
申请号: | 201210079110.2 | 申请日: | 2012-03-23 |
公开(公告)号: | CN102629278A | 公开(公告)日: | 2012-08-08 |
发明(设计)人: | 蔡广军;金芝 | 申请(专利权)人: | 河南科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 洛阳公信知识产权事务所(普通合伙) 41120 | 代理人: | 李宗虎 |
地址: | 471000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 问题 本体 语义 标注 检索 方法 | ||
技术领域
本发明涉及智能检索技术领域,具体涉及一种基于问题本体的语义标注和检索方法。
背景技术
当前主流的检索技术是基于关键字和分类目录的检索,它们根据检索对象的关键字确定是否匹配,不考虑语义,难以应对同一关键字具有不同含义或不同关键字具有相同含义的问题,只能部分提高查准率和查全率。语义检索基于对检索对象含义的理解确定检索对象是否满足请求,有助于克服基于关键词的信息检索技术的缺陷。已有研究包括多个方面,从研究内容上包括架构、耦合、透明性、用户语境和语境更改方法、本体结构和本体技术等;从方法上包括用语义扩充关键字检索、基本概念定位、复杂约束查询、问题求解和连接路径发现、RDF路径遍历、关键字概念映射、图模式、逻辑以及模糊逻辑和模糊关系等;从实现步骤则分为本体建模、标注和检索等。从本体模型和标注看,主要根据检索的内容来构造本体,开放动态环境下以采用单个轻量级本体为主,如以互联网上信息为检索对象的方法;封闭环境下也大多采用单个本体模型,只是描述内容更丰富。标注时基于对检索内容的分析和基于模式的发现确定标注检索对象的概念和关系。只有少数方法采用了多本体,但本体内容是基于对检索对象的分析和提取,把一个大本体分为不同的子本体,子本体描述的是单个问题的子问题,不同本体之间相互垂直,多个本体一起解决单个问题,构建一个领域本体需要考虑其它领域的内容;检索时需要多个领域本体相互协作,检索复杂度不仅取决于领域本体,还取决于所建立的领域本体之间的关系。综合来看,当前语义检索中存在很多问题没有解决:一是语义标注的复杂性,当前一般基于单一的语义世界,要支持开放世界假设需要对所有文档的标注,而当前的推理工具大多支持封闭世界下的推理,且没有方法和理论能支持OWL-Full描述的推理。二是语义的多样性,文档中关键字或概念的含义不仅取决于文档的内容,还取决于文档之外的知识,比如对“张三是贾宝玉”,其语义不仅取决于这个句子自身,还取决于张三和贾宝玉相关的知识,当只知道贾宝玉是个漂亮富家公子时,则其语义既可以是张三是漂亮的,也可以是张三是富家公子;如果还知道张三是富家公子且相貌一般时,则其语义只能是张三是富家公子。三是语义的不一致性,文档在不同环境的语义不仅呈现多样性,而且相互之间可能是矛盾的,如张三是贾宝玉既可能是褒义的也可能是贬义的。四是推理和描述的矛盾,语义检索不仅复杂度高,而且和描述复杂程度成反比,如OWL-Lite具有多项式的推理复杂度,但只能描述比较简单的领域;OWL-DL具有指数的推理复杂度,可以描述一般的领域;OWL-Full描述能力最强,但不能推理。本发明受需求工程中基于环境建模思想和服务计算中通过环境变化描述服务的启发,通过建模现实问题的本体模型来实现标注和检索。
发明内容
本发明的目的是为解决上述技术问题的不足,提供一种基于问题本体的语义标注和检索方法,通过选取现实问题领域作为本体内容和定义投影的标注方法避免了本体受检索内容影响大、动态变化难以构造使用的不足;通过构造多层次多领域的本体模型避免了轻量级本体模型查准率和查全率低的不足,并且可以通过不同检索标准的选择避免查准率和查全率不能兼顾的不足;
本发明为解决上述技术问题的不足,所采用的技术方案是:一种基于问题本体的语义标注和检索方法,包括选取问题领域作为本体内容构建多层次多领域的问题本体模型,采用投影标注方法实现多个本体对单个检索对象的标注,以及基于问题本体的语义检索;具体方法为:
(一)构建问题本体模型:
(1)、确定问题本体的专业领域和范畴,选择所确定的问题领域作为建模本体的内容,列出问题领域中的概念,并定义构成问题本体模型的三种本体单元,分别为问题本体、导航本体和功能本体;
其中,三种本体单元的定义如下:
问题本体PO:包含了问题中的各个领域,领域的性质,领域间的关系以及相关的公理和约束;
定义:PO={PC,PR,PP,PA}
其中,PC是领域概念的集合,包括功能本体和导航本体,PR是PC内元素之间关系的集合,包括导航本体与功能本体之间的关系和导航本体与导航本体之间的关系,PP是PC内元素的属性的集合,PA是表示PC,PR,PP相关元素约束的公理的集合;
导航本体NO:可以细分的本体,包含功能本体和代表其它领域本体的领域概念;
定义:NO={NC,NR,NP,NA}
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南科技大学,未经河南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210079110.2/2.html,转载请声明来源钻瓜专利网。