[发明专利]基于形式概念格的分面搜索方法及系统有效
| 申请号: | 201710483747.0 | 申请日: | 2017-06-22 |
| 公开(公告)号: | CN107391584B | 公开(公告)日: | 2020-12-11 |
| 发明(设计)人: | 杨柳;蒋实知;胡志刚;龙军;白非非 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06F16/2457 | 分类号: | G06F16/2457 |
| 代理公司: | 长沙朕扬知识产权代理事务所(普通合伙) 43213 | 代理人: | 杨斌 |
| 地址: | 410083 *** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 形式 概念 搜索 方法 系统 | ||
本发明涉及计算机搜索技术领域,公开一种基于形式概念格的分面搜索方法及系统,以基于形式概念分析理论针对原始信息预构造形式概念格,并在形式概念格的基础上建立索引,从而建立分面搜索系统。本发明方法包括:构造形式概念格,在构造过程中,形式概念格使用伪造属性fake_attribute初始化最小概念Bottom;在形式概念格中建立叶子概念的索引;在查询过程中,概念的内涵对应查询语句,概念的外延对应结果集;在获取用户查询的分面值集后,在所构造的形式概念格中利用叶子概念自底向上匹配包含属性集的最小内涵以找到与分面值集对应的目标概念,并返回该目标概念所对应的外延。
技术领域
本发明涉及计算机搜索技术领域,尤其涉及一种基于形式概念格的分面搜索方法及系统。
背景技术
分面搜索(Faceted Search)是一种在关键词搜索的基础上,根据当前搜索结果提供上下文相关的分面信息(Facet Information)的信息检索技术。用户可以脱离系统设计人员既定的类别树,从各种各样的角度自定义感兴趣的类别。在用户指定某个分面值(Facet Value)后,系统根据该分面值对应的结果集中动态获取更细化的信息,新的细化结果能够从多个分面对结果集进行划分,帮助用户进一步了解他们感兴趣的数据信息。在整个搜索过程中,用户可以灵活地切换分面值,从而快速获取相关内容。
形式概念分析(Formal Concept Analysis)理论是一种针对结构化数据进行知识挖掘与分析的方法,被广泛应用于知识发现、软件工程等领域。形式概念分析的核心数据结构即为形式概念格,概念格通过哈斯图(Hasse Diagram)来表示概念与概念之间的层次结构。
目前流行的分面搜索技术主要建立在传统的关系型数据库之上,要快速检索这些内容并提供相应的分面信息是一个亟待解决的难题。
发明内容
本发明目的在于公开一种基于形式概念格的分面搜索方法及系统,以基于形式概念分析理论针对原始信息预构造形式概念格,并在形式概念格的基础上建立索引,从而建立分面搜索系统。
为实现上述目的,本发明公开了一种基于形式概念格的分面搜索方法,包括:
构造形式概念格,所述形式概念格使用伪造属性fake_attribute初始化最小概念Bottom,并在每次更新概念格结构时,将输入对象Obj的属性集添加到Bottom的内涵中,最后再将fake_attribute剔除得到完整且正确的形式概念格;同时,在形式概念格中增加新对象的过程中,在输入属性集Y后,首先获取Y所唯一对应的标准生成器,如果概念格已有概念的内涵与Y相等,则Y不产生新概念,并将该新对象添加到其相等内涵所关联概念的外延中,以及将该新对象添加到此概念所有父概念的外延中;如果概念格不存在已有概念的内涵与Y相等,则创建新概念,并根据标准生成器的直接父概念计算新概念的所有候选直接父概念并筛选出真正的直接父概念,然后更新概念之间的父子关系,同时将该新对象添加到新概念所有父概念的外延中;
在所述形式概念格中建立叶子概念的索引,所述叶子概念是指形式概念格中最小概念的直接父概念;
在查询过程中,概念的内涵对应查询语句,概念的外延对应结果集;在获取用户查询的分面值集后,在所构造的形式概念格中利用叶子概念自底向上匹配包含属性集的最小内涵以找到与所述分面值集对应的目标概念,并返回该目标概念所对应的外延。
与上述方法相对应的,本发明还公开一种基于形式概念格的分面搜索系统,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710483747.0/2.html,转载请声明来源钻瓜专利网。





