[发明专利]一种多维信息检索方法有效

专利信息
申请号: 201510064132.5 申请日: 2015-02-06
公开(公告)号: CN104657455B 公开(公告)日: 2017-12-05
发明(设计)人: 万亚平;欧阳纯萍;莫文涛;阳小华;刘志明;张娟;宋涛涛;蒋辉;顾伟 申请(专利权)人: 南华大学;国家核电技术有限公司北京软件技术中心
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中国航天科技专利中心11009 代理人: 范晓毅
地址: 421001 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多维 信息 检索 方法
【说明书】:

技术领域

本发明属于计算机信息检索领域,具体涉及一种信息检索方法,特别是涉及一种多维信息检索方法。

背景技术

20世纪以来,人类创造的信息量高速增长。据估计,70年代以来全世界每年出版图书50万种以上、期刊10万种以上、专利约50万件、科技报告约90万件、会议文献10多万篇、产品样本50多万种、每年发表的科技论文总数近500万篇,并呈指数式增长,可谓浩如烟海。如何从这浩如烟海的信息中找到所需信息,就成为信息检索的重任。随着上下文感知计算(Context-Aware Computing)得到越来越广泛的关注,上下文感知的信息检索(Context-Aware Information Retrieval)也日渐成为信息检索研究的热点。虽然物理世界传感网络、RFID等感知技术的兴起大大提高了计算设备间的感知和交互能力,但是面向信息世界的上下文信息检索(Contextual Information Retrieval,CIR)仍有许多亟待解决的热点难点问题,而任务上下文驱动的信息检索(Task-context Driven Information Retrieval,TDIR)更是成为其中重要的研究方向和发展趋势。信息检索经历了以系统为中心(System-Centered),到以用户为中心(User-Centered),到基于上下文(Contextual Approach)的发展过程。

上下文在信息检索中的主要应用是推测查询目标和文档目标。当前研究表明,推测查询目标的各类上下文中使用最多的是任务上下文。2007年TGSE研讨会(Towards Genre-Enabled Search Engines)专门讨论利用体裁改进搜索引擎质量。许多研究者使用体裁来过滤搜索引擎返回结果。这表明用体裁表示文档目标已成为主流。依据上下文推测出的查询目标和文档目标,主要应用在查询扩展、检索结果过滤、目标独立匹配等方面。近年来,以查询目标与文档目标直接进行匹配逐渐成为趋势。

综上所述,文档体裁和任务上下文是当前上下文信息检索的研究热点,已取得了大量成果,但仍然存在严峻的挑战:①由于体裁依赖于文档内部特征,如词句、文档长度、说话方式、短语或句子类型、图形元素或网页标签等,体裁识别主要依靠人工方式,只能应用在特定的小范围内,难以大范围推广。②用户的查询目标或者是隐含在查询主题中,或者是隐含在任务中,未能显式地以体裁表示出来,这使得查询目标与文档目标的表示形式不一致,给匹配算法带来了很大的困难。由此可见,开发一个提高用户查询精准度,解决传统方法中查询目标用体裁显式表达困难的多维信息检索系统是具有积极意义的。

发明内容

本发明的目的在于克服现有技术的上述不足,提供一种多维信息检索方法,解决了现有信息检索系统依靠人工识别体裁,难以显示的表示体裁和度量体裁,查询目标与文档目标表示形式的不一致等问题,显著提高了信息检索精度和检索质量,节省用户信息检索时间,提高效率,改善用户查询体验。

本发明的上述目的主要是通过如下技术方案予以实现的:

一种多维信息检索方法,通过多维信息检索系统实现,所述多维信息检索系统包括客户端和搜索引擎,搜索引擎包括任务分析引擎和索引匹配引擎,其中客户端包括任务监视器、用户任务分析模块和用户接口模块,任务分析引擎包括体裁数据库、用户任务体裁分析器和用户任务日志数据库,具体实现步骤如下:

步骤(一)、任务监视器实时采集用户在桌面完成的各种任务过程中的事件信息,并将所述事件信息传送给用户任务分析模块;用户接口模块将用户查询历史信息实时发送给用户任务分析模块;

步骤(二)、用户任务分析模块将所述事件信息与所述用户查询历史信息实时发送给用户任务体裁分析器;

步骤(三)、用户任务体裁分析器实时接收所述事件信息和所述用户查询历史信息,同时查询体裁数据库,将所述事件信息和所述用户查询历史信息按照体裁分类进行体裁标注并存储到用户任务日志数据库,所述体裁数据库为存储各种体裁分类的集合;

步骤(四)、索引匹配引擎实时从互联网抓取原始数据并保存,对所述原始数据建立内容-体裁索引,即对原始数据同时建立内容索引和体裁索引;

步骤(五)、当用户输入查询请求时,用户接口模块将接收到的查询请求同时发送给索引匹配引擎和用户任务分析模块;

步骤(六)、用户任务分析模块将接收的查询请求发送给用户任务体裁分析器,用户任务体裁分析器根据用户任务日志数据库得到所述查询请求的体裁形式表示并发送给索引匹配引擎;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南华大学;国家核电技术有限公司北京软件技术中心,未经南华大学;国家核电技术有限公司北京软件技术中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510064132.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top