[发明专利]一种多维信息检索方法有效
申请号: | 201510064132.5 | 申请日: | 2015-02-06 |
公开(公告)号: | CN104657455B | 公开(公告)日: | 2017-12-05 |
发明(设计)人: | 万亚平;欧阳纯萍;莫文涛;阳小华;刘志明;张娟;宋涛涛;蒋辉;顾伟 | 申请(专利权)人: | 南华大学;国家核电技术有限公司北京软件技术中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国航天科技专利中心11009 | 代理人: | 范晓毅 |
地址: | 421001 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多维 信息 检索 方法 | ||
技术领域
本发明属于计算机信息检索领域,具体涉及一种信息检索方法,特别是涉及一种多维信息检索方法。
背景技术
20世纪以来,人类创造的信息量高速增长。据估计,70年代以来全世界每年出版图书50万种以上、期刊10万种以上、专利约50万件、科技报告约90万件、会议文献10多万篇、产品样本50多万种、每年发表的科技论文总数近500万篇,并呈指数式增长,可谓浩如烟海。如何从这浩如烟海的信息中找到所需信息,就成为信息检索的重任。随着上下文感知计算(Context-Aware Computing)得到越来越广泛的关注,上下文感知的信息检索(Context-Aware Information Retrieval)也日渐成为信息检索研究的热点。虽然物理世界传感网络、RFID等感知技术的兴起大大提高了计算设备间的感知和交互能力,但是面向信息世界的上下文信息检索(Contextual Information Retrieval,CIR)仍有许多亟待解决的热点难点问题,而任务上下文驱动的信息检索(Task-context Driven Information Retrieval,TDIR)更是成为其中重要的研究方向和发展趋势。信息检索经历了以系统为中心(System-Centered),到以用户为中心(User-Centered),到基于上下文(Contextual Approach)的发展过程。
上下文在信息检索中的主要应用是推测查询目标和文档目标。当前研究表明,推测查询目标的各类上下文中使用最多的是任务上下文。2007年TGSE研讨会(Towards Genre-Enabled Search Engines)专门讨论利用体裁改进搜索引擎质量。许多研究者使用体裁来过滤搜索引擎返回结果。这表明用体裁表示文档目标已成为主流。依据上下文推测出的查询目标和文档目标,主要应用在查询扩展、检索结果过滤、目标独立匹配等方面。近年来,以查询目标与文档目标直接进行匹配逐渐成为趋势。
综上所述,文档体裁和任务上下文是当前上下文信息检索的研究热点,已取得了大量成果,但仍然存在严峻的挑战:①由于体裁依赖于文档内部特征,如词句、文档长度、说话方式、短语或句子类型、图形元素或网页标签等,体裁识别主要依靠人工方式,只能应用在特定的小范围内,难以大范围推广。②用户的查询目标或者是隐含在查询主题中,或者是隐含在任务中,未能显式地以体裁表示出来,这使得查询目标与文档目标的表示形式不一致,给匹配算法带来了很大的困难。由此可见,开发一个提高用户查询精准度,解决传统方法中查询目标用体裁显式表达困难的多维信息检索系统是具有积极意义的。
发明内容
本发明的目的在于克服现有技术的上述不足,提供一种多维信息检索方法,解决了现有信息检索系统依靠人工识别体裁,难以显示的表示体裁和度量体裁,查询目标与文档目标表示形式的不一致等问题,显著提高了信息检索精度和检索质量,节省用户信息检索时间,提高效率,改善用户查询体验。
本发明的上述目的主要是通过如下技术方案予以实现的:
一种多维信息检索方法,通过多维信息检索系统实现,所述多维信息检索系统包括客户端和搜索引擎,搜索引擎包括任务分析引擎和索引匹配引擎,其中客户端包括任务监视器、用户任务分析模块和用户接口模块,任务分析引擎包括体裁数据库、用户任务体裁分析器和用户任务日志数据库,具体实现步骤如下:
步骤(一)、任务监视器实时采集用户在桌面完成的各种任务过程中的事件信息,并将所述事件信息传送给用户任务分析模块;用户接口模块将用户查询历史信息实时发送给用户任务分析模块;
步骤(二)、用户任务分析模块将所述事件信息与所述用户查询历史信息实时发送给用户任务体裁分析器;
步骤(三)、用户任务体裁分析器实时接收所述事件信息和所述用户查询历史信息,同时查询体裁数据库,将所述事件信息和所述用户查询历史信息按照体裁分类进行体裁标注并存储到用户任务日志数据库,所述体裁数据库为存储各种体裁分类的集合;
步骤(四)、索引匹配引擎实时从互联网抓取原始数据并保存,对所述原始数据建立内容-体裁索引,即对原始数据同时建立内容索引和体裁索引;
步骤(五)、当用户输入查询请求时,用户接口模块将接收到的查询请求同时发送给索引匹配引擎和用户任务分析模块;
步骤(六)、用户任务分析模块将接收的查询请求发送给用户任务体裁分析器,用户任务体裁分析器根据用户任务日志数据库得到所述查询请求的体裁形式表示并发送给索引匹配引擎;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南华大学;国家核电技术有限公司北京软件技术中心,未经南华大学;国家核电技术有限公司北京软件技术中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510064132.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自适应动态数据处理方法
- 下一篇:一种提示信息获取方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置