[发明专利]一种基于改进的TF-IDF方法的检索词实时修正方法无效

专利信息
申请号: 201310464625.9 申请日: 2013-10-09
公开(公告)号: CN103530344A 公开(公告)日: 2014-01-22
发明(设计)人: 陈雪;汤文清;王鹏;高英虎 申请(专利权)人: 上海大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海上大专利事务所(普通合伙) 31205 代理人: 陆聪明
地址: 200444*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于改进的TF-IDF方法的检索词实时修正方法,该方法步骤为:(1)用户输入检索词,计算机系统对所有的检索资源搜索,返回给用户检索结果,将当前页面结果中包含检索词的文本组成文本集合;(2)下载用户想要的文本;(3)由下载的文本集合生成关键词集合W;(4)采用改进后的TF-IDF方法计算关键词集合W中各关键词的TF-IDF值;(5)选出TF-IDF值最大的关键词,记为r;(6)使用关键词r修正用户输入的检索词,在用户点击下一个网页时,使用新的检索词进行检索,并返回检索结果。本发明能在检索过程中逐步的帮助用户检索到所要的文本,从而使用户检索的过程更加高效和准确,提高用户检索效率和质量。
搜索关键词: 一种 基于 改进 tf idf 方法 检索 实时 修正
【主权项】:
一种基于改进的TF‑IDF方法的检索词实时修正方法,该方法通过对一次检索中,用户已下载的文本所组成的关键词集合,利用改进的TF‑IDF方法对上述关键词集合进行处理,得到最靠近用户检索目标的关键词,然后使用最靠近用户检索目标的关键词对用户的输入检索词进行修改,再进行检索,其具体步骤如下:(1)、用户输入检索词,计算机系统对所有的检索资源搜索,系统返回给用户首个网页的搜索结果,将当前页面结果中包含检索词的文本组成文本集合,该文本集合记为A;(2)、用户判断文本集合A中是否存在用户想要的文本,如果存在,则下载用户想要的文本,转步骤(3);如果不存在,则跳转到步骤(1);(3)、提取步骤(2)中所有用户想要下载的文本组成想要的文本集合,根据上述想要的文本集合生成关键词集合,该关键词集合记为W;(4)、采用改进后的TF‑IDF方法计算上述关键词的集合W中各关键词的TF‑IDF值;(5)、从关键词集合W中,选出TF‑IDF值中最大的关键词,记为关键词r;(6)、利用关键词r修正用户的输入检索词,生成新的检索词,当用户点击下一页时,返回由新的检索词检索到的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310464625.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top