[发明专利]一种基于TFIDF的迭代查询扩展方法在审
申请号: | 201610901979.9 | 申请日: | 2016-10-17 |
公开(公告)号: | CN106528652A | 公开(公告)日: | 2017-03-22 |
发明(设计)人: | 范科峰;刘贤刚;姚相振;王凯;周睿康;高林;李琳 | 申请(专利权)人: | 中国电子技术标准化研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京国坤专利代理事务所(普通合伙)11491 | 代理人: | 郭伟红 |
地址: | 100007*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于TFIDF的迭代查询扩展方法,包括原始数据的输入、数据分析和数据特征提取以及数据的迭代,本发明的有益效果是发明目的是给出一种查询扩展方法,可以更好的理解用户查询意图,返回给用户相关合理的微博查询结果,在微博系统中,查询词通常很短,而一篇微博的字数通常在20~40之间,这很容易造成相关的微博由于没有包含查询词而丢失,因此查询扩展的目的是提高查询的召回率。 | ||
搜索关键词: | 一种 基于 tfidf 查询 扩展 方法 | ||
【主权项】:
一种基于TFIDF的迭代查询扩展方法,其特征在于:包括原始数据的输入、数据分析和数据特征提取以及数据的迭代,具体步骤如下:(1)定义用户原查询词为Q,用户通过输入装置输入查询词Q;(2)通过微博搜索功能搜索查询词Q;(3)随后查询装置对搜索结果进行聚类、标记;(4)随后统计聚类、标记中的每个词的TFIDF值,选取TFIDF值最大的前N个词作为扩展次Qt1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子技术标准化研究院,未经中国电子技术标准化研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610901979.9/,转载请声明来源钻瓜专利网。