[发明专利]一种基于用户兴趣的个性化搜索实现方法有效
申请号: | 201410086236.1 | 申请日: | 2014-03-10 |
公开(公告)号: | CN103853831B | 公开(公告)日: | 2017-02-01 |
发明(设计)人: | 崔自峰;钱葵东 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 江苏圣典律师事务所32237 | 代理人: | 胡建华 |
地址: | 210007 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 兴趣 个性化 搜索 实现 方法 | ||
1.一种基于用户兴趣的个性化搜索实现方法,其特征在于,包括用户兴趣剖像、用户兴趣剖像生成以及个性化搜索推导三个部分;
所述用户兴趣剖像包括对用户的兴趣进行描述和建模;
所述用户兴趣剖像生成包括对用户浏览器中缓存页面进行聚类、关联规则挖掘,构建用户兴趣剖像;
所述个性化搜索推导包括依据用户兴趣剖像对用户的搜索请求进行推理匹配,获得用户搜索兴趣,利用搜索请求扩展方法,实现个性化搜索。
2.根据权利要求1所述的一种基于用户兴趣的个性化搜索实现方法,其特征在于,所述的用户兴趣剖像的组成包括三个部分:
第一部分为一组浏览页面聚类,每一个聚类代表用户的一种兴趣,作为兴趣聚类,其包含的页面数量与页面总数之比作为用户兴趣的程度,该比值的范围为0~1之间的实数;
第二部分为每一个兴趣聚类的中心,用特征向量表达,每一个特征项的值为该聚类中词条特征的词频平均值,用于搜索时,用户兴趣的推导;
第三部分为聚类关联规则词条,是与关联规则对应的词条组合,代表每一个兴趣聚类的关键特征,在个性化搜索时,将其作为扩展词进行搜索,将搜索内容限定在扩展词范围内。
3.根据权利要求1所述的一种基于用户兴趣的个性化搜索实现方法,其特征在于,所述的用户兴趣剖像生成过程包括两个步骤:
步骤1、对用户浏览器缓存浏览页面的兴趣聚类,生成用户兴趣剖像的第一部分和第二部分;
步骤2、挖掘兴趣聚类的关联规则词条,生成用户兴趣剖像的第三部分。
4.根据权利要求3所述的一种基于用户兴趣的个性化搜索实现方法,其特征在于,其中步骤1所述的对用户浏览器缓存浏览页面的兴趣聚类,包括如下步骤:
步骤(11),提取用户的浏览器缓存区中的浏览页面,把每一个浏览页面p表示成一组词条的特征向量和浏览页面p包含的超链接页面集合;
步骤(12),将用户的浏览器缓存区中的浏览页面按照页面包含的链接关系建立图模型的表示方式,得到一个浏览页面图;
步骤(13):根据浏览页面图中页面之间的链接关系和浏览页面之间的相似度,计算浏览页面图的边集合E中任意条边所对应的两个浏览页面是否互为邻居,如果不互为邻居,则判定两个浏览页面的主题不一致,从浏览页面图中删除该边;反之,保留该边;
步骤(14):采用深度优先的方式遍历浏览页面图,得到浏览页面图的所有连通分量;
步骤(15):将浏览页面图中的每一个节点数量大于阈值的连通分量都作为一个用户的兴趣浏览页面聚类,按照聚类相似度合并具有相似主题的聚类;
步骤(16):将剩余的节点分配到与其相似度最大的聚类中,并重新计算每一个聚类的中心。
5.根据权利要求3所述的一种基于用户兴趣的个性化搜索实现方法,其特征在于,步骤2所述的挖掘兴趣聚类的关联规则词条,包括如下步骤:
步骤(21),对于每一个兴趣聚类,将兴趣聚类包含的浏览页面中每一个词条作为一个词条特征;根据词条特征在浏览页面中出现与否,如果出现将浏览页面的布尔型特征向量设为1,如果没有出现将浏览页面的布尔型特征向量设为0,每一个浏览页面表示为一个布尔型特征向量;
步骤(22),利用加权关联规则挖掘算法,获取聚类的关联规则词条。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410086236.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有冲击扳手功能的动力工具
- 下一篇:敏感性皮肤抗刺激组合物及其制备方法