[发明专利]个性化元搜索引擎检索结果合成排序方法有效
申请号: | 201610273518.1 | 申请日: | 2016-04-28 |
公开(公告)号: | CN105975508B | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 李青山;蔺一帅;周柏宇;王梅嘉;陈小利 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种个性化元搜索引擎检索结果合成排序方法,实现步骤如下,(1)建立用户系统兴趣;(2)搜索引擎检索文档;(3)合并成员搜索引擎结果文档;(4)划分结果文档兴趣类别;(5)获得个性化排序权值;(6)展示检索结果;(7)更新用户系统兴趣。本发明所述方法同时考虑成员搜索引擎的数量、成员搜索引擎结果总数、相同结果文档数、结果文档在各成员搜索引擎中的位置信息,并结合不同个性化程度用户兴趣对结果排序的影响,实现元搜索引擎更准确、更高效的用户个性化检索体验。 | ||
搜索关键词: | 个性化 搜索引擎 检索 结果 合成 排序 方法 | ||
【主权项】:
1.一种个性化元搜索引擎检索结果合成排序方法,包括以下步骤:(1)建立用户系统兴趣:(1a)用户首次使用个性化元搜索引擎注册时,在个性化元搜索引擎中选择自己的兴趣类别;(1b)个性化元搜索引擎将用户所选的兴趣类别平等对待,将用户所选兴趣归一化并以用户兴趣值的形式存储在后台数据库中;(1c)用户登陆后,个性化Agent从数据中读取用户兴趣值,并将依据读取的用户兴趣值作为用户系统兴趣;(2)搜索引擎检索文档:用户输入查询词并选择需要的成员搜索引擎,个性化元搜索引擎调用指定成员搜索引擎进行搜索;(3)合并成员搜索引擎结果文档:(3a)创建一个系统结果列表,系统结果列表中的每一个结果项包括结果文档的标题文本、摘要文本、链接、位置信息以及出现次数相关信息;(3b)为每个成员搜索引擎创建一个当前结果列表,成员搜索引擎将检索得到的结果文档添加到当前结果列表中,个性化元搜索引擎将各成员搜索引擎返回的当前结果列表加入系统结果列表中;(3c)判断当前结果列表中的结果文档的标题文本、摘要文本、链接信息是否均已存在于系统结果列表中,若是,则执行步骤(3d),否则,执行步骤(3f);(3d)将已存在系统结果列表中的结果文档的出现次数加1,得到系统结果列表结果文档的当前出现次数;(3e)将当前结果列表中的位置信息与系统结果列表中的位置信息相加,用所得结果更新系统结果列表中该结果文档的位置信息;(3f)将当前结果文档直接添加到系统结果列表中;(3g)利用搜索结果合成方法,计算系统结果列表每个结果文档的排序分值;所述的搜索结果合成方法是利用排序权值计算公式得出的,排序权值计算公式如下:
其中,rankd表示结果文档d的排序权值,∑表示连加操作,ra表示结果文档在第a个成员搜索引擎中的位置,m表示成员搜索引擎的数量,*表示相乘操作,n表示结果文档在所有成员搜索引擎中出现的次数,k表示每个成员搜索引擎返回的结果数;(4)划分结果文档兴趣类别:(4a)利用分词工具,对系统结果列表中所有结果文档的标题与摘要文本内容进行分词,得到文本中出现的词条及频度;(4b)利用朴素贝叶斯公式,计算结果文档所属兴趣类别;(5)获得个性化排序权值:(5a)从后台数据库中提取用户系统兴趣,将用户系统兴趣进行非线性处理,得到兴趣影响因子;(5b)利用个性化排序权值计算公式,获得每条结果文档个性化排序权值;所述的个性化排序权值计算公式如下:
其中,rank_infd表示结果文档的个性化排序权值,rankd表示结果文档的排序权值,tan表示取正切操作,inf表示用户系统兴趣值;(6)展示检索结果:个性化元搜索引擎将当前结果列表中结果项按排序权值从小到大依次排序,将排序后的结果文档在浏览器上展示;(7)更新用户兴趣:(7a)用户在点击个性化元搜索引擎的结果文档后,个性化Agent对用户点击的检索结果文档链接进行挖掘,利用分词工具对文本进行分词,得到文本中出现的词条及频度,将文本中出现频度大于等于5次的词条作为用户兴趣词,利用朴素贝叶斯公式,计算兴趣类别,将得到的兴趣类别视为用户当前兴趣;(7b)判断每条用户当前兴趣中的兴趣类别是否与已有的用户系统兴趣中兴趣类别一致,若是,执行步骤(7c),否则,执行步骤(7d);(7c)将所有一致的兴趣类别的当前兴趣的兴趣值与系统兴趣的兴趣值分别相加,用所得结果更新用户兴趣值;(7d)删除对应用户兴趣中用户兴趣值最低的用户兴趣,将当前兴趣添加到用户兴趣中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610273518.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种微博热度指数的分析方法
- 下一篇:一种文件合并方法及装置