[发明专利]一种结合差异特征分布与链接特征的网页排序方法有效
申请号: | 201210215860.8 | 申请日: | 2012-06-27 |
公开(公告)号: | CN102750380A | 公开(公告)日: | 2012-10-24 |
发明(设计)人: | 张化祥;张悦童;刘阳 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种结合差异特征分布与链接特征的网页排序方法。首先通过TrustRank算法计算网页信任值;分析已标记为正常与垃圾网页的差异特征分布,选择正常网页与垃圾网页差异特征分布有明显差异的特征,称为差异特征;根据网页差异特征分布,计算网页差异特征的信任贡献值;结合网页信任值与网页差异特征的信任贡献值计算网页信任度;根据网页信任度对网页排序。本发明利用正常网页与垃圾网页在分布上存在差异的内容特征,结合网页链接特征,更好地提高好网页的排序,降低垃圾网页的排序。 | ||
搜索关键词: | 一种 结合 差异 特征 分布 链接 网页 排序 方法 | ||
【主权项】:
一种结合差异特征分布与链接特征的网页排序方法,其特征是,首先通过TrustRank算法计算网页信任值;分析已标记为正常与垃圾网页的特征分布,选择正常网页与垃圾网页特征分布有明显差异的特征,称为差异特征;然后根据差异特征分布,计算网页差异特征信任贡献值;结合网页信任值与网页内容特征值计算网页信任度;根据网页信任度对网页排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210215860.8/,转载请声明来源钻瓜专利网。