[发明专利]一种基于用户兴趣感知的网页推送系统及方法有效
申请号: | 201210070105.5 | 申请日: | 2012-03-15 |
公开(公告)号: | CN102622445A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 陆以勤;薛晓冬;周耀炎;覃健诚 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于用户兴趣感知的网页推送方法及系统。本发明方法包括:1)综合网页文本客观长度以及用户带有主观感情色彩的浏览行为如浏览时长、是否保存标签、是否拷贝、是否曾经访问对用户兴趣进行评判,在用户阅读过程中如果浏览时长与文本长度比值大于一定阈值则认为用户对正在浏览的网页兴趣高,判定用户兴趣度为高,或者比值小于一定阈值但是用户在浏览过程中进行拷贝、保存标签等操作也判定用户兴趣度为高;如果用户浏览时长与文本长度比值小于一定阈值而又无任何特殊操作则判定用户兴趣度为低;2)对于用户兴趣度为高的情况,对于用户正在浏览的网页,首先找到文本密度最大的标签,再判断该标签的同类标签是否达到一定数目来定位和提取网页的正文,进一步对网页的Title、Description、Keywords标签中的词汇在提取的正文中统计词频形成表征网页特征的向量送到后台搜索引擎,通过计算页面向量内积,推送相关性最高的页面,对于用户兴趣度为低的情况,则根据用户的IP归属地推送具有地域特性的热点新闻、时事等。本发明同时公开的一种基于用户兴趣感知的网页推送系统,包括:用户行为获取模块、用户兴趣感知模块、用户数据处理模块、搜索模块、推送模块。本发明方法及其系统可用于互联网,用于分析用户的兴趣,针对用户兴趣进行相关的推送,用于解决互联网上信息量指数增长带来的搜索、筛选、处理上的难题。 | ||
搜索关键词: | 一种 基于 用户 兴趣 感知 网页 推送 系统 方法 | ||
【主权项】:
一种基于用户兴趣感知的网页推送方法,其特征在于,包括以下步骤:1)首先通过浏览器、插件或相关的客户端对用户的浏览时长T、是否保存标签IsSaved、是否曾经访问过IsAccessed、是否拷贝IsCopied的浏览行为信息进行收集,并对用户行为信息进行量化;2)然后通过判断量化后的浏览时长T与文本长度L的比值T/L是否大于或等于一定阈值Y0进行初步评判用户兴趣度的高低,如果对于用户兴趣度判断为高的情况则进行步骤3);否则通过是否保存标签IsSaved、是否曾经访问过IsAccessed、是否拷贝IsCopied等用户行为对用户兴趣度的高低进行进评判,如果对于用户兴趣度判断为高的情况则进行步骤3),否则则进行步骤4);3)对于判定用户兴趣度为高的情况,通过文本密度以及文本密度最大标签的同类标签数目对该网页正文部分进行提取,通过名为TFIDF的方法统计Title、Description、Keywords词汇在正文中的词频以形成表征网页特征的向量,通过浏览器、插件或相关的客户端将向量发送到后台搜索引擎中进行搜索与筛选,推送与该网页内容和主题相近、相似的网页,方法结束,不再执行步骤4);4)对于通过用户行为判定用户兴趣度为低的情况,对用户IP进行提取,将用户IP地址发送到后台,后台根据用户IP对用户进行定位,推送给用户具有地域特征的新闻和时事。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210070105.5/,转载请声明来源钻瓜专利网。