[发明专利]事件驱动架构下对Web活动索引、排序和分析的系统和方法有效
申请号: | 201380037182.3 | 申请日: | 2013-07-11 |
公开(公告)号: | CN104471571B | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 谢晚霞 | 申请(专利权)人: | 谢晚霞 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律智知识产权代理有限公司11438 | 代理人: | 姜燕,王卫忠 |
地址: | 210014 江苏省南京市秦*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件 驱动 架构 web 活动 索引 排序 分析 系统 方法 | ||
优先权/临时申请的交叉引用
本申请要求享有在2012年7月11日提交的美国临时申请号61/670,481的优先权,该申请的全部内容被参考合并于此。
技术领域
本发明的实施方案涉及一种用于分析互联网上的信息内容的系统和方法。更具体地来说,是关于一种用于对互联网内容进行索引和排序的系统和方法。虽然本发明的实施方案的应用很广泛,但尤其适用于将传统的互联网内容与诸如移动应用、社交媒体、众包媒体(crowd sourced media)、以及博客之类的新媒体内容融合的应用。
背景技术
总的来说,自从Web浏览器诞生以来,让用户在互联网上有效地浏览、发现、过滤以及参与一直是一个挑战。以高效的方式找到及时并且相关的信息是所有互联网用户的目标。考虑到内容构成的动态性,以及内容来源定义的多样性,实现这个目标尤其具有挑战性。过去,在线的内容主要由网站发布者在网站上发布,而现在,这个格局已经发生变化,许多在线内容是通过博客、微博、视频、图像、评论、用户评价以及社交网络发布。在移动设备上产生的内容和活动变得越来越多。举例来说,社交网络的内容包括状态更新、推文(tweet),转发(re-tweet)、微博以及用户行为,例如赞(like)、签到、书签、钉选(pin)和收藏。
在过去的十来年中,Web用户在Web上导航的主要模型为搜索引擎模型。当前的各种技术实施方式依赖于很多方法以便将相关内容提供给用户,但决定相关性的最重要因素仍然是外部链接(参见例如美国专利号6,285,999)和关键字索引。这些技术手段之所以有效,是因其捕捉到了那个时候的主要的用户行为活动,即添加链接指向其他网站和点击链接的行为。这种倚重于外部链接和关键字索引的技术解决方式的结果是一种利用众包方式来决定信息相关性的模型,其实质上是人气竞赛。然而,这种模型的优势同时也是其最大的弱点,该弱点是过于关注网页和基于文本的内容。随着各种新内容形式的出现,和线上影响力评估的日益流行,这种方法已经不再适用,因其不能捕捉这种新的信息。随着在线用户行为和活动的巨幅增长,如上所述,外部链接和点击次数这两个维度过于简单化,无法体现新的Web活动的复杂性。其结果是大量有价值的、及时的信息丢失,导致在线用户的信息访问行为受挫和效率低下。
例如,当今的搜索引擎没有支持捕捉用户行为、参与的用户、用户间的信息流通以及其他类型的Web活动(不同于点击次数和链接)的框架。此外,由于在对影响力的判定上,此类搜索引擎倚赖基于外部链接的人气竞赛,所以其带有历史偏见性。在这种模型中,一个内容相关性较强的网站如想获得很多外部链接,特别是在涉及到热门的搜索关键字的情况时,需要等待大量时间。正因如此,当前的搜索引擎工作模式是一种向后看的滞后模式,最适宜于确定内容的过去相关性,但却不适宜于判定那些较新的,尚未流行的内容的相关性。
当相同的内容出现在多个数据来源中时也会发生问题,这是很常见的情况。一些数据来源可能频繁地更新,而有些数据来源可能根本不会更新。因此,当信息在一个数据来源首先被更新时,最新的且准确的信息占少数。而众包方法却会给那些陈旧的信息更高的排名,因为它们被大多数其他数据来源所认可。在这些数据来源上的信息更新状况反映了那些藏在背后的隐含的行为。监视在不同数据来源上的信息更新情况可以用于对新的且准确的信息进行分析和排序。然而,搜索引擎和分析工具的当前实现方式忽略了这些隐含的行为,从而错过了可以用来对结果进行排序和分析的重要信号。
此外,静态和动态网页的内容会随着时间的推移而被更新。但是目前的搜索系统是不考虑这点的,因其仅使用这些网页在某个时间点的内容快照。再者,线上内容不再整齐有序地存在于网页中,或者以纯文本的方式存在。因此,以网页链接和基于文本的关键字索引为重心的搜索引擎技术不再能够以最优的方式帮助用户寻找到相关内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谢晚霞,未经谢晚霞许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380037182.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:体外血液处理流体界面
- 下一篇:用于共享地址装置的聚合的方法、装置和系统