[发明专利]一种面向微博的定制化筛选系统及方法无效
申请号: | 201210065678.9 | 申请日: | 2012-03-13 |
公开(公告)号: | CN102622443A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 闫丹凤;田瑞;刘佳 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 100098 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向微博的定制化筛选系统及方法,其中一种面向微博的定制化筛选系统包括后台模块和交互模块,所述后台模块用于采集数据、分析数据、本地存储、建立索引并提供检索功能;所述交互模块与后台模块信息交互,并提供与后台模块交互的WEB界面。本系统是解决信息过载的一种解决方案,即从庞大的微博数据中,针对性地筛选出用户关注的一类信息,为用户过滤掉一大批非关注信息,并能将这些数据本地化存储,方便用户长期使用;并通过验证机制增强系统本身的安全性;整个系统的工作逻辑清晰、流畅,减少了系统各模块之间的耦合度,每模块内部都由若干模块组成,有利于每模块功能的扩展。 | ||
搜索关键词: | 一种 面向 定制 筛选 系统 方法 | ||
【主权项】:
一种面向微博的定制化筛选系统,其特征在于,包括后台模块和交互模块,所述后台模块用于采集数据、分析数据、本地存储、建立索引并提供检索功能;所述交互模块与后台模块信息交互,并提供与后台模块交互的WEB界面; 所述后台模块依次包括信息交互的采集模块、分析模块、索引模块和检索模块;所述采集模块,采集原始微博数据;所述分析模块对采集模块传输的数据进行抽取、去重及过滤得到有效数据,并对有效数据分类、存储,所述过滤包括对垃圾、广告及黄反数据的过滤;所述索引模块对分析模块传输至的数据进行中英文分词,根据分词的结果建立倒排索引及增量索引,并根据微博状态文件定期的删除索引;所述检索模块接收交互模块传输的检索关键字,并对检索关键字进行纠错、同义词转换、分词及优化,并对检索结果进行筛选和排序,进一步将排序结果返回交互模块。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210065678.9/,转载请声明来源钻瓜专利网。
- 上一篇:成像应用中用于工具透镜生产的惰性高硬度材料
- 下一篇:注射封胶系统及其方法