[发明专利]一种微博数据管理系统及其实现方法有效
申请号: | 201310367762.0 | 申请日: | 2013-08-21 |
公开(公告)号: | CN103488683A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 王静远;高飞;李超;欧阳元新;熊璋 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 贾玉忠 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据管理 系统 及其 实现 方法 | ||
技术领域
本发明涉及一种基于社区发现技术的微博数据管理系统及其实现方法,属于数据挖掘技术领域。
背景技术
在微博等社交网络中,随着用户好友数量的增多,用户每天面对大量的信息。对于用户较多微博用户,一种好的数据管理的方法是,依据用户在现实生活中的社交圈子,建立分组,根据好友所属不同分组来管理。建立分组后,便可以依照组别进行内容过滤,隐私设置等。目前,腾讯微博、新浪微博等主要的微博服务提供商均提供了这种机制来管理数据。然而,现有的方法主要是通过用户手工对好友进行分组管理来进行的。这种方法太过费时且需要用户大量的人工劳动。当用户有新的好友时,也难以更新。同时,手工的进行管理,存在着误操作的可能性。
发明内容
本发明的技术解决问题:克服现有技术的不足,提供一种微博数据管理系统及方法,可以高效、准确的挖掘出潜在的分组信息,用户可以方便地管理其微博数据。
本发明的技术解决方案:一种微博数据管理系统,如图1所示包括:
用户授权模块:采用Oauth协议进行授权。利用Oauth技术提供的安全机制,本系统不会接触到用户的隐私信息。
数据抓取模块:利用微博提供的API,获取用户好友之间的相互关系数据以及用户资料信息的数据。首先对用户的好友进行抓取。然后,对每一个好友,抓取其与用户的共同好友信息,从而获得所有好友之间的相互关系,形成一个由好友关系组成的用户社交关系网络。本模块的输入是用户在微博上的用户名,输出是用户社交关系网络。其中,网络中的每一个节点代表了用户的一个好友,节点之间的边代表了用户两个好友的关系。最终获得的用户社交关系网络输出到数据库中,供社区结构检测模块调用;
社区结构挖掘模块:对数据抓取模块获得用户好友关系组成的图,依据社区检测技术,从好友之间的社交关系中,挖掘出其潜在的社区结构,作为分组的依据。其中一个社区是一些好友的集合,其中社区内的好友间具有密度更大的好友关系,社区间的好友具有较少的好友关系。本模块使用了社区检测技术,由基本社区结构搜索和社区聚合两部分组成。无需用户设定任何参数,也无需任何参数。本模块的输入是数据抓取模块获得的好友关系网络,经此模块处理产生的好友分组输出至分组解析展现模块;
分组解析展现模块:根据社区结构发现模块产生的用户好友分组,对其进行解析。本模块的作用在于智能的挖掘出分组的语义信息。根据用户好友分组的语义信息,将组别抽象为名人明星、朋友、同学、同事四大类。解析模块将 社区结构挖掘模块产生的每一个分组,利用组内成员用户资料、微博内容、转发关系特征,决定其分组的类别。作为分组解析结果,展现社区结构挖掘模块将解析模块的结果展现给用户。
反馈模块:对每一个用户好友分组,设置一个反馈,收集用户评价。使用户对系统的效果做出打分评价,并收集用户反馈信息,将用户id、分组结果、用户反馈作为一条记录,存储至数据库,以便将来为系统改进、提高用户体验提供依据。
一种微博数据管理方法,实现步骤为:
(1)用户授权:采用Oauth协议进行授权,得到用户在微博上的用户名;
(2)数据抓取:根据用户在微博上的用户名,利用微博提供的API获取用户好友之间的相互关系数据以及用户资料信息的数据,具体是首先对用户的好友进行抓取;然后对每一个好友,抓取其与用户的共同好友信息,获得所有好友之间的相互关系,形成一个由好友关系组成的用户社交关系网络;其中,网络中的每一个节点代表了用户的一个好友,节点之间的边代表了用户两个好友的关系,最终获得的网络输出到数据库中;
(3)社区结构挖掘:对步骤(2)获得的好友关系网络,依据社区检测技术,首先对网络进行深度优先搜索挖掘出其基本社区结构,随后对基本社区结构进行层级聚合,从好友之间的社交关系中,挖掘出其潜在的社区结构,作为分组的依据,其中一个社区是一些好友的集合,社区内的好友间具有密度更大的好友关系,社区间的好友具有较少的好友关系,从而得到用户好友分组;
(4)分组解析展现:根据步骤(3)产生的用户好友分组,对其进行解析,本模块的作用在于智能的挖掘出分组的语义信息。将组别抽象为名人明星、朋友、同学、同事四大类,根据步骤(3)产生的每一个用户好友分组,利用组内成员用户资料、微博内容、转发关系特征,决定其分组的类别,作为分组依据展现给用户;
(5)进行反馈:对每一个用户友好分组,设置一个反馈,收集用户反馈信息,以便将来为系统改进、提高用户体验提供依据。
本发明与现有技术相比的优点在于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310367762.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频广告播放方法、设备和系统
- 下一篇:播放控制系统和方法