[发明专利]基于在线软约束LDA算法的社区推荐方法无效

申请号：	201010284218.6	申请日：	2010-09-10
公开（公告）号：	CN101968798A	公开（公告）日：	2011-02-09
发明（设计）人：	俞能海;康雨洁	申请（专利权）人：	中国科学技术大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	暂无信息	代理人：	暂无信息
地址：	230026***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于在线约束 lda 算法社区推荐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及个性化推荐方法，特别涉及一种基于在线软约束LDA算法的社区推荐方法。

背景技术

近几年来，社会网络大批涌现。这些网页为用户提供了建立社区的工具，使得志同道合的用户们可以聚集在一起，互相分享他们感兴趣的信息。随着这种社会网络服务的快速增多，用户们面对海量的各种各样主题的社区，会产生迷惑，如何才能有效率的选择自己所感兴趣的社区呢？于是，社区推荐逐渐成为一个很重要的技术。

目前常见的个性化推荐方法有两种：一种是基于内容的推荐方法，一种是协同推荐。基于内容的推荐方法，先利用每位用户对对象的评论或者投票行为为该用户训练一个偏好模型，然后再利用这个偏好模型给用户推荐他可能最感兴趣的一个新的对象。协同推荐是建立在如下假设的基础上的：相似的用户有相同的喜好。当使用协同推荐的方法给用户推荐对象时，只需要参考与该用户相似的用户的喜好。因此这种方法不需要获得对象的内容信息，可以在缺乏对对象的描述的情况下，进行推荐。

在目前已有的社区推荐的算法中，有两种知名的基于协同推荐的方法：ARM方法和二值的LDA方法。ARM方法利用不同社区之间有多少重叠的用户来推算社区之间的相互关系。二值的LDA方法通过社区-用户共生矩阵来计算社区之间的潜在主题。这两种方法容易遇到由于数据观察的限制所导致的过拟合现象以及计算量庞大的问题。并且这两种方法都忽略了用户与社区之间的关系强弱，也不能处理新加入的用户。

发明内容

本发明的目的在于，解决现有的社区推荐方法所容易遇到的由于数据观察的限制所导致的过拟合现象以及计算量庞大的问题。

为达到上述目的，本发明提供一种基于在线软约束LDA算法的社区推荐方法，包括计算主题分布、计算最优候选社区、在线更新三大步骤。

所述的计算主题分布步骤为：

步骤a，对于单个用户，抓取其在各个小社区上的发帖信息，分别统计其发帖次数，作为用户与社区关系的衡量标准，用第i个用户U_i在他所参与的第j个社区C_i，j上的发帖次数作为用户U_i与社区C_i，j的关系强弱度，用R_i，j表示；

步骤b，将用户视为文档，用户参与的社区视为文档中的单词，而R_i，j就是社区单词C_i，j在用户文档U_i中的出现次数，用LDA算法建立用户主题分布以及主题社区分布模型，并用Gibbs采样方法求解模型参数，求解的具体过程为：

先为所有的用户文档中出现的社区单词，随机分配一个主题集合，如为社区单词C_i，j分配主题集合再利用迭代公式更新所有的主题，直到模型参数收敛：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学技术大学，未经中国科学技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010284218.6/2.html，转载请声明来源钻瓜专利网。