[发明专利]一种海量数字信息的分布式推荐方法有效
申请号: | 201110316628.9 | 申请日: | 2011-10-18 |
公开(公告)号: | CN102298650A | 公开(公告)日: | 2011-12-28 |
发明(设计)人: | 郗旻;张金领 | 申请(专利权)人: | 东莞市巨细信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 东莞市华南专利商标事务所有限公司 44215 | 代理人: | 李玉平 |
地址: | 523808 广东省东莞市松山湖科技产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及海量信息处理技术领域,具体涉及一种海量数字信息的分布式推荐方法,该分布式推荐方法包括以下步骤:第一步,建设对等的分布式局域网络;第二步,收集当前用户行为的数字信息,存入面向文档的分布式数据库mongodb中;第三步,数字信息的预处理;第四步,统计与当前用户有关系的数字信息的集合;第五步,构建数字信息之间的相似度矩阵;第六步,统计数字信息之间相似度的总数矩阵;第七步,统计向当前用户候选推荐的数字信息的评分值;第八步,向当前用户推荐数字信息。本发明的分布式推荐方法在海量数字信息的情况下向用户推荐数字信息的速度更快,准确度更高;本发明的分布式推荐方法适用于各种数字信息。 | ||
搜索关键词: | 一种 海量 数字 信息 分布式 推荐 方法 | ||
【主权项】:
一种海量数字信息的分布式推荐方法,其特征在于:所述分布式推荐方法包括以下步骤:第一步,建立对等的分布式局域网络,网络中每台计算机可直接相互通讯,网络中计算机的数量至少为10台;第二步,收集当前用户行为的数字信息,存入面向文档的分布式数据库mongodb中;第三步,将第二步中收集的数字信息进行预处理;第四步,统计与当前用户有关系的数字信息的集合:通过Hadoop的Map和Reduce两个阶段并行统计与当前用户有关系的数字信息的集合;其中,将数据库mongodb中的当前用户行为的数字信息作为Map阶段的输入数据源;Map 阶段完成后开始 Reduce阶段的并行运算, Reduce阶段的输入数据源为Map阶段的输出结果,将与当前用户有关系的数字信息集合进行汇总;第五步,构建数字信息之间的相似度关系矩阵:运行并行的Map阶段运算,将第四步中Reduce阶段的输出结果作为本步骤中Map阶段运算的输入数据源,进而构建数字信息之间的相似度矩阵;第六步,统计数字信息之间相似度的总数矩阵:运行并行的Reduce阶段运算,将第五步中Map阶段的输出结果作为本步骤中Reduce阶段运算的输入数据源,统计数字信息之间相似度的总数矩阵;第七步,统计向当前用户候选推荐的数字信息的评分值的Map阶段运算:运行并行的Map阶段运算,将第四步中Reduce阶段的输出结果作为本步骤中Map阶段运算的输入数据源,统计向当前用户候选推荐的数字信息的评分值;第八步,统计向当前用户候选推荐的数字信息的评分值的Reduce阶段运算:第七步中Map阶段运算完成后,开始Reduce阶段的并行运算,将第六步的运算结果和第七步中Map阶段运算的输出结果作为本步骤中Reduce阶段运算的输入数据源;第九步,为当前用户推荐数字信息的Map阶段运算:运行并行的Map阶段运算,将第八步中Reduce阶段的输出结果作为本步骤中Map阶段运算的输入数据源,运算规则为直接输出第八步中Reduce阶段的输出结果;第十步,为当前用户推荐数字信息的Reduce阶段运算:第九步中Map阶段运算完成后开始Reduce阶段的并行运算,将第九步中Map阶段运算的结果作为本步骤中Reduce阶段运算的输入数据源,运算规则为:排序比较与用户没有发生过关系的数字信息的总评分值,按总评分值的高低依次选择前N 项数字信息作为最终的推荐结果;结果格式为:<用户标示,推荐的数字信息项集合>;其中,所述N为设定的正整数;第十一步,根据向当前用户推荐的数字信息项集合,进入mongodb数字信息库中获取作为推荐结果的数字信息的详细内容,最后将所获取的数字信息的详细内容返回给当前用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞市巨细信息科技有限公司,未经东莞市巨细信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110316628.9/,转载请声明来源钻瓜专利网。
- 上一篇:实验课程考试系统
- 下一篇:文本信息抽取方法和系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置