[发明专利]一种数字信息推荐预测模型的训练方法和系统有效
申请号: | 201110339200.6 | 申请日: | 2011-11-01 |
公开(公告)号: | CN102495837A | 公开(公告)日: | 2012-06-13 |
发明(设计)人: | 鲁凯;王斌;史亮;李文娜;李锐;徐飞 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数字 信息 推荐 预测 模型 训练 方法 系统 | ||
技术领域
本发明涉及数字信息处理领域,具体地,涉及数字信息推荐领域。
背景技术
随着互联网的快速发展,用户在各个门户网站、电子商务网站、视频或者音乐视听网站都面临信息过载的问题,因此挖掘用户的可能喜好,提供个性化的服务对提高用户的满意度和忠诚度具有非常重大的意义。推荐系统正是在这个背景产生的,并且近二十年来得到了非常迅猛的发展。IT巨头如亚马逊,谷歌,雅虎等,国内如当当网,淘宝网等都在其不同的应用中提供了个性化的推荐系统,极大的方便了用户并且也给商家带来了巨大的利益。
推荐系统大致可以分为两类:基于内容的推荐系统及基于协同过滤的推荐系统。基于内容的推荐系统主要是利用项目(item)的内容信息,例如项目名字等文字信息来找出相似的项目集合,然后根据用户喜欢的项目推荐该项目的相似项目。基于协同过滤的推荐系统主要是利用用户对项目的反馈,例如用户对项目的打分记录,购买记录,浏览记录等挖掘用户的可能喜好,推荐其可能喜欢的项目集合。
因为基于内容的推荐系统只与当前用户选择的项目有关,该方法没有考虑到对用户的历史行为进行建模,因此该方法无法满足用户的个性化需求。对于基于协同过滤的推荐系统,这类系统不需要考虑项目的属性以及领域知识即可获得很好的推荐效果,因此大多数推荐系统都是基于协同过滤技术的。然而由于在实际中用户的打分数往往比较少,所以协同过滤技术在应用时面临很多问题,例如冷启动问题,数据稀疏问题等。其中数据稀疏性对产生精确推荐往往造成很大的影响,因此合理的解决打分数据的稀疏性问题往往能够对产生精确推荐带来意想不到的影响。下面以音乐系统为例来详细说明以上两种推荐系统。
对于音乐推荐,可以根据音乐的音频建立相似度矩阵,然后根据用户听的音乐进行推荐。也可以根据音乐的相关文本标签(tag),属性,上下文信息(context information)等进行推荐,这些都可以看作是和基于内容推荐相关的方法,其难以满足用户的个性需求。
当前各个提供在线音乐的网站例如谷歌,雅虎,百度,搜狐等,他们的音乐推荐一般都是根据于用户的听歌记录以及用户对相关音乐的反馈(打分,喜欢/不喜欢)进行建模,然后将用户可能喜欢的音乐推荐给用户。这属于基于协同过滤的推荐系统,其推荐过程主要包括下列步骤:第一步获得用户对各个音乐的打分情况,然后对打分数据进行预处理;第二步是使用相关协同过滤的相关算法对打分数据进行建模,预测,这个过程是离线完成的;第三步是对于每个活跃用户,将预测完的该用户对各个音乐的可能打分值取最高的前K个(Top-K)项目进行在线推荐。图1示出了上述推荐过程的流程图。如上所述,用户打分数据稀疏性使得难以对用户进行准确推荐。
发明内容
本发明的目的在于提供一种推荐效果更理想的数字信息推荐预测模型的训练方法及系统。
根据本发明的一个方面,提供了一种数字信息推荐预测模型的训练方法,包括:
1)接收打分数据;
2)确定数字信息的不同类别,每个类别中包括多个项目,其中所述类别之间存在关联关系;
3)基于所述关联关系建立所述模型并训练获得所述模型,其中所述模型中包括一个或多个和集合相关的参数,其中所述集合为与一个类别的项目相关的另一个类别的项目的集合或者多个与一个类别的项目相关的另一个类别的项目的集合的并集。
上述方法中所述建立模型是基于隐参数模型建立。
上述方法中所述步骤3)中建立的所述模型为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110339200.6/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置