[发明专利]获取推荐对象的方法及装置有效
申请号: | 201510342894.7 | 申请日: | 2015-06-18 |
公开(公告)号: | CN104933143B | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 杨德坤;郑宸;贺炜;王彦明 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 姜劲;陆锦华 |
地址: | 100080 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 推荐 对象 方法 装置 | ||
本发明提供一种获取推荐对象的方法及装置,具有搜索速度快,适用范围广等优点。该方法包括:构建原始用户矩阵和原始对象矩阵,其中,原始用户矩阵中的每一行为原始用户向量,每个原始用户向量表示一个用户的多重属性特征,原始对象矩阵中的每一行为原始对象向量,每个原始对象向量表示一个对象的多重属性特征;对原始用户矩阵和原始对象矩阵进行保序变换,得到新用户矩阵和新对象矩阵;对新对象矩阵中的新对象向量构建对象高维索引结构;对新用户矩阵中的各个新用户向量在对象高维索引结构中进行最近邻搜索,得到新用户向量对应的最近邻新对象向量;根据各个新用户向量及其对应的最近邻新对象向量,输出用户与推荐对象的映射。
技术领域
本发明涉及计算机技术领域,尤其涉及一种获取推荐对象的方法及装置。
背景技术
随着互联网技术的发展,人们进入了信息过载的时代。在用户访问网站的过程中,大量的新闻、商品、视频、音乐等等对象呈现在了用户面前。怎样筛选出用户真正感兴趣的内容对提高网站的访问量及收益有着非常重要的意义。推荐系统相关的技术在这样的背景下得到了越来越广泛的使用。
近几年来矩阵分解算法成为了推荐系统领域研究的主流,研究表明在个性化推荐中使用矩阵分解技术可以得到比传统基于邻域的协同过滤更好的结果。矩阵分解算法将用户对对象的评分矩阵进行分解,生成用户矩阵U和对象矩阵V,这样就将用户和对象映射到了高维的潜语义空间。用户矩阵及对象矩阵的每一行都是一个向量,表示相应的用户和对象。用户向量与一个对象向量的内积就是该用户对对象的评分,内积越大,评分越高,表示越是推荐。每个用户的推荐对象可以取所有对象中K个内积最大的对象向量对应的对象作为推荐结果。
在实际应用场景中,用户和对象的数量往往庞大,相当于多达千万的用户都需要在千万级对象构成的高维空间中搜索K个最大的内积,该计算过程非常耗时。因此需要一种方案能够快速地完成用户和对象向量间最大内积的Top K计算。
若采用最基本的线性搜索方法进行最近邻搜索,则时间复杂度较高,无法满足海量数据下的需求。常用的解决方案是建立高维索引,利用高效的数据结构和算法完成搜索。但是,由于内积不满足三角不等性且无法衡量向量间的相似性,导致常用的聚类、高维索引树、局部感知哈希等建立高维索引的方案均无法直接适用于内积空间的搜索。
发明内容
有鉴于此,本发明提供一种获取推荐对象的方法及装置,具有搜索速度快,适用范围广等优点。
为实现上述目的,根据本发明的一个方面,提供了一种获取推荐对象的方法,包括:构建原始用户矩阵和原始对象矩阵,其中,所述原始用户矩阵中的每一行为原始用户向量,每个所述原始用户向量表示一个用户的多重属性特征,所述原始对象矩阵中的每一行为原始对象向量,每个所述原始对象向量表示一个对象的多重属性特征;对原始用户矩阵和原始对象矩阵进行保序变换,得到新用户矩阵和新对象矩阵;对所述新对象矩阵中的新对象向量构建对象高维索引结构;对所述新用户矩阵中的各个新用户向量在所述对象高维索引结构中进行最近邻搜索,得到所述新用户向量对应的最近邻新对象向量;根据各个所述新用户向量及其对应的所述最近邻新对象向量,输出用户与推荐对象的映射。
可选地,所述对原始用户矩阵和原始对象矩阵进行保序变换,得到新用户矩阵和新对象矩阵的步骤包括:对所述原始用户矩阵的第i行向量xi添加数值0作为一个新的维度,得到新用户向量从而得到所述新用户矩阵;计算所述原始对象矩阵的第j行向量yj的2-范数以及该2-范数的最大值对所述yj添加作为一个新的维度,得到新对象向量从而得到所述新对象矩阵。
可选地,所述对所述新对象矩阵中的新对象向量构建对象高维索引结构的步骤包括:将所述新对象矩阵中的新对象向量聚类得到多个对象子类,每个对象子类具有一个对象聚类中心;为每个所述对象子类建立vp-tree树结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510342894.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:照片处理方法及装置与移动终端
- 下一篇:动画展示方法和装置