[发明专利]预测方法、系统、介质和电子设备在审
申请号: | 201811463866.0 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109670141A | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 刘洪彬;魏望;高畅;刘彦东 | 申请(专利权)人: | 网易传媒科技(北京)有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06N20/00;G06Q10/04;G06Q30/02;G06Q30/06 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕雁葭 |
地址: | 100084 北京市海淀区西北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 对象矩阵 乘积矩阵 电子设备 向量构造 向量 计算机可读存储介质 对象集合 构造用户 矩阵乘积 矩阵分解 预测结果 预测系统 计算量 预测 耗时 样本 | ||
本发明的实施方式提供了一种预测方法,包括获得由多个用户向量构造的用户矩阵以及由多个对象向量构造的对象矩阵,其中,所述用户向量包括该用户在多个因子上的得分,所述对象向量包括该对象在所述多个因子上的得分,确定所述用户矩阵和所述对象矩阵的乘积矩阵,以及基于所述乘积矩阵中的元素,确定与各个用户对应的对象集合作为预测结果。该方法通过构造用户矩阵以及对象矩阵以及求矩阵乘积的方式,无需构造大量样本,解决了现有技术中基于矩阵分解的召回方法计算量过大导致耗时严重的问题。此外,本发明的实施方式提供了一种预测系统、一种计算机可读存储介质以及一种电子设备。
技术领域
本发明的实施方式涉及互联网领域,更具体地,本发明的实施方式涉及一种预测方法、系统、介质和电子设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
推荐系统的主要工作是解决信息过载的问题,从大量的信息中筛选出少量有价值的信息。业界推荐系统大致分为召回、排序两个阶段。
当前推荐系统的召回算法主要分为基于内容的召回、基于近邻模型的召回、基于矩阵分解模型的召回,其中基于矩阵分解模型的召回算法效果最好。现有矩阵分解技术在预测阶段需要构造每个用户对所有对象预测样本,然后通过预测函数逐行进行预测。
发明内容
但是,以上预测方法需要构建大量预测样本,数据量较大时预测耗时严重。
为此,非常需要一种改进的预测方法,以克服预测耗时严重的问题。
在本上下文中,本发明的实施方式期望提供一种预测方法,无需构造大量预测样本,节省时间,提高效率。
在本发明实施方式的第一方面中,提供了一种预测方法,包括获得由多个用户向量构造的用户矩阵以及由多个对象向量构造的对象矩阵,其中,所述用户向量包括该用户在多个因子上的得分,所述对象向量包括该对象在所述多个因子上的得分,确定所述用户矩阵和所述对象矩阵的乘积矩阵,以及基于所述乘积矩阵中的元素,确定与各个用户对应的对象集合作为预测结果。
在本发明的一个实施例中,所述获得由多个用户向量构造的用户矩阵以及由多个对象向量构造的对象矩阵包括,获得由多个用户向量构造的用户矩阵的多个用户矩阵子块,并且/或者,获得由多个对象向量构造的对象矩阵的多个对象矩阵子块。其中,所述乘积矩阵包括由多个乘积矩阵子块构成的乘积矩阵,所述基于所述乘积矩阵中的元素确定预测结果包括基于多个乘积矩阵子块中的元素确定预测结果。
在本发明的另一实施例中,所述获得由多个用户向量构造的用户矩阵以及由多个对象向量构造的对象矩阵包括,获得样本数据,基于所述样本数据,确定多个用户向量和多个对象向量,以及通过所述多个用户向量构造用户矩阵以及通过所述多个对象向量构造对象矩阵。
在本发明的又一个实施例中,所述基于所述样本数据,确定多个用户向量和多个对象向量包括,通过基于矩阵分解的算法训练因子分解模型,以及使用经过训练的所述因子分解模型确定多个用户向量和多个对象向量。
在本发明的又一个实施例中,所述基于矩阵分解的算法包括FTRL算法。
在本发明的又一个实施例中,所述通过基于矩阵分解的算法训练因子分解模型包括,将所述样本数据分为训练样本数据和验证样本数据,基于所述训练样本数据,通过基于矩阵分解的算法训练因子分解模型,使用验证样本数据验证所述因子分解模型,其中,在所述因子分解模型未通过验证的情况下,调整参数继续训练所述因子分解模型。
在本发明的再一个实施例中,在使用经过训练的所述因子分解模型确定多个用户向量和多个对象向量之后,所述方法还包括,基于所述因子分解模型以及所述样本数据,绘制受试者工作特征曲线,确定所述受试者工作特征曲线下方与坐标轴之间围成的面积,在所述面积小于预设值的情况下,调整参数继续训练所述因子分解模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易传媒科技(北京)有限公司,未经网易传媒科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811463866.0/2.html,转载请声明来源钻瓜专利网。