[发明专利]一种对用户标记标签的方法和装置在审
申请号: | 202010565644.0 | 申请日: | 2020-06-19 |
公开(公告)号: | CN113761328A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 李强 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;王安娜 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 标记 标签 方法 装置 | ||
本发明公开了一种对用户标记标签的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取各个用户对各个品类的指标值,以构建目标矩阵;其中,所述目标矩阵中的任意一个元素表示任意一个用户对任意一个品类的指标值,所述目标矩阵中的元素包括已知元素和未知元素;基于奇异值分解对所述目标矩阵中的未知元素进行求解;根据所述未知元素的求解结果和所述已知元素,对各个所述用户标记标签,所述标签用于指示所述用户对所述品类的敏感程度。该实施方式能够解决标签粒度过于笼统和用户数据稀疏的技术问题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种对用户标记标签的方法和装置。
背景技术
随着个性化推荐的流行,各种针对用户的分析越来越重要。分析粒度越小,为用户标记的标签就会越准确。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
对用户标记的标签过于笼统,没有针对品类等更细粒度的标签;即便有针对单个品类的用户标签,但是不同用户对所有品类的计算存在数据稀疏的问题,而且计算效率比较低。
发明内容
有鉴于此,本发明实施例提供一种对用户标记标签的方法和装置,以解决标签粒度过于笼统和用户数据稀疏的技术问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种对用户标记标签的方法,包括:
获取各个用户对各个品类的指标值,以构建目标矩阵;其中,所述目标矩阵中的任意一个元素表示任意一个用户对任意一个品类的指标值,所述目标矩阵中的元素包括已知元素和未知元素;
基于奇异值分解对所述目标矩阵中的未知元素进行求解;
根据所述未知元素的求解结果和所述已知元素,对各个所述用户标记标签,所述标签用于指示所述用户对所述品类的敏感程度。
可选地,基于奇异值分解对所述目标矩阵中的未知元素进行求解,包括:
将所述目标矩阵分解为相乘的第一矩阵和第二矩阵;
采用所述目标矩阵中的已知元素训练所述第一矩阵和所述第二矩阵,使得所述第一矩阵和所述第二矩阵相乘的结果能够拟合所述目标矩阵中的已知元素,从而计算出所述第一矩阵和所述第二矩阵;
将所述第一矩阵和所述第二矩阵相乘,计算出所述目标矩阵,从而得到所述目标矩阵中的未知元素。
可选地,采用所述目标矩阵中的已知元素训练所述第一矩阵和所述第二矩阵,使得所述第一矩阵和所述第二矩阵相乘的结果能够拟合所述目标矩阵中的已知元素,从而计算出所述第一矩阵和所述第二矩阵,包括:
采用所述第一矩阵的各个元素和所述第二矩阵的各个元素,计算所述目标矩阵中各个元素的预测值;
根据所述目标矩阵中各个元素的预测值和真实值,计算所述目标矩阵的误差平方和;
以所述目标矩阵的误差平方和最小为目标函数,采用所述目标矩阵中的已知元素训练所述第一矩阵和所述第二矩阵,从而计算出所述第一矩阵和所述第二矩阵。
可选地,以所述目标矩阵的误差平方和最小为目标函数,采用所述目标矩阵中的已知元素训练所述第一矩阵和所述第二矩阵,从而计算出所述第一矩阵和所述第二矩阵,包括:
以所述目标矩阵的误差平方和最小为目标函数,基于梯度下降法并采用所述目标矩阵中的已知元素训练所述第一矩阵和所述第二矩阵,从而计算出所述第一矩阵和所述第二矩阵。
可选地,以所述目标矩阵的误差平方和最小为目标函数,基于梯度下降法并采用所述目标矩阵中的已知元素训练所述第一矩阵和所述第二矩阵,从而计算出所述第一矩阵和所述第二矩阵,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010565644.0/2.html,转载请声明来源钻瓜专利网。