[发明专利]对象分类模型训练、对象分类和对象推荐方法及装置在审
申请号: | 202310414442.X | 申请日: | 2023-04-13 |
公开(公告)号: | CN116304841A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 李昂;张晓露;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F18/214;G06F18/23;G06F18/22;G06F16/9535;G06F18/213;G06N3/08;G06N3/082;G06N3/0464;G06N3/045 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉;刘景峰 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 分类 模型 训练 推荐 方法 装置 | ||
1.一种基于自蒸馏的对象分类模型训练方法,包括:
将当前训练对象样本和各个当前样本聚类的聚类中心对象样本分别提供给对象分类模型进行分类预测,得到所述当前训练对象样本和各个聚类中心对象样本的分类预测结果,所述各个当前样本聚类通过对全量训练对象样本集进行聚类得到;
确定所述当前训练对象样本与各个聚类中心对象样本之间的样本相似度;
基于所述当前训练对象样本与各个聚类中心对象样本之间的样本相似度以及各个聚类中心对象样本的分类预测结果,确定所述当前训练对象样本的软标签;
根据所述当前训练对象样本的分类预测结果和软标签,确定当前损失函数;以及
基于所述当前损失函数,调整所述对象分类模型的当前模型参数。
2.如权利要求1所述的对象分类模型训练方法,其中,根据所述当前训练对象样本的分类预测结果和软标签,确定当前损失函数包括:
根据所述当前训练对象样本的分类预测结果和原始分类标签,确定当前原始标签损失项;
根据所述当前训练对象样本的分类预测结果和软标签,确定当前蒸馏损失项;以及
基于所述当前原始标签损失项和所述当前蒸馏损失项,确定所述当前损失函数。
3.如权利要求2所述的对象分类模型训练方法,其中,根据所述当前训练对象样本的分类预测结果和软标签,确定当前损失函数还包括:
确定所述当前训练对象样本相对于当前样本聚类的当前对比聚类损失项,
基于所述当前原始标签损失项和所述当前蒸馏损失项,确定所述当前损失函数包括:
基于所述当前原始标签损失项、所述当前蒸馏损失项和所述当前对比聚类损失项,确定所述当前损失函数。
4.如权利要求1所述的对象分类模型训练方法,其中,所述各个当前样本聚类通过对全量训练对象样本集中的正样本和负样本分别进行聚类得到。
5.如权利要求1所述的对象分类模型训练方法,还包括:
对所述当前训练对象样本进行样本聚类;以及
利用经过样本聚类后的当前训练对象样本对当前样本聚类进行样本聚类更新和聚类中心对象样本更新,
确定所述当前训练对象样本与各个聚类中心对象样本之间的样本相似度包括:
确定所述当前训练对象样本与各个当前样本聚类的经过更新后的聚类中心对象样本之间的样本相似度。
6.如权利要求1所述的对象分类模型训练方法,其中,所述对象分类模型包括嵌入层和分类层,将所述当前训练对象样本和各个聚类中心对象样本分别提供给对象分类模型进行分类预测,得到所述当前训练对象样本和各个聚类中心对象样本的分类预测结果包括:
将所述当前训练对象样本和各个聚类中心对象样本分别提供给所述对象分类模型的嵌入层,得到所述当前训练对象样本和各个聚类中心对象样本的样本特征表征;以及
将所述当前训练对象样本和各个聚类中心对象样本的样本特征表征分别提供给所述对象分类模型的分类层进行分类预测,得到所述当前训练对象样本和各个聚类中心对象样本的分类预测结果。
7.如权利要求6所述的对象分类模型训练方法,其中,确定所述当前训练对象样本与各个聚类中心对象样本之间的样本相似度包括:
基于对象样本的样本特征表征,确定所述当前训练对象样本与所述各个聚类中心对象样本之间的样本相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310414442.X/1.html,转载请声明来源钻瓜专利网。