[发明专利]基于样本回放的序列推荐模型的持续学习方法有效
申请号: | 202110881540.5 | 申请日: | 2021-08-02 |
公开(公告)号: | CN113590958B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 杨敏;原发杰;王李翰;李成明;姜青山 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/0601;G06N3/04;G06N3/08 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 耿慧敏;朱伟军 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 回放 序列 推荐 模型 持续 学习方法 | ||
本发明涉及一种基于样本回放的序列推荐模型的持续学习方法,涉及序列推荐技术领域,包括步骤一、构建序列推荐模型,利用初始数据对所述序列推荐模型进行训练;步骤二、基于物品类别平衡的样本选择策略对小部分具有代表性的范例样本进行采样;步骤三、对采样出来的范例样本进行软标签的计算与存储,以便参与下一次模型更新中参与蒸馏损失函数部分的计算;步骤四、利用所述序列推荐模型为用户提供准确的推荐服务,同时收集新周期内获得的新数据;步骤五、利用新周期内获得的新数据与之前存储的样本范例对所述序列推荐模型参数进行更新,有效解决了持续学习场景下使用神经网络序列推荐模型所面临灾难性遗忘的问题。
技术领域
本发明涉及序列推荐技术领域,尤其涉及基于样本回放的序列推荐模型的持续学习方法。
背景技术
近年来,序列推荐系统的算法设计与实际应用的相关研究在学术界以及工业界均引起了广泛的关注。随着深度学习技术的引入与使用,基于深度学习的序列推荐算法相较于协同过滤,因子分解机等传统推荐算法而言具有更加强大的特征挖掘能力,因此能够有效地捕获与利用用户兴趣偏好的变化趋势,进而生成更为优质的推荐结果。
虽然现有的神经网络序列推荐模型已经取得了足够的成功,但是它们通常是在离线的状态下利用静态的数据集进行训练与测试。然而随着推荐模型在短视频推荐,互联网购物等实际在线业务场景上的部署应用,推荐系统面临着不断输入的新数据流,需要“不停地学习”。因此推荐系统模型需要利用每个更新周期中获得的新数据对模型参数进行更新,更新后的模型需要在下次模型更新前为用户提供有效的推荐结果。在持续学习场景下使用神经网络序列推荐模型所面临的一个主要的挑战是灾难性遗忘的问题,即持续学习过程中进行参数更新的模型极易忘记之前学习得到的用户偏好模式。
序列推荐模型是近年来学术界和工业界的研究热点之一。序列推荐任务的目标在于利用当前会话中用户的历史物品交互信息,利用推荐算法有效地学习用户偏好模式以及捕获用户兴趣偏好的变化趋势,进而对用户下一个时间刻可能感兴趣的物品进行预测。
如图1所示,在基于深度学习的序列推荐算法成为主流的今天,深度学习技术中的循环神经网络(RNN),卷积神经网络(CNN),以及感知器网络(Transformer)等网络结构被广泛应用于推荐模型算法的设计当中。目前最为先进的神经网络序列推荐模型是SASRec(Wang-Cheng Kang and Julian McAuley.2018.Self-attentive sequentialrecommendation.In 2018IEEE International Conference on Data Mining(ICDM).IEEE,197–206.)和NextItNet(Fajie Yuan,Alexandros Karatzoglou,IoannisArapakis,Joemon M Jose,and Xiangnan He.2019.A simple convolutional generativenetwork for next item recommendation.In Proceedings of the Twelfth ACMInternational Conference on Web Search and Data Mining.582–590.)。SASRec模型通过使用基于自注意力机制的感知器网络(Transformer)能够有效学习历史物品交互序列中隐含的复杂特征模式,生成更为优质的推荐结果。NextItNet模型则通过空洞卷积网络以及残差块结构的使用增大了模型的感受野,显著增强了推荐模型对于交互序列的建模能力。
如图2所示,现阶段的推荐模型持续学习方法主要是利用每个更新周期中获得的新数据对模型参数进行更新,在不改变模型结构的情况下利用更新后的模型对用户进行物品推荐直至下一次模型更新前。该种方法使得模型非常容易忘记之前学习所得的用户偏好模式,引发灾难性遗忘问题的出现。这将导致部署在持续学习场景下的推荐系统的推荐效果大打折扣。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110881540.5/2.html,转载请声明来源钻瓜专利网。