[发明专利]一种基于小样本数据的实时推荐方法和系统有效
申请号: | 202111083715.4 | 申请日: | 2021-09-16 |
公开(公告)号: | CN113536140B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 张凯;马乐乐;杨光远;朱国立;王子璇;张梅玉 | 申请(专利权)人: | 广东众聚人工智能科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q50/20;G06N3/04;G06N3/08 |
代理公司: | 北京中和立达知识产权代理有限公司 11756 | 代理人: | 杨磊 |
地址: | 519000 广东省珠海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 样本 数据 实时 推荐 方法 系统 | ||
本发明涉及一种基于小样本数据的实时推荐方法,所述方法提供实时学习,实时的范围t可以根据不同应用环境进行调整。具体来说,本发明基于历史时间段t−1数据训练的模型,加入当前时间段t收集的数据,经过重训练之后对时间段t+1的用户交互进行预测。本发明从样本选取、模型测试到模型使用均利用了样本的时序特征,从而使得训练速度更快,检测精度更高,降低了异常检测误报率。
技术领域
本发明涉及用户推荐技术领域,尤其涉及一种基于小样本数据的实时推荐方法和系统。
背景技术
随着信息化时代的快速发展,各种互联网产品在人们的日常生活中扮演着越来越重要的角色。例如通讯软件,电子商务平台以及线上教学平台等,可以实现远距离通讯,线上购物和线上学习,极大地便利了人们的生活。以线上学习为例,从早期的网上查阅学习资料,到现在的各大线上教育平台的普及,线上教学的重要性越来越明显,它为广大学生提供了更多的学习机会。尤其对于一些基础较差的学生,线上教育可以为他们提供巩固知识,锻炼解题思路的平台,从而使得学生能够提升自身的学习表现。那么,实现个性化教学就是线上教学技术一个重大需求。平台能够更好的实现因材施教,才会为学生提供最合适的帮助,才能达到共赢的目的。同样,对于一些其他线上推荐系统来说,个性化推荐也扮演着重要角色。对于线上推荐平台来说,实现个性化推荐的一个关键挑战在于用户行为的多少。原则上,获取到更多的用户的行为,可以实现更好的推荐。然而,值得注意的是,新用户在短期内产生的行为数据并不充分,若平台无法利用现有数据尽早的对用户实现个性化推荐,那么用户可能会因为体验感太差,在使用某段时间之后因失去耐心而放弃使用,这就使得初期推荐达不到效果,而且起到相反的作用。现有的推荐方法要么为了追求更高的准确性,忽略了用户早期的体验。这种方法会随着时间线的推移展线出其优越的性能,但与此同时也会在早期失去大部分的用户;部分方法在早期就对用户建模,从而实现尽早的个性化推荐,并随着用户行为的增加,使得推荐性能逐步提高。但随着时间推移,该方法在建模时会产生大量的计算,使得后期维护代价过高,无法实现广泛使用。本发明为了解决上述方法的不足,本发明通过对小样本数据建模,解决用户早期行为数据过少,个性化推荐性能较低的问题,从而实现早期的个性化推荐;首先:通过设计适当的时间段,基于记忆神经网络,在历史模型状态的基础上,只需对新加入时间段的数据进行训练,然后融合历史状态和当前状态对模型进行更新,从而对下一个时间段的用户交互进行预测,减少模型重训练的代价的同时也满足了不同系统的实时性需求。
发明内容
为了解决现有技术中的上述问题,本发明提出了一种基于小样本数据的实时推荐方法,所述方法包含:
步骤S1: 数据分割,具体为:对原始序列数据根据时间段t进行分割,分割后的数据元素中每个元素D中包含的数据均在一个时间跨度范围内;将数据元素分割成元素重叠的K元组,其中:K为预测模型中记忆神经元的个数;两个相邻的K元组中存在K-1个重叠元素;两个相邻的第ti和ti+1的K元组分别为:(Dti,Dti+1 … Dti+K−1)和(Dti+1,Dti+1 … Dti+K);其中:K值的设置和神经网络模型中神经元的数量相关;
所述K为动态设置的,随着原始序列数据的数量增加K值;
步骤S2:作数据向量化表示;具体的:将元组中的数据元素输入特征空间转化函数f(X)→𝒳,获得一个维度变小的向量表示;
步骤S3:预测模型的初始化;具体的:初始化权重文件,从第1个K元组开始,使用已有的K元组对预测模型进行初始化训练;
步骤S4:预测模型的训练;收集随着时间增长的新时间段的数据,对初始化后的预测模型进行不断的更新学习;实时检测是否需要进行用户推荐,如果是,则进入步骤S5,否则,重复步骤S4;
步骤S5:预测用户交互数据;输入当前时间段的数据,输入预测模型以预测生成下一时间段的数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东众聚人工智能科技有限公司,未经广东众聚人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111083715.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光子自旋定向分离器
- 下一篇:一种触水自调式冰层厚度测量仪及其使用方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置