[发明专利]模型处理方法、预测方法、装置、设备及存储介质在审
申请号: | 202210365027.5 | 申请日: | 2022-04-08 |
公开(公告)号: | CN114677763A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 韩矞;周丹;周靖人;杨红霞;吴飞;况坤 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06K9/62;G06N3/04;G06V10/774;G06V10/80;G06V10/82 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 处理 方法 预测 装置 设备 存储 介质 | ||
本申请实施例提供了一种模型处理方法、预测方法、装置、设备及存储介质。模型处理方法包括:获取训练样本对应的行为特征向量和样本标签;通过初始注意力模型,基于注意力机制对行为特征向量进行特征压缩,得到初始记忆向量;将初始记忆向量输入初始预测模型,得到初始预测结果;基于初始预测结果和样本标签,对初始注意力模型和初始预测模型进行训练,得到训练完成的注意力模型和预测模型;并将行为特征向量输入训练完成的注意力模型,得到基准记忆向量;将基准记忆向量和训练完成的预测模型发送至移动端设备。本申请实施例能够更好地适应移动端设备上的运行环境,提升用户体验。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种模型处理方法、预测方法、装置、设备及存储介质。
背景技术
计算机技术的快速发展,使得利用移动端设备用户的历史行为大数据,进行移动端的用户行为预测成为现实。例如:针对目标用户,进行网站页面显示内容的点击行为预测、进行商品购买行为预测、进行服务行为预测,等等。
通常采用神经网络模型进行预测,具体地:预先在服务端系统中进行预测模型的训练,得到训练完成的预测模型;当移动端设备存在预测需求时,则向对应的服务端系统发送预测请求,服务端系统通过上述训练完成的预测模型得到预测结果,并返回至移动端设备。
上述方式,对于移动端设备和服务端系统之间的即时通信链路有较高要求,当通信链路出现故障导致移动端设备无法及时获取到预测结果时,则会极大地降低用户体验。
发明内容
有鉴于此,本申请实施例提供一种模型处理方法、预测方法、装置、设备及存储介质,以至少部分解决上述问题。
根据本申请实施例的第一方面,提供了一种模型处理方法,应用于服务端系统与移动端设备,包括:
获取训练样本对应的行为特征向量和样本标签;所述行为特征向量表征所述移动端设备的用户的行为信息;
通过初始注意力模型,基于注意力机制对所述行为特征向量进行特征压缩,得到初始记忆向量;
将所述初始记忆向量输入初始预测模型,得到初始预测结果;
基于所述初始预测结果和所述样本标签进行模型,对所述初始注意力模型和所述初始预测模型进行训练,得到训练完成的注意力模型和预测模型;并将所述行为特征向量输入所述训练完成的注意力模型,得到基准记忆向量;
将所述基准记忆向量和所述训练完成的预测模型发送至所述移动端设备。
根据本申请实施例的第二方面,提供了一种预测方法,应用于移动端设备与服务端系统,包括:
从所述服务端系统获取基准记忆向量和训练完成的预测模型;所述基准记忆向量为基于注意力机制对所述移动端设备的用户的历史行为特征向量进行特征压缩得到的;
获取所述用户的即时行为特征向量;并对所述即时行为特征向量中包含的各元素进行融合处理,得到融合后即时行为特征向量;
对所述融合后即时行为特征向量和所述基准记忆向量进行加权融合,并将加权融合结果输入至所述预测模型,得到预测结果。
根据本申请实施例的第三方面,提供了一种模型训练装置,应用于服务端系统与移动端设备,包括:
样本信息获取模块,用于获取训练样本对应的行为特征向量和样本标签;所述行为特征向量表征所述移动端设备的用户的行为信息;
特征压缩模块,用于通过初始注意力模型,基于注意力机制对所述行为特征向量进行特征压缩,得到初始记忆向量;
预测模块,用于将所述初始记忆向量输入初始预测模型,得到初始预测结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210365027.5/2.html,转载请声明来源钻瓜专利网。