[发明专利]场景模型训练方法、装置、介质及设备在审
| 申请号: | 202310338814.5 | 申请日: | 2023-03-31 |
| 公开(公告)号: | CN116644793A | 公开(公告)日: | 2023-08-25 |
| 发明(设计)人: | 张雅淋;李龙飞;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/084;G06N3/0455;G06F18/214;G06N5/02 |
| 代理公司: | 北京恒博知识产权代理有限公司 11528 | 代理人: | 范胜祥 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 场景 模型 训练 方法 装置 介质 设备 | ||
本说明书实施例公开了一种场景模型训练方法、装置、存储介质及设备。该方法包括:获取多个场景的样本数据,基于多个场景的样本数据构建场景通用模型;获取特定场景的样本数据,基于特定场景的样本数据对场景通用模型的参数进行调整,得到场景特定重模型。
技术领域
本说明书涉及机器学习技术领域,尤其涉及一种场景模型训练方法、装置、存储介质及设备。
背景技术
目前,机器学习技术应用的场景越来越广泛,例如,广告、预测、推荐系统、图像识别以及欺诈检测等场景。
在相关技术方案中,基于多个场景的全量数据构建一个整体模型,但该整体模型到了具体的特定场景时往往效果不及人意。
因此,如何充分利用多个场景的数据构建具有较好处理效果的模型,成为了亟待解决的技术难题。
发明内容
本说明书提供一种场景模型训练方法、装置、存储介质及设备,能够充分利用多个场景的样本数据构建模型,并针对性地提升各个特定场景的模型处理效果。
第一方面,本说明书实施例提供一种场景模型训练方法,包括:
获取多个场景的样本数据,基于所述多个场景的样本数据构建场景通用模型;
获取特定场景的样本数据,基于所述特定场景的样本数据对所述场景通用模型的参数进行调整,得到场景特定重模型。
在一些示例实施例中,基于上述方案,所述基于所述多个场景的样本数据构建场景通用模型,包括:
获取预设模型,基于所述多个场景的样本数据,通过超参数优化方式确定所述预设模型的参数,生成所述场景通用模型;或者,
基于所述多个场景的样本数据,通过网络结构搜索的方式确定所述场景通用模型的模型结构。
在一些示例实施例中,基于上述方案,所述预设模型包括:画像编码模块、行为编码模块以及预测模块,所述画像编码模块用于提取用户画像信息的嵌入,所述行为编码模块用于提取用户行为序列的嵌入,所述预测模块用于基于所述用户画像信息的嵌入以及所述用户行为序列的嵌入进行预测。
在一些示例实施例中,基于上述方案,所述超参数优化的超参数包括:学习率、所述画像编码模块的多层感知机层的维度、所述行为编码模块的变换器的编码器数以及所述预测模块的多层感知机层的维度中的一种或多种。
在一些示例实施例中,基于上述方案,所述特定场景的样本数据包括支持样本集,所述基于特定场景的样本数据对所述场景通用模型的参数进行调整,得到场景特定重模型,包括:
复制所述场景通用模型,得到初始场景特定重模型;
从所述特定场景的样本数据中获取支持样本集,基于所述支持样本集以及所述初始场景特定重模型的模型参数,确定所述初始场景特定重模型的模型损失;
基于所述模型损失对所述初始场景特定重模型进行训练,得到所述场景特定重模型。
在一些示例实施例中,基于上述方案,所述特定场景的样本数据还包括查询样本集,所述方法还包括:
从所述特定场景的样本数据中获取查询样本集,基于所述查询样本集以及所述场景特定重模型的参数确定所述场景特定重模型的模型损失;
基于所述场景特定重模型的模型损失,对所述场景通用模型的模型参数进行更新。
在一些示例实施例中,基于上述方案,所述基于所述模型损失,对所述场景通用模型的模型参数进行更新,包括:
针对多个特定场景,确定与所述多个特定场景中各个所述特定场景对应的场景权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310338814.5/2.html,转载请声明来源钻瓜专利网。





