[发明专利]训练模型的方法、装置、电子设备及可读存储介质在审
申请号: | 202110342815.8 | 申请日: | 2021-03-30 |
公开(公告)号: | CN115146773A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 张锦;谢乾龙;王兴星;朱尹华;王栋 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 模型 方法 装置 电子设备 可读 存储 介质 | ||
1.一种训练模型的方法,其特征在于,所述方法包括:
获取样本数据,所述样本数据包括低频用户样本和高频用户样本;
对每个样本数据标注样本标签,所述样本标签包括点击标签和分层标签;
将所述样本数据的输入特征输入初始的点击率预估模型,通过所述点击率预估模型将低频用户样本的输入特征映射到高频用户样本的输入特征空间,并输出每个样本数据的预估点击率和预估分层类型;
根据所述点击标签与所述预估点击率之间的差异,以及所述分层标签与所述预估分层类型之间的差异,迭代优化所述点击率预估模型的模型参数,得到训练完成的点击率预估模型。
2.根据权利要求1所述的方法,其特征在于,所述点击率预估模型包括识别映射网络、领域自适应网络、点击率预估网络,所述将所述样本数据的输入特征输入初始的点击率预估模型,通过所述点击率预估模型将低频用户样本的输入特征映射到高频用户样本的输入特征空间,并输出每个样本数据的预估点击率和预估分层类型,包括:
将所述样本数据的输入特征输入所述识别映射网络,通过所述识别映射网络识别所述输入特征对应的分层类型;
若识别到输入特征的分层类型为高频用户样本,则保持高频用户样本的输入特征不变,若识别到输入特征的分层类型为低频用户样本,则将低频用户样本的输入特征映射到高频用户样本的输入特征空间,得到映射后的输入特征;
将所述识别映射网络输出的样本特征分别输入所述领域自适应网络和点击率预估网络,所述识别映射网络输出的样本特征包括高频用户样本的输入特征以及低频用户样本的映射后的输入特征;
通过所述领域自适应网络预估所述识别映射网络输出的样本特征对应的分层类型,以及通过所述点击率预估网络预估所述识别映射网络输出的样本特征对应的点击率。
3.根据权利要求1所述的方法,其特征在于,所述将低频用户样本的输入特征映射到高频用户样本的输入特征空间,得到映射后的输入特征,包括:
将低频用户样本的输入特征乘以预设矩阵,得到映射后的输入特征。
4.根据权利要求1所述的方法,其特征在于,所述将低频用户样本的输入特征映射到高频用户样本的输入特征空间,得到映射后的输入特征,包括:
将低频用户样本的输入特征输入全连接层,通过所述全连接层输出映射后的输入特征,所述全连接层输出的维度和输入的维度相同。
5.根据权利要求1所述的方法,其特征在于,所述获取样本数据,包括:
获取样本数据以及所述样本数据对应于用户的点击结果;
按照预设时间段内用户的交互频率对所述样本数据进行分层,分为高频用户样本和低频用户样本。
6.根据权利要求1至5任一所述的方法,其特征在于,所述样本数据的输入特征包括如下至少一项:用户特征、商家特征、环境特征,其中,所述用户特征包括如下至少一项:用户的性别、年龄、历史偏好,所述商家特征包括如下至少一项:商家的品类、销量、销量排名,所述环境特征包括如下至少一项:时间、地理位置、天气。
7.一种点击率预估方法,其特征在于,所述方法包括:
获取目标用户的输入特征;
将所述目标用户的输入特征输入训练完成的点击率预估模型,通过所述点击率预估模型输出所述目标用户的点击概率,所述点击率预估模型根据上述权利要求1-6中任一所述的训练模型的方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110342815.8/1.html,转载请声明来源钻瓜专利网。