[发明专利]一种迁移学习训练方法、装置、电子设备及存储介质在审
申请号: | 202111096355.1 | 申请日: | 2021-09-17 |
公开(公告)号: | CN114021714A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 吴学超;周杨;白云龙;秦才霞 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 江宇 |
地址: | 100089 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 迁移 学习 训练 方法 装置 电子设备 存储 介质 | ||
1.一种迁移学习训练方法,包括:
获取源域样本,所述源域样本中包含多个源域数据和与源域数据对应的标签值;
利用一阶段模型计算每个源域数据的第一交叉熵并根据第一交叉熵计算相似度权重;
获取目标域样本,所述目标域样本中包含多个目标域数据和与目标域数据对应的标签值;
利用二阶段模型计算每个源域数据和每个目标域数据的第二交叉熵;
根据每个源域数据和每个目标域数据的第二交叉熵与相似度权重计算每个源域数据和每个目标域数据的第三交叉熵;
根据每个源域数据和每个目标域数据的第三交叉熵对所述二阶段模型进行参数更新;
将参数更新后的二阶段模型对业务数据进行预估或排序。
2.根据权利要求1所述的方法,所述利用一阶段模型计算每个源域数据的第一交叉熵并根据第一交叉熵计算相似度权重,包括:
利用一阶段模型提取每个源域数据在预设N个维度上的特征数据;
根据每个源域数据中在预设N个维度上的特征数据对该源域数据进行预估,得到每个源域数据对应的预估值;
根据每个源域数据的标签值与预估值计算该源域数据的第一交叉熵;
根据每个源域数据的第一交叉熵计算该源域数据的相似度权重。
3.根据权利要求2所述的方法,所述利用二阶段模型计算每个源域数据和每个目标域数据的第二交叉熵,包括:
利用二阶段模型提取每个源域数据和每个目标域数据在预设M个维度上的特征数据,所述预设M个维度比预设N个维度多出L个维度,所述L个维度上的特征数据能够表征源域数据和目标域数据的差异性;
根据每个源域数据和每个目标域数据在预设M个维度上的特征数据对每个源域数据和每个目标域数据进行预估,得到每个源域数据和每个目标域数据的预估值;
根据每个源域数据和每个目标域数据的标签值与预估值计算每个源域数据和每个目标域数据的第二交叉熵。
4.根据权利要求1所述的方法,所述利用一阶段模型计算每个源域数据的第一交叉熵之后,还包括:
利用所述一阶段模型计算每个源域数据的第一交叉熵之后不对所述一阶段模型进行参数更新。
5.根据权利要求1所述的方法,所述利用一阶段模型计算每个源域数据的第一交叉熵并根据第一交叉熵计算相似度权重之后,还包括:
将源域样本中相似度权重小于等于预设阈值的源域数据剔除。
6.一种迁移学习训练装置,包括:
采集模块,用于获取源域样本,所述源域样本中包含多个源域数据和与源域数据对应的标签值;
计算模块,用于利用一阶段模型计算每个源域数据的第一交叉熵并根据第一交叉熵计算相似度权重;
所述采集样本,还用于获取目标域样本,所述目标域样本中包含多个目标域数据和与目标域数据对应的标签值;
所述计算模块,还用于利用二阶段模型计算每个源域数据和每个目标域数据的第二交叉熵;
所述计算模块,还用于根据每个源域数据和每个目标域数据的第二交叉熵与相似度权重计算每个源域数据和每个目标域数据的第三交叉熵;
训练模块,用于根据每个源域数据和每个目标域数据的第三交叉熵对所述二阶段模型进行参数更新;
处理模块,用于将参数更新后的二阶段模型对业务数据进行预估或排序。
7.根据权利要求6所述的装置,包括:
所述计算模块,还用于利用一阶段模型提取每个源域数据在预设N个维度上的特征数据;
所述计算模块,还用于根据每个源域数据中在预设N个维度上的特征数据对该源域数据进行预估,得到每个源域数据对应的预估值;
所述计算模块,还用于根据每个源域数据的标签值与预估值计算该源域数据的第一交叉熵;
所述计算模块,还用于根据每个源域数据的第一交叉熵计算该源域数据的相似度权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111096355.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种湿度传感器及其制备方法
- 下一篇:一种多媒体文件控制方法及装置