[发明专利]模型训练和数据分类方法及装置在审
| 申请号: | 202210113494.9 | 申请日: | 2022-01-30 |
| 公开(公告)号: | CN114444606A | 公开(公告)日: | 2022-05-06 |
| 发明(设计)人: | 王天祺;刘昊骋;徐世界;徐靖宇;田建 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 数据 分类 方法 装置 | ||
1.一种模型训练方法,所述方法包括:
根据预先获取的辅助样本和目标样本,得到训练样本;
采用预设的权重规则,生成所述训练样本的训练权重,所述权重规则用于使所述辅助样本和所述目标样本权重占比相同;
执行以下训练步骤:
将所述训练样本和所述训练权重输入基学习器,得到所述基学习器的输出;基于所述基学习器的输出,采用迁移算子调整所述训练权重,直到满足训练停止条件,得到目标模型。
2.根据权利要求1所述的方法,所述方法还包括:
若不满足所述训练停止条件,采用调整后的训练权重替代所述训练权重,并采用新基学习器替代所述基学习器,继续执行所述训练步骤,所述新基学习器与所述基学习器的结构和/或参数不同。
3.根据权利要求1所述的方法,其中,所述权重规则包括以下任意一项:
基于所述辅助样本的数量和所述目标样本的数量均匀生成所述辅助样本和所述目标样本的初始权重,并将所述辅助样本和所述目标样本的初始权重作为训练权重;
基于所述辅助样本的数量和所述目标样本的数量均匀生成所述辅助样本和所述目标样本的初始权重,对所述辅助样本和所述目标样本的初始权重中的正样本的权重各自乘以预设系数,对所述辅助样本和所述目标样本权重进行标准化,生成训练权重;
基于所述目标样本的数量生成所述目标样本的初始权重,使用截断正态分布函数随机生成所述辅助样本的初始权重,对所述辅助样本和所述目标样本的初始权重进行标准化,生成训练权重。
4.根据权利要求1所述的方法,其中,训练停止条件包括以下至少一项:
采用所述迁移算子的迭代训练轮次达到预设轮次;
所述辅助样本的权重在所述训练权重中的占比大于或等于设定阈值。
5.根据权利要求1-4之一所述的方法,其中,所述直到满足所述训练停止条件,得到目标模型,包括:
在满足训练停止条件之后,得到每次迭代训练对应的分类器,所述分类器通过调整所述基学习器的参数得到;
基于每次迭代训练对应的分类器,采用预设规则确定目标模型。
6.根据权利要求5所述的方法,其中,采用预设规则确定目标模型包括以下至少一项:
基于所有迭代训练对应的分类器,获取所述目标模型,所述目标模型的输出结果是所有迭代训练对应的分类器的输出结果的均值或者加权均值;
从所有迭代训练对应的分类器中确定满足第一预设指标的分类器,作为目标模型;
从所有迭代训练对应的分类器中确定满足第二预设指标的分类器,并基于该分类器前设定位的分类器,获取所述目标模型,所述目标模型的输出结果为所述前设定位的分类器的输出结果的均值或加权均值。
7.一种数据分类方法,所述方法:
获取待分类数据;
将所述待分类数据输入如权利要求1-6任一项所述的方法生成的目标模型中,输出所述待分类数据的分类结果。
8.一种模型训练装置,所述装置包括:
拼接单元,被配置成根据预先获取的辅助样本和目标样本,得到训练样本;
生成单元,被配置成采用预设的权重规则,生成所述训练样本的训练权重,所述权重规则用于使所述辅助样本和所述目标样本权重占比相同;
第一输入单元,被配置成将所述训练样本和所述训练权重输入基学习器,得到所述基学习器的输出;
调整单元,被配置成基于所述基学习器的输出,采用迁移算子调整所述训练权重;
第一获取单元,被配置成在满足所述训练停止条件时,得到目标模型。
9.根据权利要求8所述的装置,所述装置还包括:替代单元,所述替代单元被配置成若不满足所述训练停止条件,采用调整后的训练权重替代所述训练权重,并采用新基学习器替代所述基学习器,使得所述第一输入单元、所述调整单元、所述第一获取单元单元继续执行训练步骤,所述新基学习器与所述基学习器的结构和/或参数不同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210113494.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





