[发明专利]用于提高经训练的机器学习模型的性能的方法有效
申请号: | 201680048630.3 | 申请日: | 2016-08-11 |
公开(公告)号: | CN108027899B | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | S·S·塔拉迪;A·瓦尔塔卡 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N20/00;G06F18/214 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈炜;袁逸 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 提高 训练 机器 学习 模型 性能 方法 | ||
1.一种计算机实现的用于提高经训练的机器学习模型的性能的方法,包括:
在具有第二目标函数的第二分类器处接收由具有第一目标函数的第一分类器生成的特征表示;以及
在所述第二分类器处根据通过将所述特征表示与所述第二分类器的权重进行混合所生成的特征向量来对图像中所标识的对象进行分类,其中所述第二目标函数被配置成直接减少由所述第一分类器产生的分类误差的数目,其中所述第二目标函数是所述第一分类器与所述第二分类器的训练误差之间的差的函数,其中所述第一分类器的训练误差是使用硬概率来预测的并且所述第二分类器的训练误差是使用软概率来预测的。
2.如权利要求1所述的方法,其特征在于,所述第一目标函数是可微分的。
3.如权利要求1所述的方法,其特征在于,所述第二目标函数是非可微分的。
4.如权利要求1所述的方法,其特征在于,进一步包括至少部分地基于来自高复杂度模型的概率的混合来确定所述第二目标函数。
5.如权利要求1所述的方法,其特征在于,进一步包括添加所述第二分类器而不重新训练所述第一分类器。
6.如权利要求1所述的方法,其特征在于,进一步包括将所述第二分类器外部地添加到所述第一分类器。
7.如权利要求1所述的方法,其特征在于,进一步包括将为身份值的权重指派给由所述第一分类器训练的模型产生的特征。
8.如权利要求7所述的方法,其特征在于,进一步包括将为零的权重指派给由高复杂度模型的概率向量产生的特征。
9.如权利要求1所述的方法,其特征在于,进一步包括将权重指派给由所述第二分类器的概率向量产生的特征。
10.如权利要求1所述的方法,其特征在于,进一步包括将为零的权重指派给由高复杂度模型的概率向量产生的特征。
11.如权利要求10所述的方法,其特征在于,进一步包括将权重指派给由所述第二分类器的概率向量产生的特征。
12.如权利要求1所述的方法,其特征在于,进一步包括将由高复杂度模型产生的概率向量以固定的温度T为因子进行缩放。
13.一种用于提高经训练的机器学习模型的性能的装置,包括:
存储器;以及
至少一个处理器,其耦合到所述存储器,所述至少一个处理器被配置为:
在具有第二目标函数的第二分类器处接收由具有第一目标函数的第一分类器生成的特征表示;以及
在所述第二分类器处根据通过将所述特征表示与所述第二分类器的权重进行混合所生成的特征向量来对图像中所标识的对象进行分类,其中所述第二目标函数被配置成直接减少由所述第一分类器产生的分类误差的数目,其中所述第二目标函数是所述第一分类器与所述第二分类器的训练误差之间的差的函数,其中所述第一分类器的训练误差是使用硬概率来预测的并且所述第二分类器的训练误差是使用软概率来预测的。
14.如权利要求13所述的装置,其特征在于,所述第一目标函数是可微分的。
15.如权利要求13所述的装置,其特征在于,所述第二目标函数是非可微分的。
16.如权利要求13所述的装置,其特征在于,所述至少一个处理器被进一步配置为至少部分地基于来自高复杂度模型的概率的混合来确定所述第二目标函数。
17.如权利要求13所述的装置,其特征在于,所述至少一个处理器被进一步配置为添加所述第二分类器而不重新训练所述第一分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680048630.3/1.html,转载请声明来源钻瓜专利网。