[发明专利]一种在机器学习中调整模型参数的方法及装置在审
申请号: | 201910588359.8 | 申请日: | 2019-07-01 |
公开(公告)号: | CN110298448A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 龚俊衡;徐莹 | 申请(专利权)人: | 成都品果科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 成都高远知识产权代理事务所(普通合伙) 51222 | 代理人: | 曾克;施磊 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络模型 模型参数 机器学习 数据标签 数据类型 损失函数 模型参数训练 参数调整 策略选取 工作效率 循环执行 训练步骤 奖励 收敛 查找 更新 优化 | ||
1.一种在机器学习中调整模型参数的方法,其特征在于,包括:
S1:获取输入数据;所述输入数据中包括数据标签;
S2:判断所述数据标签的数据类型;
S3:根据所述数据类型,选取待训练的网络模型,并选取用于优化所述网络模型的损失函数;
S4:根据当前策略选取所述网络模型的模型参数;
S5:采用所述模型参数训练所述网络模型,并根据所述损失函数计算损失值;将所述损失值作为当前策略的奖励;
S6:根据所述奖励更新当前策略,并循环执行步骤S4~S5,直至当前策略收敛。
2.根据权利要求1所述的在机器学习中调整模型参数的方法,其特征在于,所述数据类型包括:连续型,类别型;
当所述数据类型为连续型时,所述待训练的网络模型为回归网络模型,所述损失函数为回归损失函数;
当所述数据类型为类别型时,所述待训练的网络模型为分类网络模型,所述损失函数为分类损失函数。
3.根据权利要求1所述的在机器学习中调整模型参数的方法,其特征在于,判断所述当前策略收敛的方法包括:
在循环执行步骤S4~S5的过程中,相邻两次所述奖励不变。
4.一种在机器学习中调整模型参数的装置,其特征在于,包括:
获取单元,用于获取输入数据;所述输入数据中包括数据标签;
判断单元,用于判断所述数据标签的数据类型;
第一选取单元,用于根据所述数据类型,选取待训练的网络模型,并选取用于优化所述网络模型的损失函数;
第二选取单元,用于根据当前策略选取所述网络模型的模型参数;
模型训练单元,用于采用所述模型参数训练所述网络模型,并根据所述损失函数计算损失值;将所述损失值作为当前策略的奖励;
更新单元,用于根据所述奖励更新当前策略;
所述更新单元、所述第二选取单元、所述模型训练单元依次循环地进行参数传递,直至当前策略收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都品果科技有限公司,未经成都品果科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910588359.8/1.html,转载请声明来源钻瓜专利网。