[发明专利]超参数的确定方法、装置、设备和介质在审
申请号: | 201811180164.1 | 申请日: | 2018-10-10 |
公开(公告)号: | CN111027579A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 周旭辉;徐晓飞;刘凯 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 参数 确定 方法 装置 设备 介质 | ||
本发明实施例公开了一种超参数的确定方法、装置、设备和介质,涉及数据处理领域。该方法包括:将确定的至少两组超参数组分别设置于待训练的基础学习模型中,得到至少两个目标学习模型,并利用训练样本对各目标学习模型进行训练;对训练的各目标学习模型的预测效果进行测试,将预测效果满足设定效果要求的目标学习模型的超参数组,传递给预测效果不满足设定效果要求的目标学习模型;继续对各目标学习模型进行训练,直至各目标学习模型满足设定训练停止条件,根据各目标学习模型的预测效果确定目标超参数组。本发明实施例提供的一种超参数的确定方法、装置、设备和介质,提高了基于优化的超参数的模型预测效果。
技术领域
本发明实施例涉及数据处理领域,尤其涉及一种超参数的确定方法、装置、设备和介质。
背景技术
所谓超参数,就是机器学习模型里面的框架参数,比如聚类方法里面类的个数,或者话题模型里面话题的个数等,都称为超参数。它们跟训练过程中学习的参数(权重)是不一样的,通常是手工设定,不断试错调整,或者对一系列穷举出来的参数组合一通枚举(叫做网格搜索)。通常一个学习模型对应有多个超参数,该多个超参数构成一个超参数组。
超参数的手工设定中,因为每份数据的分布不同、输入不同,造成超参数复用性不强。同时超参数有些是浮点数,而浮点数的取值是无穷尽的。这些都导致需要花大量时间对超参数进行调测。
而网格搜索中固定的搜索步长会错过一些好的超参数。又因为需要按照设定搜索步长遍历所有可能的超参数,所以基于网格搜索的超参数的训练时间长。因此,需要指定停止时间,而停止时间的指定同样可能错过一些好的超参数,从而导致基于网格搜索确定的超参数的模型预测效果并不好。
发明内容
本发明实施例提供一种超参数的确定方法、装置、设备和介质,以提高基于优化的超参数的模型预测效果。
第一方面,本发明实施例提供了一种超参数的确定方法,该方法包括:
将确定的至少两组超参数组分别设置于待训练的基础学习模型中,得到至少两个目标学习模型,并利用训练样本对各目标学习模型进行训练;
对训练的各目标学习模型的预测效果进行测试,将预测效果满足设定效果要求的目标学习模型的超参数组,传递给预测效果不满足设定效果要求的目标学习模型;
继续对各目标学习模型进行训练,直至各目标学习模型满足设定训练停止条件,停止对各目标学习模型的训练,根据各目标学习模型的预测效果从各目标学习模型设置的超参数组中选择目标超参数组。
第二方面,本发明实施例还提供了一种超参数的确定装置,该装置包括:
模型训练模块,用于将确定的至少两组超参数组分别设置于待训练的基础学习模型中,得到至少两个目标学习模型,并利用训练样本对各目标学习模型进行训练;
超参数传递模块,用于对训练的各目标学习模型的预测效果进行测试,将预测效果满足设定效果要求的目标学习模型的超参数组,传递给预测效果不满足设定效果要求的目标学习模型;
最优超参数确定模块,用于继续对各目标学习模型进行训练,直至各目标学习模型满足设定训练停止条件,停止对各目标学习模型的训练,根据各目标学习模型的预测效果从各目标学习模型设置的超参数组中选择目标超参数组。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的超参数的确定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811180164.1/2.html,转载请声明来源钻瓜专利网。