[发明专利]基于混合监督神经网络结构搜索的宇宙学参数估计方法在审
申请号: | 202211425715.2 | 申请日: | 2022-11-15 |
公开(公告)号: | CN115758880A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 卢宇彤;文英鹏;郑馥丹;黄聃;陈志广 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/0464;G06N3/09 |
代理公司: | 深圳市创富知识产权代理有限公司 44367 | 代理人: | 范伟民 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 混合 监督 神经网络 结构 搜索 宇宙学 参数估计 方法 | ||
本发明公开了基于混合监督神经网络结构搜索的宇宙学参数估计方法,该方法包括:根据搜索空间的操作模块构建宇宙学参数估计模型的超网络;基于梯度下降法,对宇宙学参数估计模型的超网络进行混合监督训练,搜索得到宇宙学参数估计模型的结构;基于梯度下降法,对宇宙学参数估计模型的结构进行训练并优化,得到最优宇宙学参数估计模型;通过最优宇宙学参数估计模型进行宇宙学参数的估计。通过使用本发明,能够证明神经网络架构搜索可以应用于宇宙学参数估计并提高了宇宙学参数估计模型对宇宙学参数估计的准确性。本发明作为基于混合监督神经网络结构搜索的宇宙学参数估计方法,可广泛应用于人工智能技术领域。
技术领域
本发明涉及人工智能技术领域,尤其涉及基于混合监督神经网络结构搜索的宇宙学参数估计方法。
背景技术
天文学在今天确实发展迅速,使得宇宙学模型能够成功地描述宇宙,准确地估计宇宙学模型的参数有助于我们正确推测宇宙的膨胀过程和演化过程,但是,根据现有人类掌握的宇宙学知识,不足以抽象出准确的宇宙学参数估计方法,随着深度学习的创新,现有的工作已经使用深度神经网络来估计宇宙学参数,例如通过使用3D卷积神经网络估计宇宙学参数,训练数据集由N-Body模拟器生成,通过梯度下降法多次迭代更新模型参数,使得3D卷积神经网络可以较为准确地估计宇宙学参数。进一步的,有工作将3D卷积神经网络宇宙学参数估计模型扩展至超算上,并对模型做了维度调整,利用超算设备进行大规模的训练,在准确度上有明显地提升。轻量级的宇宙学参数估计模型则是对输入数据进行了大量的分割,使得处理的数据体量变小,减少训练时间,并保证了一定的准确性,但是,人工设计的神经网络结构模型,存在设计费时,模型精度低的缺点,每次新设计出一个用于宇宙学参数估计的模型需要花费大量的时间训练和验证模型。这个过程通常需要10天以上。如果模型的表现不好,需要改进模型的结构,设计新模型,新的模型又需要花费大量时间训练和验证。人工设计的模型需要不断重复模型设计、训练和验证过程,效率低下,花费时间长,即使这样,花费大量精力设计的模型,仍然存在宇宙学参数估计误差大,不准确的问题。
发明内容
为了解决上述技术问题,本发明的目的是提供基于混合监督神经网络结构搜索的宇宙学参数估计方法,能够证明神经网络架构搜索可以应用于宇宙学参数估计并提高宇宙学参数估计模型对宇宙学参数估计的准确性。
本发明所采用的第一技术方案是:基于混合监督神经网络结构搜索的宇宙学参数估计方法,包括以下步骤:
根据搜索空间的操作模块构建宇宙学参数估计模型的超网络;
基于梯度下降法,对宇宙学参数估计模型的超网络进行混合监督训练,搜索得到宇宙学参数估计模型的结构;
基于梯度下降法,对宇宙学参数估计模型的结构进行训练并优化,得到最优宇宙学参数估计模型;
通过最优宇宙学参数估计模型进行宇宙学参数的估计,所述宇宙学参数包括暗物质比率、原始功率谱指数和物质超密度方差。
进一步,所述根据搜索空间的操作模块构建宇宙学参数估计模型的超网络这一步骤,其具体包括:
定义搜索空间,所述搜索空间包括头部固定模块、尾部固定模块和操作模块;
对操作模块进行混合连接处理,构建搜索主干模块;
对头部固定模块、搜索主干模块和尾部固定模块进行依次连接处理,构建宇宙学参数估计模型的超网络。
进一步,所述模型权重优化的计算公式如下所示:
上式中,表示超网络的权重,表示架构的集合,表示损失函数,x表示输入的数据,y表示标签,表示最优模型权重。
进一步,所述模型结构优化的计算公式如下所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211425715.2/2.html,转载请声明来源钻瓜专利网。