[发明专利]一种神经网络训练方法、装置、计算设备及存储介质在审

申请号：	202211517866.0	申请日：	2022-11-30
公开（公告）号：	CN115983372A	公开（公告）日：	2023-04-18
发明（设计）人：	赵娟萍	申请（专利权）人：	哲库科技（上海）有限公司
主分类号：	G06N3/09	分类号：	G06N3/09;G06N3/045
代理公司：	北京易光知识产权代理有限公司 11596	代理人：	王姗姗;金爱静
地址：	200120 上海市浦东新区中国(上海)自由***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种神经网络训练方法装置计算设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种神经网络训练方法、装置、计算设备及存储介质，其中，所述方法包括：获取第一神经网络模型和第二神经网络模型；根据该第一神经网络模型和该第二神经网络模型，对超网络在超网络的子网络维度以及子网络的网络层维度进行双网知识蒸馏的联合训练，得到目标神经网络；其中，该目标神经网络为已训练好的超网络。采用本申请，通过双网络联合知识蒸馏提高了网络性能。

技术领域

本申请涉及人工智能技术领域，尤其涉及神经网络训练方法、装置、计算设备及存储介质。

背景技术

知识蒸馏是模型压缩的一种常用的方法，通过构建一个轻量化的小模型，利用性能更好的大模型的监督信息，来训练这个小模型，以期达到更好的性能和精度。

发明内容

本申请提供了一种神经网络训练方法、网络搜索方法、数据识别方法、神经网络训练装置、网络搜索装置、数据识别装置、计算设备、以及存储介质。

根据本申请的一方面，提供了一种神经网络训练方法，包括：

获取第一神经网络模型和第二神经网络模型；

根据该第一神经网络模型和该第二神经网络模型，对超网络在超网络的子网络维度以及子网络的网络层维度进行双网知识蒸馏的联合训练，得到目标神经网络；其中，该目标神经网络为已训练好的超网络。

根据本申请的另一方面，提供了一种网络搜索方法，包括：

发起搜索请求，该搜索请求用于表征在算力约束条件下搜索目标神经网络的操作请求，其中，该目标神经网络为采用上述任一项得到的已训练好的超网络；

响应该搜索请求，得到该目标神经网络中满足该算力约束条件的子网络。