[发明专利]一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法在审
申请号: | 202110452694.2 | 申请日: | 2021-04-26 |
公开(公告)号: | CN114219083A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 彭超;刘鑫;刘沙;陈德训;黄则强;高捷;王宜鹏 | 申请(专利权)人: | 无锡江南计算技术研究所 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 王健 |
地址: | 214038 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 onnx 面向 caffe2 训练 深度 学习 模型 自动 转换 方法 | ||
本发明公开一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法,包括以下步骤:S1、ONNX文件向Caffe2文件的映射,得到Caffe2格式的前向传播网络,S2、根据S1中获得的前向传播网络的信息,自动生成求梯度算子,得到反向传播网络,S3、根据满足生成完整反向传播网络的需要,设计用户配置信息格式,将配置信息融入上步骤的模型定义文件中。本发明可以自动产生包括正向传播神经网络、反向传播神经网络、运行控制块和辅助算子的模型文件,从而进行训练任务。
技术领域
本发明涉及一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法,属于深度学习技术领域。
背景技术
近年来,随着深度学习技术的发展,各种深度学习框架不断涌现,这些框架各有特点,并没有哪一家成为事实上的标准。在每个框架中,各自有其使用的模型定义格式,彼此之间并不兼容,若想从一个框架移植到另一个框架,常常需要重新编程,这就需要了解目标框架的编程模式,移植门槛较高。
多家深度学习框架厂商联合推出了ONNX,成为事实上的标准。目前,主流框架大多支持将深度学习模型导出为ONNX格式,这为模型移植打下了一个基础。但ONNX模型仅支持推理,不支持训练,从训练的角度看,ONNX模型缺失的信息很多,需要进行扩展和补充。
ONNX是一个用于表示深度学习模型的标准,可使模型在不同框架之间进行转移,它由三部分组成:可扩展计算图模型的定义、标准数据类型的定义、内置运算符的定义;
基本格式是Model、Graph、Node三级定义,简略描述如下:
Model
Graph
Node
Caffe2是2017年发布的一款轻量级和模块化的深度学习框架,它除了提供python的编程接口之外,还提供了直接运行模型定义文件的方式进行训练,它的基本格式为Plan、Net和Operator三级定义,简略描述如下:
Plan
Net
Operator
ONNX与Caffe2的格式定义中,既有等价的部分,也有互相多出的部分。其中,ONNX作为输入,多出的部分信息可以舍去,Caffe2多出的部分,除了可以通过上下文推断出来的部分外,其余需要通过配置文件的方式进行填写。
目前,Caffe2提供了Caffe向Caffe2进行模型转换的工具。这是两个框架各自模型格式之间的转换,不涉及ONNX,因此是专有工具,缺乏通用性,不适用于第三方深度学习框架向Caffe2的转换。
发明内容
本发明的目的是提供一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法,其。
为达到上述目的,本发明采用的技术方案是:提供一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法,包括以下步骤:
S1、ONNX文件向Caffe2文件的映射,得到Caffe2格式的前向传播网络,具体包括:
计算图模型映射:Model到Plan的映射、Graph到Net的映射以及Node到Operator的映射;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110452694.2/2.html,转载请声明来源钻瓜专利网。