[发明专利]神经网络模型的转换方法、模型精度定位方法及装置在审
申请号: | 202010129010.0 | 申请日: | 2020-02-28 |
公开(公告)号: | CN113326913A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 罗培超;徐迟;张行程 | 申请(专利权)人: | 上海商汤智能科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;董文俊 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 转换 方法 精度 定位 装置 | ||
本公开提供了一种神经网络模型的转换方法、模型精度定位方法及装置。在神经网络模型的转换的方案中,模型转换装置根据源框架下的第一神经网络模型和目标框架下的第二神经网络模型对同一模型输入数据分别得到的推理结果,可以自动得到第二神经网络模型的精度验证结果,提高了神经网络模型转换的精度验证效率。在模型精度定位的方案中,模型精度定位装置根据源框架下的第一神经网络模型和目标框架下的第二神经网络模型对同一模型输入数据分别得到的每个网络层的输出数据,可以定位第二神经网络模型中精度未对齐的目标网络层,实现了精度未对齐时的网络层的准确定位。
技术领域
本公开涉及人工智能(artificial intelligence,AI)技术领域,尤其涉及一种神经网络模型的转换方法、模型精度定位方法及装置。
背景技术
目前业界开发了各种各样的深度学习模型框架,每个框架具备自己的网络结构定义和工具包。由于不同的框架在训练、部署、平台兼容性等方面上有各自的优势,因此经常需要对深度学习模型进行框架之间的转换。神经网络模型的转换是指把在某个框架下定义的神经网络模型转换到另一个框架下。
然而,在神经网络模型转换后,需要通过程序员手动来验证模型精度,精度验证效率低下。
发明内容
本公开提供了一种神经网络模型的转换技术方案。
第一方面,提供了一种神经网络模型的转换方法,所述方法包括:模型转换装置获取源框架下的第一神经网络模型、模型输入数据以及目标框架的信息;模型转换装置基于所述模型输入数据对所述源框架下的第一神经网络模型进行模型转换处理,得到所述目标框架下的第二神经网络模型;模型转换装置基于所述第一神经网络模型和所述第二神经网络模型分别对所述模型输入数据的推理结果,得到所述第二神经网络模型的精度验证结果。
模型转换装置可以基于用户指令进行模型转换处理,该用户指令用于指示将源框架下的第一神经网络模型转换到目标框架下,该用户指令包括源框架下的第一神经网络模型、模型输入数据以及目标框架的信息。模型转换装置也可以基于内部的操作指令进行模型转换处理,例如模型转换指令,该内部的操作指令用于指示将源框架下的第一神经网络模型转换到目标框架下,该内部的操作指令包括上述信息。
在一种可能的实现中,模型转换装置在对第一神经网络模型进行模型转换处理的过程中得到所述第一神经网络模型对所述模型输入数据的第一推理结果。
在一种可能的实现中,模型转换装置在本地存储所述第一推理结果。
在一种可能的实现中,模型转换装置通过所述第二神经网络模型对所述模型输入数据进行处理,得到第二推理结果。
在一种可能的实现中,模型转换装置通过比较第一推理结果和第二推理结果,得到第二神经网络模型的精度验证结果。
在一种可能的实现中,所述对所述源框架下的第一神经网络模型进行模型转换处理,得到所述目标框架下的第二神经网络模型,包括:通过第一进程对所述源框架下的第一神经网络模型进行模型转换处理,得到所述目标框架下的第二神经网络模型;所述方法还包括:通过所述第一进程创建第二进程;通过所述第一进程调用所述第二进程,在所述第二进程中通过所述第二神经网络模型对所述模型输入数据进行处理,得到第二推理结果。
在一种可能的实现中,所述模型转换装置基于所述第一神经网络模型和所述第二神经网络模型分别对所述模型输入数据的推理结果,得到所述第二神经网络模型的精度验证结果,包括:若所述第一推理结果与所述第二推理结果之间的差别处于预设误差范围内,确定所述第二神经网络模型的精度验证结果为精度对齐;和/或若所述第一推理结果与所述第二推理结果之间的差别超出所述预设误差范围,确定所述第二神经网络模型的精度验证结果为精度未对齐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤智能科技有限公司,未经上海商汤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010129010.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于区块链的数据处理方法及装置
- 下一篇:液冷马达散热结构