[发明专利]模型架构转换方法、装置、设备及存储介质在审
申请号: | 202111667226.3 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114356356A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 王燕飞;龚睿昊;余锋伟;胡健;路少卿 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06F8/61 | 分类号: | G06F8/61;G06F8/76 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 马丽;张颖玲 |
地址: | 100080 北京市海淀区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 架构 转换 方法 装置 设备 存储 介质 | ||
本公开实施例公开了一种模型架构转换方法、装置、设备及存储介质,其中,该方法包括:获取第一模型架构的初始模型;所述初始模型包括已注册的自定义算子;基于所述第一模型架构的第一算子集合与第二模型架构的第二算子集合之间的映射策略,将所述初始模型转换为所述第二模型架构下的中间模型;所述中间模型包括所述自定义算子对应的中间算子;解析所述中间模型,得到所述中间模型对应的有向无环图;基于所述有向无环图构建第三模型架构的目标模型。
技术领域
本公开实施例涉及人工智能领域,尤其涉及一种模型架构转换方法、装置、设备及存储介质。
背景技术
深度学习目前已经为日常生活提供了极大的便利,从拍照识物到刷脸支付乃至摄影增强,无一不依赖背后的深度学习技术。随着深度学习领域的扩大,产业界也越来越多的使用边缘异构设备来提供人工智能(Artificial Intelligence,AI)能力,借由此达到降本增效的目的,模型部署也从原先的运行在通用的GPGPU图形处理器(General-purposecomputing on graphics processing units,简称GPGPU)及CPU上逐渐扩展为运行到移动端GPU、DSP、NPU乃至各式各样的AI处理器。在此过程中,势必面临着深度算法研究领域所使用的工具如PyTorch,TensorFlow无法顺利高效的迁移至上述各异构设备的问题。
发明内容
本公开实施例提供一种模型架构转换方法、装置、设备及存储介质。
第一方面,提供一种模型架构转换方法,包括:
获取第一模型架构的初始模型;所述初始模型包括已注册的自定义算子;
基于所述第一模型架构的第一算子集合与第二模型架构的第二算子集合之间的映射策略,将所述初始模型转换为所述第二模型架构下的中间模型;所述中间模型包括所述自定义算子对应的中间算子;
解析所述中间模型,得到所述中间模型对应的有向无环图;
基于所述有向无环图构建第三模型架构的目标模型。
在一些实施例中,所述基于所述第一模型架构的第一算子集合与第二模型架构的第二算子集合之间的映射策略,将所述初始模型转换为所述第二模型架构下的中间模型,包括:
执行所述初始模型的推理过程,得到所述初始模型对应的第一计算图;所述第一计算图包括所述第一算子集合中的至少一个第一算子和所述至少一个第一算子之间的连接关系;
基于所述第一模型架构的算子集合与第二模型架构的算子集合之间的映射策略,在所述第二算子集合中确定所述至少一个第一算子中每一所述第一算子对应的第二算子;
基于所述至少一个第一算子之间的连接关系,确定至少一个第二算子之间的连接关系,并构建所述中间模型对应的第二计算图;
基于所述第二计算图,构建所述中间模型。
在一些实施例中,所述方法还包括:
响应于针对所述自定义算子的注册请求,将所述自定义算子添加至所述第一算子集合中;
添加所述自定义算子和所述中间算子之间的映射关系至所述映射策略,以完成所述自定义算子的注册过程。
在一些实施例中,所述自定义算子的算子标识和所述中间算子的算子标识相同,所述方法还包括:
基于所述自定义算子的算子标识在所述第二算子集合中查找所述中间算子;
在所述第二算子集合不包括所述中间算子的情况下,添加所述中间算子的定义至所述第二算子集合中;所述中间算子的语义与所述自定义算子的语义相同。
在一些实施例中,所述解析所述中间模型,得到所述中间模型对应的有向无环图,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111667226.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种室内停车导航系统
- 下一篇:无人洗地机补给站及无人洗地机系统