[发明专利]基于多种通信模式的深度学习大模型推理部署方法在审
| 申请号: | 202210502345.1 | 申请日: | 2022-05-09 |
| 公开(公告)号: | CN114816801A | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 杜江溯;方佳瑞;卞正达;李永彬 | 申请(专利权)人: | 北京潞晨科技有限公司 |
| 主分类号: | G06F9/54 | 分类号: | G06F9/54;G06N5/04 |
| 代理公司: | 武汉菲翔知识产权代理有限公司 42284 | 代理人: | 李慧奇 |
| 地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了基于多种通信模式的深度学习大模型推理部署方法,具体涉及程序模型领域,包括以下步骤:S1、对大模型进行模型并行与流水线并行分割;S2、进程运行,其中一个为主进程,除了主进程外的其他进程中,仅有通信初始化逻辑;S3、初始化所有通信;S4、主进程通过远程过程调用在所有进程上对相应模型分块进行实例化;S5、当一个推断请求到来时,主进程通过远程过程调用通知所有进程相应的信息,被调用的进程将执行信息压入自己的消息队列,后启动推理过程,本发明能够统一程序入口,实现非阻塞的流水线推理,在行为上,可将分布式推理封装成单设备推理具有相同行为,易于对分布式推理进行管理。 | ||
| 搜索关键词: | 基于 多种 通信 模式 深度 学习 模型 推理 部署 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京潞晨科技有限公司,未经北京潞晨科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210502345.1/,转载请声明来源钻瓜专利网。





