[发明专利]一种基于MPI高性能计算分层回卷恢复协议的动态分组系统有效
申请号: | 201610171985.3 | 申请日: | 2016-03-24 |
公开(公告)号: | CN105843706B | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 廖小飞;金海;张斌圣 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F9/48;G06F9/54 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于MPI高性能计算分层回卷恢复协议的动态分组系统,包括消息监测模块、消息分析模块、进程迁移模块,属于高性能计算和系统容错领域。消息监测模块用于监测MPI高性能计算应用程序中各个进程间的消息传递记录,并将该记录以三元组(源进程、目的进程、消息大小)的格式保存,最后将该消息传递记录提交给消息分析模块;消息分析模块用于对消息监测模块收集到的消息传递记录进行分析,分析出当前应用程序的消息传递模式,作为下次应用程序是否执行进程迁移模块的依据,同时利用前一次的消息传递模式来判断此次是否需要执行进程迁移模块;进程迁移模块用于在应用程序的消息传递模式发生变化时对变化的进程进行迁移操作,从而实现对分层回卷恢复协议性能的优化。 | ||
搜索关键词: | 一种 基于 mpi 性能 计算 分层 恢复 协议 动态 分组 系统 | ||
【主权项】:
1.一种基于MPI高性能计算分层回卷恢复协议的动态分组系统,其特征在于,包括消息监测模块、消息分析模块、进程迁移模块,其中:所述消息监测模块用于监测应用程序中各个进程间的消息传递记录,并将该记录以三元组的格式保存,最后将该消息传递记录提交给消息分析模块,其中三元组包括源进程、目的进程以及消息大小;所述消息分析模块用于对消息监测模块收集到的消息传递记录进行分析,分析出当前应用程序的消息传递模式,作为下次应用程序是否执行进程迁移模块的依据,同时利用前一次的消息传递模式来判断此次是否需要执行进程迁移模块;所述进程迁移模块用于在应用程序的消息传递模式发生变化时对相关进程进行迁移操作,实时更新进程分组,实现动态分组功能,如果程序未结束,则重新回到消息监测模块,在新的分组下继续运行应用程序;所述进程迁移模块是在当前的分组结果与得到的最佳分组结果不一致时执行的;进程迁移模块执行时,先暂停所有进程的通讯行为,每个进程将自己的进程快照使用BLCR保存,并从源节点传输到目的节点,读取进程快照并在目的节点上恢复进程,所有进程重新建立通讯连接,恢复通讯活动,完成进程迁移;所述进程迁移具体为:暂停进程:所有进程暂停通讯行为,等待在途中消息传输完成,让所有进程进入一致状态;写入进程快照:进程暂停后,每个进程在自己的结点上保存自己当前的状况为快照,并用BLCR将其保存成文件;进程信息传输:将进程快照从源节点传输到目的节点;重启进程:读取进程快照,并通过BLCR在目的节点上恢复进程;重新连接:一旦目的结点上的进程重启了,应用的所有进程同步并重新建立通讯连接,恢复通讯活动,此时进程迁移工作完成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610171985.3/,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法及装置
- 下一篇:一种自动调节BIOS选项值的方法