[发明专利]基于TORQUE的并行检查点执行方法有效
申请号: | 201210367653.4 | 申请日: | 2012-09-28 |
公开(公告)号: | CN102915257A | 公开(公告)日: | 2013-02-06 |
发明(设计)人: | 林霞 | 申请(专利权)人: | 曙光信息产业(北京)有限公司 |
主分类号: | G06F11/00 | 分类号: | G06F11/00 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100193 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于TORQUE的并行检查点执行方法,在NFS文件共享存储系统中对计算节点进行检查点操作,所述方法包括如下步骤:(1).用户向TORQUE服务器守护进程pbs_server提交作业,提交命令加入检查点请求,作业脚本中使用作业启动命令chkp_mpirun启动任务;(2).TORQUE服务器守护进程发送任务消息给TORQUE调度器pbs_sched,TORQUE调度器pbs_sched根据作业中指定的参数要求寻找计算节点;(3).对计算节点进行检查点操作。本发明提供的基于TORQUE的并行检查点执行方法,运用改进的基于TORQUE的改进检查点技术,使得原来只支持单进程检查点的TORQUE,现在也能够支持多进程检查点,并能够对节点故障自动处理,对进程进行迁移。 | ||
搜索关键词: | 基于 torque 并行 检查点 执行 方法 | ||
【主权项】:
一种基于TORQUE的并行检查点执行方法,在NFS文件共享存储系统中对计算节点进行检查点操作,其特征在于,所述方法包括如下步骤:(1).用户向TORQUE服务器守护进程pbs_server提交作业;(2).TORQUE服务器守护进程发送任务消息给TORQUE调度器pbs_sched,TORQUE调度器pbs_sched根据作业中指定的参数要求寻找计算节点;(3).对计算节点进行检查点操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210367653.4/,转载请声明来源钻瓜专利网。