[发明专利]一种云环境下执行可靠性感知的并行任务调度方法有效

专利信息
申请号: 201710227551.5 申请日: 2017-04-10
公开(公告)号: CN107038070B 公开(公告)日: 2021-04-16
发明(设计)人: 张志锋;曹洁;孙玉胜;张建伟;邓璐娟;郑倩;马军霞;桑永宣;赵晓君 申请(专利权)人: 郑州轻工业学院
主分类号: G06F9/48 分类号: G06F9/48;G06F9/50;H04L29/08
代理公司: 河南广文律师事务所 41124 代理人: 王自刚
地址: 450000 *** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种云环境下执行可靠性感知的并行任务调度方法,涉及云计算技术领域,本发明针对用户对并行任务有完成截止时间和执行可靠性的要求,根据云计算系统的计算资源和通信设备的故障率服从指数分布的特点,生成并行任务在云计算系统上执行的所有执行方案,将这些执行方案构建执行方案图,基于执行方案图,提出满足并行任务完成截止时间要求的最大可靠性执行方案求解算法MREP,而且MREP算法切实可行,在并行任务执行可靠性、并行任务执行成功率和完成时间方面都表现出较好的性能。
搜索关键词: 一种 环境 执行 可靠性 感知 并行 任务 调度 方法
【主权项】:
一种云环境下执行可靠性感知的并行任务调度方法,其特征是:具体调度方法如下:第一步,将并行任务的有向无环图中的各个子任务分配到处理机上进行并行协同计算,任务统一由中心调度器管理并将每个子任务分配到合适的处理机上,通信由通信子系统控制执行,并行任务的子任务在不同计算资源上的执行时间可用执行时间矩阵Tn×m来表示:Tn×m={tij|1≤i≤n,1≤j≤m},其中tij表示任务vi在处理机pj上执行所需的时间;第二步,任务vi在处理机pj上的执行可靠性定义为处理机pj成功完成任务vi的概率,若处理机pj的故障率λj服从指数分布,pj完成任务vi所需的时间为ti,j,则任务vi在处理机pj上的执行可靠性PR(vi,pj)=exp(‑λjti,j),其中,λjti,j称为任务执行的可靠性代价,任务执行可靠性越大,任务执行的可靠性代价越小,任务执行可靠性越小,任务执行的可靠性代价越大,任务执行可靠性由处理机的处理速度和处理机的故障率共同决定,任务vi被调度到处理机ps上,vi的直接后继任务vj被调度到处理机pd上,vi与vj间需要传输的数据为di,j,当di,j从处理机ps传输到处理机pd所经过的通信路径为li,j=(li,1,li,2,…,li,m),li,k(k=1…m)表示通信路径li,j所经过的邻接通信链路;当di,j经过邻接链路li,k所用的时间为ti,k,邻接链路li,k的故障率为λi,k,各个邻接链路的失效事件相互独立,则数据di,j在通信路经li,j上的传输可靠性TR(di,j,li,j),即在通信路经li,j上成功传输数据di,j的概率,为di,j在每个邻接链路上成功传输的概率的乘积:式子一TR(di,j,li,j)=Πk=1mexp(-λi,kti,k)=exp(-Σk=1mλi,kti,k)]]>其中,称为数据di,j在通信路经li,j上的传输可靠性代价,由公式(1)可知:最大化数据di,j的传输可靠性,即为最小化传输可靠性代价第三步,有前驱的子任务vj能在处理机pd上成功完成的条件是:vj和其前驱任务vi∈pred(vj)间需要传输的数据成功传输到处理机pd上;处理机pd在完成任务vj的时间段内不失效,即任务vj在处理机pd上的执行可靠性依赖于vj在pd上的独立的任务执行可靠性和vj所依赖数据的传输可靠性,令p(vi)表示执行任务vi的处理机,则vj在pd上的执行可靠性记为PPR(vj,pd),以便和独立任务执行可靠性PR相区别,PPR(vj,pd)的计算公式如下:式子二PPR(vj,pd)=PR(vj,pd)×Πvi∈pred(vj)(PPR(vi,p(vi))×TR(di,j,li,j))]]>对于入口任务ventry来说,由于其前驱任务集因而其可靠性由其独立的任务执行可靠性决定,即PPR(ventry,p(ventry))=PR(ventry,p(ventry));对于并行任务在云计算系统Cloud上的一种调度执行,令RC表示并行任务各子任务在其所分配的处理机上独立执行的可靠性代价与任务间的依赖数据在处理机间传输的可靠性代价之和,则该调度执行的执行可靠性PPR(DAG,Cloud)为:定理一:PPR(DAG,Cloud)=PPR(vexit,p(vexit))=exp(‑RC)证明:在并行任务DAG的调度执行过程中,DAG的一个子任务只有在它的全部前驱任务成功完成,且该任务和它们间的依赖数据成功传输到该任务所在的处理机,该任务才能开始执行,因而,对于并行任务DAG在云计算系统上的一种调度执行,并行任务被成功完成的可靠性的大小,可从任务ventry所在的处理机开始,递推计算每个子任务在其被分配的处理机上的执行可靠性,直至出口任务vexit,即并行任务DAG在云计算系统上的执行可靠性,就是vexit在其所在的处理机上的执行可靠性PPR(vexit,p(vexit))。假定并行任务DAG边ei,j上的数据di,j在p(vi)和p(vj)间传输,所经过的链路个数为mij。由(2)式知,PPR(vexit,p(vexit))可表示为:式子三PPR(vexit,p(vexit))=PR(vexit,p(vexit))×Πvi∈pred(vexit)(PPR(vi,p(vi))×TR(di,exit,li,exit))]]>对式三逐步进行扩展:定理一可知,提高并行任务的执行可靠性,相当于降低并行任务的子任务独立执行的可靠性代价与任务间依赖数据传输的可靠性代价之和RC,RC越小,并行任务的执行可靠性越高;第四步,当子任务va被调度到处理机psrc,va的直接后继任务vb被调度到处理机pdst,则这两个任务间的依赖数据da,b必须从处理机psrc传输到处理机pdst,从处理机psrc到处理机pdst可能存在多条通信路径,由4.2节知:求数据da,b的最大可靠性传输路径,就是求数据da,b在两个处理机间有最小传输可靠性代价的路径,下面给出数据在两处理机间的最大可靠性传输路径查找算法Maximal Reliability Communication Path。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业学院,未经郑州轻工业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710227551.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top