[发明专利]一种基于递归自主式复杂任务分解系统及方法有效
申请号: | 201310020640.4 | 申请日: | 2013-01-18 |
公开(公告)号: | CN103092574A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 诸葛斌;王伟明;戴国伟 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 递归 自主 复杂 任务 分解 系统 方法 | ||
技术领域
本发明涉及计算机软件系统领域,具体涉及一种基于递归自主式复杂任务分解系统及方法。
背景技术
随着网络技术的发展,台式机,笔记本,平板电脑,智能手机等电子设备也层出不穷,极大的方便了人们的生活与工作。人们可以通过移动设备随时随地发布电子数据,比如发微博,拍照,发邮件等。可以说,我们正生活在数据时代,很难估计全球存储的电子数据总量是多少,据IDC(Internet Data Center)估计2011年“数字全球”项目(digital universe)的数据总量为1.8 ZB,而且这个数据每年都在迅速增加。1 ZB相当于10的21次方字节的数据,或者相当于1000EB,1000000PB,或者10亿TB的数据。这相当于世界上每个人一个磁盘驱动器的数量级。此外,还有大量数据,大部分数据被锁定在最大的网页内容中(如搜索引擎)或者金融和科学机构,个人数据也正在快速的增长。但更重要的是,计算机所产生的数据更为庞大。机器日志、RFID读取器、传感器网络、车载GPS和零售交易数据等,这些都促使“数据之山越来越高”。
公开发布的数据量也在逐年递增。作为企业或组织,再也不能只管理自己的数据,未来的成功在很大程度上取决于它是否能从其他组织的数据中提取出价值。因此,海量数据地处理就显得尤为重要。MapReduce是Google公司针对大规模群组中海量数据处理而开发的一种分布式编程模型。简单来说,Map是一个“分”的过程,它用于把海量数据分割成若干小块以分给若干台处理器去处理;而Reduce是一个“合”的过程,它主要把这些处理器执行后的结果进行汇总。MapReduce模型在整个系统中分为User、Master和Worker三个角色。User主要负责把用户程序提交给Master;Master,主要负责数据划分、任务调度、负载均衡、容错处理等,它会根据各个Worker的负载情况选择空闲的Worker为其分配Map、Reduce任务;Worker是工作节点,负责从Master接收任务进行数据处理和计算。Worker又分为Map Worker和Reduce Worker,Map Worker负责解析任务的键值对,执行Map操作,然后将中间结果缓存在本地磁盘,并将地址返回给Master;Reduce Worker从Master获得中间结果的键值对地址,读取数据,按key进行排序化简,并返回结果给用户程序。此模型非常方便使用,它隐藏了并行计算的细节,错误容灾,本地优化以及负载均衡。轻松完成大规模计算,比如,Google的网页搜索服务,排序,数据挖掘,机器学习,以及其他系统。通过MapReduce,应用程序可以再超过1000个节点的大型集群上运行,并提供经过优化的错误容灾。
现有任务分解方法存在以下问题,1.在现有的任务分解方法中,由于任务与计算机分解程序是一对一的关系,用户提交的任务通常是大型而复杂的,程序只能根据特定的任务设计分解处理程序。这种方法加剧了任务与程序的依赖性:特定的程序只能处理特定的任务,分解方式串行,执行方式单一;2.任务与程序的依赖性,不利于任务的灵活持续分解,比如,当任务的优先级和处理速度发生变化的情况下,计算机网络无法自动进行配置来应对这种变化的发生,从而使得网络的任务处理能力降低。
发明内容
本发明的目的是针对现有技术的不足,提供一种基于递归自主式复杂任务分解系统及方法。
一种基于递归自主式复杂任务分解系统,包括能力库、流水线库和递归分解模块。
能力库是指对任务进行处理的各种能力的集合,包括人工能力和程序能力,人工能力和程序能力均包括分解能力和执行能力;人工能力是由人工处理任务的能力,程序能力是由计算机程序处理任务的能力,分解能力是将任务分解为多个子任务,执行能力是根据任务的处理流程完成任务,通过把多个执行能力组合可以得到大颗粒度的能力,能力库中的各个能力描述中需要包含特性参数,包括能力的价格、信誉、执行时间和限制条件,能力库中的各个能力由能力的所有者向能力库注册。
流水线库包含多条流水线,每条流水线包含已知任务分解后的各子任务对应的执行能力的组合,且该组合是按各执行能力的执行先后顺序排列的,流水线库是指按一定的逻辑把所有已知任务的流水线进行统一管理。
递归分解模块接受用户提交的任务,通过递归处理将任务分解成各个子任务,直到各个子任务都和能力库中的执行能力对应,建立新的流水线,并将新的流水线添加到流水线库中。
一种基于递归自主式复杂任务分解方法,具体包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310020640.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轴向吸入叶轮锁紧螺母装置
- 下一篇:风机轴承箱