[发明专利]应用程序的跟踪记录压缩方案的生成方法及其装置无效

专利信息
申请号: 200810129257.1 申请日: 2008-06-26
公开(公告)号: CN101615157A 公开(公告)日: 2009-12-30
发明(设计)人: 李严;王鲲;冯宽;杨雨东 申请(专利权)人: 国际商业机器公司
主分类号: G06F11/36 分类号: G06F11/36
代理公司: 北京市中咨律师事务所 代理人: 李 峥;刘 薇
地址: 美国*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 应用程序 跟踪 记录 压缩 方案 生成 方法 及其 装置
【说明书】:

技术领域

本发明涉及异构多核体系结构上的应用程序调试,具体地说,涉及对在异构多核体系结构上运行应用程序时生成的跟踪记录进行压缩的方法、装置以及包括该压缩装置的异构多核体系结构。

背景技术

异构多核体系结构在密集型计算、图形处理方面有明显的优势,一般地,异构多核体系结构至少包括一个主处理器和多个加速器(也称为“协处理器”),其中主处理器主要用于分配任务和协同加速器,加速器用于执行例如浮点运算等的具体计算处理。异构多核体系结构的一个例子是由索尼、东芝和IBM公司联合开发的Cell Broadband Engine(简称为CellBE),其以IBM公司所研发的64位元POWERTM处理机为核心(PPE),结合8个互相协作的处理机单元(SPEs)而构成。

对于在异构多核体系结构上运行的应用程序来说,正确性和性能是关键。因此,在应用程序的开发过程中,应用程序的性能调试是必不可少的。在利用性能调试工具调试应用程序的期间,会产生大量的数据,这些数据以跟踪记录的形式从加速器传送到主处理器中的主存储器,然后由性能调试工具基于跟踪记录来分析应用程序的执行。

通常,跟踪记录通过直接存储器存取(DMA)方式从加速器传送到主处理器。例如,在上述的Cell BE中,每当SPE生成128字节的跟踪记录时,该跟踪记录就通过DMA转储到PPE中。然而,跟踪记录的传送会带来巨大的开销,并严重影响应用程序的行为。随着跟踪记录数量的增加,开销呈指数性增加。因此,需要对跟踪记录进行压缩。

在现有技术中已经公开了一些对跟踪记录进行压缩的技术,例如,美国专利US7,058,859“Trace Reporting Method and System(跟踪记录方法和系统)”、美国专利US6,918,065“Method for Compressing andDecompressing Trace Information(压缩和解压缩跟踪信息的方法)”、美国专利US7,209,058“Trace Receiver Data Compression(跟踪接收机数据压缩)”、美国专利US7,308,681“Control Flow Based Compression ofExecution Traces(基于控制流的执行跟踪的压缩)”、美国专利申请US20070294590“Compression Scheme to Reduce the BandwidthRequirements for Continuous Trace Stream Encoding of SystemPerformance(对于系统性能的连续跟踪流编码的降低带宽要求的压缩方案)”等。上述的技术方案均是解决重复的事件跟踪记录的压缩,因此,可压缩的跟踪记录必须完全相同。然而,完全相同的跟踪记录在所有跟踪记录中的比例较小。

对于异构多核体系结构,其加速器的本地存储器的大小有限,例如CellBE的各加速器的本地存储器的大小只有256K。而通常的快速傅里叶变换(FFT)运算的应用程序所需要的空间约为244K,矩阵乘法运算的应用程序所需要的空间约为231K,高度并行计算基准测试(Linpack)的应用程序所需要的空间约为229K,这样,加速器的本地存储器的可用空间平均仅为约16K。然而,传统的在线压缩方法,例如zip和gzip,其代码大小分别为77K和64K,因此,这样的压缩方法不适用于异构多核体系结构。

发明内容

本发明正是鉴于上述的技术问题而提出的,其目的在于提供一种压缩应用程序的跟踪记录的方法和装置,其适用于异构多核体系结构,并且能够大大缩短所有跟踪记录的传送时间。此外,本发明还提出了一种异构多核体系结构。

根据本发明的第一个方面,提供一种应用程序的跟踪记录压缩方案的生成方法,其中,所述应用程序在异构多核体系结构上运行,所述异构多核体系结构包括主处理器和多个加速器,所述方法包括:在所述异构多核体系结构上运行所述应用程序的至少一部分;收集并分析跟踪记录,所述跟踪记录由所述多个加速器生成并包括事件标识符和跟踪数据;以及根据所述分析的结果,生成所述应用程序的跟踪记录压缩方案。

根据本发明的第二个方面,提供一种压缩应用程序的跟踪记录的方法,其中,所述应用程序在异构多核体系结构上运行,所述异构多核体系结构包括主处理器和多个加速器,所述方法包括:在所述异构多核体系结构上运行部分或者整个所述应用程序;以及根据上述应用程序的跟踪记录压缩方案的生成方法所生成的跟踪记录压缩方案,压缩由所述多个加速器生成的跟踪记录。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810129257.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top