[发明专利]一种降低处理器软错误率的方法和系统有效
| 申请号: | 201310267669.2 | 申请日: | 2013-06-28 |
| 公开(公告)号: | CN103365731A | 公开(公告)日: | 2013-10-23 |
| 发明(设计)人: | 尹一笑;陈云霁;胡伟武 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06F11/00 | 分类号: | G06F11/00 |
| 代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
| 地址: | 100190 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 降低 处理器 错误率 方法 系统 | ||
技术领域
本发明涉及处理器可靠性技术,尤其涉及一种低开销地降低处理器软错误率的方法和系统。
背景技术
随着摩尔定律的继续有效,单芯片上集成的晶体管数目仍然保持指数增长趋势。半导体设备,尤其是处理器,在功能和性能方面都得到了极大的提升。但是,每一次技术革新也引入了一些新的阻碍技术发展的问题。近年来,由于高能粒子轰击半导体器件引起逻辑位翻转,而导致的软错误已经显现。随着芯片技术的不断发展,软错误已经成为阻碍芯片发展的一个重要问题。
当诸如宇宙射线的中子和包装材料的阿尔法粒子等高能粒子,穿过半导体设备产生电子空穴对时,可能导致单逻辑位翻转。晶体管的源极和漏极聚集电荷。当电荷积累到一定数量的时候,锁存器、SRAM cell、gate等逻辑设备的状态就会发生翻转,于是将逻辑错误引入到芯片的运算过程中。由于这种错误并不会导致设备的永久性故障,所以称之为软错误或暂态错误。
单逻辑位翻转导致的软错误率是由粒子通量和芯片特性共同决定的。粒子通量与所处的环境相关。例如:海拔1500米的宇宙射线中子通量是海平面的4~6倍。与软错误率相关的芯片特性包括可存储的电荷量、易受攻击的横截面面积和电荷聚集的效率。随着特征尺寸的不断缩小,每个器件可存储的电荷量越来越小,越来越容易发生逻辑位翻转,从而导致软错误。可是,缩小的横截面却使得器件不太容易受到粒子攻击。因此,对于锁存器和SRAM,这两种影响可以相互抵消。也就是说,在指定海拔,每一个锁存器和SRAM位的软错误率大致恒定。但是,在没有纠错方案的情况下,芯片的软错误率会随着芯片晶体管数目的增加而升高。因此,随着芯片上集成的晶体管数量的指数增长,处理器芯片的软错误率也呈指数增长趋势。
在工业界,由宇宙射线产生的软错误导致的事故时有发生。2000年,Sun Microsystems公司承认宇宙射线攻击未保护的cache和memory正是使得大多数运行在它的企业服务器旗舰产品上的客户网站发生随机崩溃的原因。由于这次事故,Sun的一个重要客户转投到IBM。1996年,Normand公司报告称,通过分析一些大型计算机系统的错误日志,发现很多事故是由于宇宙射线攻击导致的。对宇宙射线的恐惧,使得富士通公司对SPARC处理器80%的锁存器使用一些故障检测措施加以保护。
处理器部件的AVF(architectural vulnerability factor)指的是在处理器部件中发生的一个逻辑位翻转会转变成在程序输出中可见的错误的概率。分支预测器的AVF是0%,而程序计数器的AVF约等于100%。因为在程序计数器中发生的错误几乎一定会导致不正确的指令被执行。大多数部件的AVF都在0~100%之间。处理器部件的实际软错误率是原始软错误率与AVF的乘积。所有处理器部件的实际软错误率之和等于整个处理器的实际软错误率。不同的目标市场,对处理器的软错误率要求不同。处理器架构师可以通过察看计算出的处理器的实际软错误率,来决定处理器设计是否满足目标市场对处理器的软错误率要求。
发明内容
本发明的目的在于:保持或者提高性能功耗比的情况下,在程序运行过程中,通过动态调节处理器部件配置来降低处理器软错误率。
本发明公开了一种降低处理器软错误率的方法,包括:
预测模型构建步骤,使用机器学习的方法构建预测模型,来预测可以低开销地降低处理器软错误率的处理器最佳配置;
识别程序片段步骤,在程序运行过程中,将程序分成若干连续的程序片段;
统计特征获取步骤,在程序片段初始运行的一小段时间内,获取程序片段的统计特征;
最佳配置预测步骤,将程序片段的统计特征输入预测模型,预测出程序片段相应的处理器最佳配置作为预测结果;
调节步骤,根据预测结果,调节处理器部件配置,从而在保持或者提高性能功耗比的情况下,降低处理器的软错误率。
统计特征分为第一类统计特征和第二类统计特征;其中,第一类特征是由处理器计数器统计获得的,第二类特征是针对处理器部件的统计量。
第一类统计特征为:队列的平均占用率、处理器功能部件的个数、寄存器的平均使用率、cache访问次数和缺失率、分支预测的访问次数和缺失率、每个时钟周期执行的指令数;第二类统计特征为处理器部件的使用情况。
预测模型构建步骤进一步包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310267669.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:新型空压机塑料防护堵头
- 下一篇:一种用于红木家具防碰撞的保护泡棉





