[发明专利]一种国产申威26010众核处理器上K-means算法的高性能并行实现方法有效

专利信息
申请号: 201810188779.2 申请日: 2018-03-08
公开(公告)号: CN108509270B 公开(公告)日: 2020-09-29
发明(设计)人: 杨超;李敏;闫碧莹 申请(专利权)人: 中国科学院软件研究所
主分类号: G06F9/50 分类号: G06F9/50;G06F9/48
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 安丽
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种国产申威26010众核处理器上K‑means算法的高性能并行实现方法,基于国产处理器申威26010平台,针对聚类阶段,本发明设计了一种块距离矩阵计算与规约操作融合的计算框架,该框架使用三层分块策略进行任务划分,同时设计协作式的核间数据共享方案和基于寄存器通信机制的簇标签规约方法,及使用双缓冲技术,指令重排等优化技术。针对更新中心点阶段,本发明设计了动态调度的任务划分方式。通过在真实数据集上测试,本发明可以达到最大348.1GFlops的浮点计算性能,相比理论上最大性能,可以获得47%~84%的浮点计算效率,相比不融合的计算方式,可以获得最高1.7x,平均1.3x的加速比。
搜索关键词: 一种 国产 26010 处理器 means 算法 性能 并行 实现 方法
【主权项】:
1.一种国产申威26010众核处理器上K‑means算法的高性能并行实现方法,所述方法基于国产申威26010处理器的一个核组,每个核组由一个主核与64个从核组成,所述K‑means算法包括:(a)初始化中心点步骤、(b)聚类步骤、(c)计算迭代收敛值步骤和(d)更新中心点步骤;首先,完成步骤(a)、(b),再根据(c)求出迭代收敛值并判断是否收敛,若没有收敛,再次进入步骤b‑d组成的主循环中;若收敛,则返回当前聚类结果并退出,输出每个样本对应的簇标签;其特征在于:所述方法主要对耗时比较多的(b)和(d)步骤进行并行优化;所述(b)聚类步骤实现为:计算每个样本与所有中心点的距离,为每个样本求出距离最近的中心点,并将中心点下标存储为此样本的簇标签,进而将所有所述的样本划分到距离最近的簇中;所述(d)更新中心点步骤为:将每个所述簇对应的所述中心点更新为属于所述簇的所有所述样本的加权平均。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810188779.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top