基于自适应线程束的GPU并行粒子群优化算法

2017-01-13 20:06张硕何发智周毅鄢小虎
计算机应用 2016年12期
关键词:并行计算

张硕+何发智+周毅+鄢小虎

摘 要:基于统一计算设备架构(CUDA)对图形处理器(GPU)下的并行粒子群优化(PSO)算法作改进研究。根据CUDA的硬件体系结构特点,可知Block是串行执行的,线程束(Warp)才是流多处理器(SM)调度和执行的基本单位。为了充分利用Block中线程的并行性,提出基于自适应线程束的GPU并行PSO算法:将粒子的维度和线程相对应;利用GPU的Warp级并行,根据维度的不同自适应地将每个粒子与一个或多个Warp相对应;自适应地将一个或多个粒子与每个Block相对应。与已有的粗粒度并行方法(将每个粒子和线程相对应)以及细粒度并行方法(将每个粒子和Block相对应)进行了对比分析,实验结果表明,所提出的并行方法相对前两种并行方法,CPU加速比最多提高了40。

关键词:粒子群优化算法;并行计算;图形处理器;统一计算设备架构;自适应线程束

中图分类号: TP301.6

文献标志码:A

文章编号:1001-9081(2016)12-3274-06

猜你喜欢
并行计算
基于Hadoop的民航日志分析系统及应用
云计算中MapReduce分布式并行处理框架的研究与搭建
矩阵向量相乘的并行算法分析
并行硬件简介
不可压NS方程的高效并行直接求解
基于GPU的超声场仿真成像平台
基于Matlab的遥感图像IHS小波融合算法的并行化设计
Spark计算引擎的数据对象缓存优化研究
基于枚举的并行排序与选择算法设计
最大匹配问题Tile自组装模型