李 林 顾进锋 宋安捷 郑海宁 曹 津 朱德海
(1.中国农业大学信息与电气工程学院, 北京 100083; 2.谢菲尔德大学计算机学院, 谢菲尔德 S102TN)
基于GPU的生态环境遥感评价模型并行化研究
李 林1顾进锋1宋安捷2郑海宁1曹 津1朱德海1
(1.中国农业大学信息与电气工程学院, 北京 100083; 2.谢菲尔德大学计算机学院, 谢菲尔德 S102TN)
通过基于GPU的生态环境遥感评价模型并行化研究,在深入分析CPU+GPU异构通用计算平台数据传输瓶颈的基础上,设计了数据分片、异步传输的GPU图像处理框架。在此基础上,将碳固定量、草地退化指数和生态环境指数3个计算模型基于CUDA进行并行化实现,并通过实验验证了该技术方法的有效性,随着数据规模的变大,碳固定量计算模型的加速比达到了8.04倍,草地退化指数计算模型的加速比达到了12.21倍,生态环境指数计算模型的加速比达到了7.45倍。
生态环境评价; 遥感; 并行化处理; GPU; CUDA
当前生态环境问题愈加严峻,为了使相关部门及时发现问题并采取相应措施,实时、准确且综合地进行生态环境遥感评价具有重要意义[1-4]。随着遥感卫星传感器技术的飞速发展,遥感数据体量的急剧增长,模型处理速度成为生态遥感评价的瓶颈[5-7]。近年来,随着GPU设备的可编程[8]能力迅速提升,且应用范围不断扩大,作为通用的高性能大规模并行处理器,GPU具有高密度运算、并行性高、相对体积较小且高性价比等特点,为遥感数据的处理加速提供了一个极具潜力的技术手段[9-11]。针对此问题,LIU等[12-13]提出一种数据块划分读取机制,赵进等[14-16]提出基于GPU的遥感并行化处理,模型处理速度有了一些提高,但CPU与GPU之间PCI-E/AGP总线的带宽远低于显存总线,仍然是生态遥感评价的瓶颈。
本文面向GPU的生态环境遥感评价模型并行化分析与研究,设计数据分片、异步传输的GPU图像处理框架,避免过多访问主机内存来提高执行效率,将碳固定量、草地退化指数和生态环境指数3个计算模型基于CUDA[17-22]进行并行化实现,并通过实验验证该技术方法的有效性。
1.1 计算任务流程优化策略
1.1.1 数据分割调度
数据块划分读取机制,通常作为处理类似问题场景下的主流解决方案。首先,作为存放在外部存储器中遥感影像和主机内存之间的数据传输单位,将原始的遥感影像划分为若干数量固定的数据块(Block),如图1所示,每个数据块包含一定数量的栅格像元数据。该数据块划分机制,可以通过调整数据块的大小来适配实际应用中不同配置的软硬件系统。
图1 数据划分——数据块Fig.1 Data partitioning—data block
在大图像处理中磁盘I/O仍是计算效率的主要瓶颈,按照上述划分机制,还是不利于外部磁盘I/O次数的有效减少。该方案的弊端在于当数据写入到某一块时,其写入顺序从块的起始地址写,将块的第1行数据写入,当要进行接下来块的第2行数据写入时,数据块中第1行和第2行存放位置不连续,间隔通常为
s=IC
(1)
式中I——图像宽度C——通道类型(32R图像取4,16U和16S图像取2,8U图像取1)
在数据块换行读写时必须先移动文件指针,读取一块需要移动3次文件指针。整幅图像的读写需要移动至少Blocks×3(Blocks为数据块数)次文件指针,这样的磁盘I/O次数非常大。本文对此提出一种改进型方案,如图2所示。
图2 改进后数据块划分方法Fig.2 Improved data block partition method
改进后的分块方法由每次读取源影像数据的像元行数来确定,可以通过设定内存数据块的大小间接获得每次读取的行数。数据块的大小为
S=WHC
(2)
式中W、H——数据块宽度和高度
可知每次要读取的影像像元行数(R)为
R=WH/I
(3)
采用这种分块方法既降低了程序的逻辑复杂度,又大大减少了磁盘I/O的次数。对比原来的分块方法,运算效率大大提高,整个计算处理过程中的数据流模型如图3所示。
图3 遥感影像分割调度数据流模型Fig.3 Model of data flow for remote sensing image segmentation and scheduling
1.1.2 数据异步传输
通常应用程序需要在I/O环节将数据由外部磁盘读入内存,再从内存将数据复制到GPU设备显存,之后才是GPU对数据进行并行处理,整个流程按照图4所示时序进行。可以看出,在应用程序执行各设备之间的I/O过程中,GPU运算资源始终处于空闲状态;同理,在GPU执行运算操作时,主机的运算资源也在闲置。
图4 任务执行时序图Fig.4 Task execution timing diagram
逻辑上每一数据块的处理过程都是相互独立的,可以让主机对数据块的I/O和GPU设备对于数据块的运算处理这两个在逻辑上相互独立的操作过程“并行”执行。从GPU设备的运算执行角度,这种策略可以称为运算数据的“异步传输”。
这里引入缓存池(Buffer pool)的概念,即在主机内存中申请一定容量的存储空间,作为数据块由外部磁盘到GPU设备显存的中转站,缓存池的大小通常由数据块的大小来决定。在此基础上,通过引入CPU的多线程机制来实现数据I/O和GPU数据运算的同步执行:第1种线程负责主机内存按块同磁盘中的遥感影像数据进行I/O操作,将待处理数据读入缓存池或将缓存池中结果数据写回磁盘文件;第2种线程负责主机内存与GPU显存的I/O以及调用GPU执行运算,将缓存池中数据块复制到GPU显存执行运算或将运算结果写回缓存池。其中,2种线程之间的通信和同步操作通过设置信号量以及资源锁的方式来实现。通过这种异步传输、同步执行的处理策略,在继承了数据块划分思想的同时,还有效发挥了主机CPU强大的逻辑处理功能,提高了资源利用率和计算任务执行效率。数据异步传输模型如图5所示。
图5 GPU数据异步传输模型Fig.5 Model of GPU data asynchronous transfer
通过上述异步传输-同步执行的数据调度及运算执行策略,实现了一种双重并行的处理机制:在计算任务执行过程中,从微观层面上来看,GPU内部同时启动数百上千个独立线程对其中的数据进行并行化运算处理;从更宏观层来看,整个系统中设备及存储器间的数据I/O操作和GPU运算处理操作也是同时进行的。从图6可以看出,整个计算任务执行过程中外部磁盘和主机内存的I/O环节占据了整个过程中绝大部分的时间消耗,通过异步传输机制,内存与GPU的I/O以及GPU运算这部分的时间消耗完全被覆盖,相比原有方案中各环节完全顺序执行提升了可观的时间效率。
图6 任务异步执行时序图Fig.6 Task asynchronous execution sequence diagram
1.2 GPU处理框架实现
基于上述所提出的方案和优化策略,本文实现的遥感栅格影像GPU并行处理编程框架如图7所示。首先,对CUDA环境进行初始化并在内存中开辟一组固定大小(根据主机内存以及GPU设备显存实际情况在程序中设定)的存储空间作为数据块缓存池(Buffer pool);然后创建2个线程,一个用于处理磁盘和内存缓存池的数据I/O,称作线程A,另一个负责将缓存池的数据同GPU设备显存进行I/O操作并执行GPU运算,称作线程B。每一个数据块缓存都包含3种状态,分别是Ready_to_read、Ready_to_write以及Ready_to_process,其中:Ready_to_read状态表示该数据块缓存可以进行新数据读入,即可以从磁盘读取一个数据块到该缓存空间;Ready_to_write状态表示该数据块缓存中的数据可以写回到磁盘文件中;Ready_to_process状态表示该数据块缓存中的数据已经读取完毕,可以放入GPU执行运算处理。
通过在程序中设置Is_IO_Done和Is_Process_Done 2个全局变量来记录并控制线程A和线程B的执行状态:当GPU运算执行完毕且缓冲池中无等待处理的数据时,Is_Process_Done为真值,程序调用Pthread_join方法将线程B终结;同理当磁盘数据读取完毕时,Is_IO_Done为真值,应用程序将调用Pthread_join方法终结线程A。最后程序执行Return结束运行。
图7 遥感影像 GPU并行处理框架流程图Fig.7 Flow chart of GPU parallel processing framework for remote sensing image
2.1 指标数据提取GPU并行化
本文选取了碳固定量和草地退化指数2个指标的估算模型进行分析,结合GPU通用计算软硬件技术特性,针对上述2个模型分别进行并行化设计,并给出其实现方案。
2.1.1 碳固定量
碳固定量指标估算模型由光合有效辐射和光合有效辐射吸收比例计算植被吸收的光合有效辐射指标;利用植被分类和温度计算光能利用率指标;再由光合有效辐射和光能利用率,根据模型计算得到碳固定指标。其中,光能利用率模型依据的原理是,植被净第一性生产力主要由植被所能吸收的光合有效辐射(SAPAR)及其光能利用率(ε)2个变量来确定。
SNPP(x,t)=SAPAR(x,t)ε(x,t)
(4)
式中t——时间x——空间位置SAPAR(x,t)——像元x在t月份吸收的光合有效辐射
ε(x,t)——像元x在t月份实际光能利用率
中间计算环节中的植被吸收光合有效辐射(SAPAR)和实际光能利用率(ε),以及最终植被净初级生产力(SNPP)的计算过程中,均以栅格像元值为基本数据表示和计算单位,并对之进行浮点乘积运算。每个像元的处理过程完全一致,且又相互独立,非常适合GPU的细粒度数据并行计算。基于CUDA平台语言编写对应由GPU执行并行计算函数,实现碳固定量指标估算模型的GPU并行化处理。
2.1.2 草地退化指数
基于植被覆盖度的草地退化指数的计算方法为:输入评价时段DNVDI及参考时段DNVDI数据,得到草地退化指数指标数据
DGDI=(F-Fref)/Fref
(5)
式中F——草地覆盖度Fref——参考年的草地覆盖度
覆盖度F的计算公式为
F=(DNDVI-DNDVI min)/(DNDVI max-DNDVI min)
(6)
草地覆盖度F由该对应时段的DNVDI数据计算得出,并对覆盖度指标做归一化处理。其中DNVDI max和DNVDI min分别对应该时段N栅格影像数据像元最大值和最小值。分别算出各自对应点草地覆盖度数据与草地退化指数,均以栅格像元值为基本数据表示和计算单位,并对之进行浮点乘积运算。每个像元的处理过程完全一致,且又相互独立,非常适合GPU的细粒度数据并行计算。基于CUDA平台语言编写对应的由GPU执行的并行计算函数,实现草地退化指数指标估算模型的GPU并行化处理。
2.2 生态环境健康指数计算GPU并行化
生态环境遥感评价的结果数据用生态环境健康指数(EEHI)表示。生态环境健康指数采用质量指数法计算,即EEHI是所有经标准化处理后的二级指标值的加权和,计算公式为
(7)
式中n——评价体系中指标总数Ij——第j个指标标准化后的值Wj——第j个指标的权重
由于指标体系中的各项评价指标的类型较为复杂,单位也有很大差异,直接进行加权处理是不合适的,也无实际意义,为了简便、明确和易于计算,有必要进行各项指标的标准化,在对各指标进行量纲统一时,对参评因子进行标准化,取值设定在0~1之间。积极健康指标因子和消极健康指标因子的得分计算公式分别为
Aij=(Xij-Xj min)/(Xj max-Xj min)
(8)
Nij=(Xj max-Xij)/(Xj max-Xj min)
(9)
式中Xij——评价因素的指标值Xj max、Xj min——指标因子的最大值和最小值
生态评价指标分为积极和消极两种属性,相应的标准化计算公式也有所不同,因此需要分别加权融合实现两种指标的标准化核函数,并通过在主程序中设置专门的枚举型变量来决定调用对象。基于CUDA平台语言编写对应由GPU执行并行计算函数,实现生态环境健康指数估算模型的GPU并行化处理。
2.3 并行模型整体实现
上述研究得出了生态环境遥感评价3个业务模型基于CUDA的GPU并行处理实现方案,结合遥感栅格影像GPU并行化处理基础框架,可以得出并行计算模块的整体架构,模块功能界面如图8所示。在视图层,应用.NET WPF技术实现UI界面,完成业务流程交互和基本的数据展示功能;在GPU并行计算模型具体实现中,GPU设备端数据处理模块及线程管理均基于CUDA Toolkit实现;基于遥感栅格数据通用处理库GDAL实现栅格文件的创建、属性设置、按块像元读写和相关数值统计(像元最大值、最小值、均值等),CPU端线程管理采用Windows平台下基于POSIX标准的线程操作库Pthread-w32,两者共同构成计算模块的数据I/O及设备任务调度层。
图8 GPU并行模型结构Fig.8 GPU parallel model structure
3.1 实验环境
进行碳固定量、草地退化指数和生态环境健康指数3个改进业务计算模型的执行分析,实验数据按照包含遥感栅格影像数据分辨率和文件体积的不同,分为3个数据集:641×1 116(单幅3.5 MB)、7 691×7 831(单幅115 MB)、16 463×14 399(单幅315 MB)。
现今业界通用的并行加速比是一个度量并行处理性能的关键参数,它可以直观显示出在并行机上利用并行算法求解实际问题所能获得的好处。对于求解相同规模的同一应用问题,并行算法的加速比可定义为
Sp=Ts/Tp
(10)
式中Ts——最优串行算法在CPU上的运行时间
Tp——并行算法在GPU上的运行时间
Sp——算法并行化后获得的加速比
因此,本系统应用实验将3个业务模型的原有程序和并行化程序在3个数据集上分别运行进行结果对比。实验环境如表1所示。
表1 实验环境Tab.1 Experiment environment
3.2 实验结果
(1)碳固定量计算模型
每次输入数据为4张单幅栅格影像数据,实验结果如图9所示。
图9 碳固定量模型 GPU并行加速实验结果Fig.9 Experiment results of GPU parallelization of carbon fixation
(2)草地退化指数计算模型
每次输入数据为2张单幅栅格影像数据,实验结果如图10所示。
图10 草地退化指数 GPU并行加速实验结果Fig.10 Experiment results of GPU parallelization of grassland degradation index
(3)生态环境健康指数计算模型
每次输入数据为6张单幅栅格影像数据以及每个指标的对应权重序列,实验结果如图11所示。
图11 生态环境健康指数 GPU并行加速实验结果Fig.11 Experiment results of GPU parallelization of ecological environment health index
3.3 结果分析
(1)3个业务模型执行状况的并行化加速在数据量较小的情况下效果不明显,这是由于在数值计算复杂度不高的情况下,CPU凭借本身的计算能力可以应对小数据量的处理任务,此时并未发挥出GPU并行算法的优势,再加上数据I/O的时间消耗,并未在数据处理环节显示出优势。
(2)在单次任务输入文件增多的情况下,数据块大小不变时,I/O次数必然增多,并且每次数据I/O均需要跨越多个文件,在此期间磁盘数据指针需反复跨越寻找定位数据,总体增加了时间消耗,设备间I/O仍是制约效率提升的重要瓶颈。
(3)3个业务模型执行状况的并行化加速比随着数据规模的变大而提升。同等数据量进行对比,草地退化指数计算模型算法的加速比最明显,其次是碳固定量计算模型算法的加速比,然后是生态环境健康指数计算模型算法的加速比;与原有实验方案进行效果对比,641×1 116(单幅3.5 MB)数据量下,加速比分别(顺序依次为碳固定量计算模型、草地退化指数计算模型和生态环境健康指数计算模型,下同)达到了2.44倍、3.49倍和2.03倍;7 691×7 831(单幅115 MB)数据量下,加速比分别达到了5.83倍、8.81倍和4.96倍; 16 463×14 399(单幅315 MB)数据量下,加速比分别达到了8.04倍、12.21倍和7.45倍。
为了减少大图像处理中磁盘I/O的次数,改进了数据分割调度数据流方案。为了提高GPU影像并行处理速度,提出异步传输-同步执行的数据调度及运算执行策略,实现了一种双重并行的处理机制。最后通过实验与原有方案进行效果对比,新算法达到了7~12倍的加速比。该方法有效提高了遥感数据的处理速度,为实时、准确且综合地进行生态环境遥感评价提供了强有力的技术支持,方便相关部门及时发现问题并采取相应措施,具有实际应用价值。
1 张永瀚, 孙瑞志, 李林,等. 生态环境遥感评价模型库系统平台构建研究[J/OL]. 农业机械学报, 2015, 46(增刊):267-273. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=2015S043&flag=1. DOI:10.6041/j.issn.1000-1298.2015.S0.043. ZHANG Yonghan, SUN Ruizhi, LI Lin, et al. Research of remote sensing evaluation model library platform of ecological environment[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2015,46(Supp.):267-273. (in Chinese)
2 ZHANG Y, WANG J, GONG W, et al. Eco-environmental quality evaluation and dynamic ecological patterns for Songhua River watershed in Harbin Section, China[J]. Nature Environment & Pollution Technology, 2014, 13(4):725-730.
3 XU M, ZHU Y, LÜ H, et al. Eco-environmental quality evaluation of Huaibei Plain[J]. Proceedings of the International Association of Hydrological Sciences,2015, 368:436-441.
4 史舟, 梁宗正, 杨媛媛,等. 农业遥感研究现状与展望[J/OL]. 农业机械学报, 2015, 46(2):247-260. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20150237&flag=1. DOI:10.6041/j.issn.1000-1298.2015.02.037. SHI Zhou, LIANG Zongzheng, YANG Yuanyuan, et al. Status and prospect of agricultural remote sensing[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2015, 46(2):247-260. (in Chinese)
5 尚松浩, 蒋磊, 杨雨亭. 基于遥感的农业用水效率评价方法研究进展[J/OL]. 农业机械学报, 2015, 46(10):81-92. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20151013&flag=1. DOI:10.6041/j.issn.1000-1298.2015.10.013. SHANG Songhao, JIANG Lei, YANG Yuting. Review of remote sensing-based assessment method for irrigation and crop water use efficiency[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2015, 46(10):81-92. (in Chinese)
6 韩鹏鹏, 黄进良, 李仁东,等. 基于面向对象的坑塘遥感监测与动态分析[J/OL]. 农业机械学报, 2015, 46(1):272-277.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20150138&flag=1. DOI:10.6041/j.issn.1000-1298.2015.01.038. HAN Pengpeng, HUANG Jinliang, LI Rendong, et al. Remote sensing monitoring and dynamic analysis of ponds based on object-oriented rules[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2015, 46(1):272-277. (in Chinese)
7 杨宁, 张荣标, 张永春,等. 基于微生物生态效益的土壤肥力综合评价模型[J/OL]. 农业机械学报, 2013, 44(5):108-112.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20130520&flag=1. DOI:10.6041/j.issn.1000-1298.2013.05.020. YANG Ning, ZHANG Rongbiao, ZHANG Yongchun, et al. Soil fertility synthesis evaluation model based on ecological benefit of microorganism[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2013, 44(5):108-112. (in Chinese)
8 刘旭春, 李德龙, 刘津, 等. 基于可编程 GPU 的遥感影像快速处理研究[J]. 测绘通报, 2013(6): 22-26. LIU Xuchun, LI Delong, LIU Jin, et al. The study of fast processing of remote sensing images based on programmable graphics process unit[J]. Bulletin of Surveying and Mapping, 2013(6): 22-26.(in Chinese)
9 袁涛, 马艳, 刘定生. GPU 在遥感图像处理中的应用综述[J]. 遥感信息, 2012,27(6): 110-117. YUAN Tao, MA Yan, LIU Dingsheng. Review of GPU applications in remote sensing image processing[J]. Remote Sensing Information, 2012,27(6): 110-117.(in Chinese)
10 陈超, 陈彬, 孟剑萍. 基于GPU大规模遥感图像的几何校正[J]. 指挥信息系统与技术, 2012, 3(1): 76-80. CHEN Chao, CHEN Bin, MENG Jianping. Geometric correction of remote sensing image based on graphic processing unit[J].Command Information System and Technology, 2012, 3(1): 76-80.(in Chinese)
11 周海芳, 赵进. 基于GPU的遥感图像配准并行程序设计与存储优化[J]. 计算机研究与发展, 2012, 49(增刊1):281-286. ZHOU Haifang, ZHAO Jin. Parallel programming design and storage optimization of remote sensing image registration based on GPU[J].Journal of Computer Research and Development, 2012, 49(Supp.1):281-286.(in Chinese)
12 LIU Y, CHEN B, YU H, et al. Applying GPU and POSIX thread technologies in massive remote sensing image data processing[C]∥2011 19th International Conference on Geoinformatics, 2011:1-6.
13 CHRISTOPHE E, MICHEL J, INGLADA J. Remote sensing processing: from multicore to GPU[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2011, 4(3):643-652.
14 赵进. 基于GPU的遥感图像并行处理算法及其优化技术研究[D]. 长沙:国防科学技术大学, 2011. ZHAO Jin. Study of remote sensing image parallel processing algorithms based on GPU and optimization techniques[D].Changsha:National University of Defense Technology,2011.(in Chinese)
15 LIU P, YUAN T, MA Y, et al. Parallel processing of massive remote sensing images in a GPU architecture[J]. Computing & Informatics, 2014, 33(1):197-217.
16 徐如林, 周海芳, 姜晶菲. 基于GPU的遥感图像IHS小波融合并行算法设计与实现[J]. 计算机工程与科学, 2012, 34(8):135-141. XU Rulin, ZHOU Haifang, JIANG Jingfei. Design and implementation of a parallel algorithm of the IHS- and wavelet-based image fusion for remote sensing based on GPU[J].Computer Engineering & Science, 2012, 34(8):135-141.(in Chinese)
17 NVIDIA. Nvidia cuda programming guide: Version 3.2[CP]. NVIDIA Corporation, 2010.
18 ABOUALI M, TIMMERMANS J, CASTILLO J E, et al. A high performance GPU implementation of surface energy balance system (SEBS) based on CUDA-C[J]. Environmental Modelling & Software, 2013, 41(3):134-138.
19 DAWSON L, STEWART I. Improving ant colony optimization performance on the GPU using CUDA[C]∥IEEE Congress Evolutionary Computation, 2013:1901-1908.
20 郭一汉. 基于CUDA的实时图像拼接技术研究[D]. 长沙:国防科学技术大学, 2011. GUO Yihan. Real-time image mosaic based on CUDA[D].Changsha: National University of Defense Technology, 2011.(in Chinese)
21 姚平. CUDA平台上的CPU/GPU异步计算模式[D]. 合肥:中国科学技术大学, 2010.
22 赵春江. 农业遥感研究与应用进展[J/OL]. 农业机械学报, 2014, 45(12):277-293. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20141241&flag=1. DOI:10.6041/j.issn.1000-1298.2014.12.041. ZHAO Chunjiang. Advances of research and application in remote sensing for agriculture[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2014, 45(12):277-293.(in Chinese)
Parallelization on Model of Ecological Environment Remote Sensing Evaluation Based on GPU
LI Lin1GU Jinfeng1SONG Anjie2ZHENG Haining1CAO Jin1ZHU Dehai1
(1.CollegeofInformationandElectricalEngineering,ChinaAgriculturalUniversity,Beijing100083,China2.DepartmentofComputerScience,UniversityofSheffield,SheffieldS102TN,UK)
In order to solve the problem of the model’s slowly processing speed of ecological environment remote sensing evaluation currently, a framework about GPU image processing was designed with data partitioning and scheduling asynchronous transmission which was based on the in-depth analysis about the data transmission bottleneck of heterogeneous CPU+GPU general computing platform. It included the carbon fixed quantity and grassland degradation index, whose intrinsic parallelism met the GPU computing features. For the above models, it was put forward based on CUDA parallel implementation. The core link of indexes for evaluation of ecological environment of remote sensing data standardization and weighted fusion of CUDA parallel module were implemented. Finally, the effectiveness of technical methods was verified through experiments, as the scale of data became larger, the parallel execution speed of three business models became faster, the speedup ratio of the fixed amount of carbon achieved a 8.04 times execution rate lift; the speedup ratio of the index of grassland degradation achieved a 12.21 times execution rate lift; and the speedup ratio of the index of ecological environment achieved a 7.45 times execution rate lift. At the same time, the speedup ratio was decreased as the number of input data files increased, equipment between I/O was still the main factor which restricted the running efficiency of the algorithm.
ecological environment evaluation; remote sensing; parallel processing; GPU; CUDA
2016-08-31
2016-10-19
国家自然科学基金项目(31471762)
李林(1963—),女,教授,博士生导师,主要从事软件工程和软件自动化研究,E-mail: lilincau@126.com
朱德海(1962—),男,教授,博士生导师,主要从事3S技术及其在农业和国土资源中的应用研究,E-mail: zhudehai@cau.edu.cn
10.6041/j.issn.1000-1298.2017.05.016
S2
A
1000-1298(2017)05-0135-07