计算机科学
封面介绍:大数据是当前IT信息技术研究和应用的热点,面临量大(Volume)、速度快(Velocity)和多样性(Variety)等多 “V”挑战.目前的研究多针对量大和速度快的问题,并集中在系统和应用层面,而针对多样性和理论基础方面的研究相对较少.陈国良研究组以计算复杂性理论为基础,针对大数据多“V”挑战,着重研究大数据的可计算性及其计算原理,初步提出了一个大数据并行计算框架.首先将多种类型的大数据抽象到度量空间进行统一化表示以解决多样性问题,其次在度量空间中基于距离对大数据进行划分,最后运用NC类计算理论等并行计算理论和方法对大数据问题进行并行求解,以解决量大和快速等问题.封面展示了大数据并行计算框架.详见陈国良等人文(p566).
大数据并行计算框架
陈国良,毛睿,陆克中
大数据是当前IT信息技术研究和应用的热点,但目前的研究多集中在系统和应用层面,而理论基础研究方面相对较少.本文以计算复杂性理论为基础,针对大数据量大、快速和多样性等挑战,着重研究大数据的可计算性及其计算原理.首先将多种类型的大数据抽象到度量空间进行统一化表示以解决多样性问题,其次在度量空间中基于距离对大数据进行划分,最后运用NC 类计算理论等并行计算理论和方法对大数据问题进行并行求解,以解决量大和快速等问题.本文从更广的视角,根据大数据的特性和大数据整个生命周期,提出处理大数据的策略和技术以及需要变革思维方法研究大数据.
NC类计算;度量空间;数据划分;可计算性
来源出版物:科学通报, 2015, 60(5/6):566-569联系邮箱:毛睿, mao@szu.edu.cn