龙虎 王振龙 杨建菊
摘要:拟态计算的本质是实现高效能计算,将拟态计算与大数据技术相结合,建立具有灵活和可拓展的体系结构,能够充分发挥系统整体执行效率,对提高效能比有着十分重要的作用。大数据应用平台是一个以数据分析与预测以及展现等为目的平台。在梳理拟态计算概念的基础上,对大数据应用平台进行了阐述,构建了基于拟态计算的高效能大数据应用平台,并对拟态计算未来研究方向进行了展望。
关键词:拟态计算;高效能;大数据;应用平台
中图分类号:G642 文献标识码:A
文章编号:1009-3044(2021)01-0036-02
Abstract: Mimic computing can deeply integrate various heterogeneous components, and combine mimic computing with big data technology to establish a flexible and extensible architecture, which can give full play to the overall execution efficiency of the system and play a very important role in improving the efficiency ratio. Big data application platform is a platform for data analysis, prediction and presentation. On the basis of combing the concept of mimic computing, this paper expounds the big data application platform, constructs an efficient big data application platform based on mimic computing, and prospects the future research direction of mimic computing.
Key words: mimic computing; high efficiency; big data; application platform
大數据是现有数据库管理工具和传统数据处理应用方法很难处理的大型及复杂的数据集,大数据的一个主要方面是数据的可用性,用以分析的数据越全面,分析的结果就越接近真实,就更具有可用性。大数据的另一个重要方面是数据的复杂性,海量的非结构化和半结构化数据是数据结构不规则或不完整,也没有预定义的数据模型,不方便利用二维逻辑数据库来表现的数据。拟态计算的概念最初是由中国工程院院士邬江兴提出的。2013年9月,世界首台拟态计算机原理样机由中国科学家研制成功。2018年,国内首个拟态域名服务器问世,并上线应用,在“大数据和实体经济深度融合高峰论坛暨2018大数据产业发展试点示范项目发布会”中,上海的多家公司和复旦大学共同开展关于通用拟态大数据平台,为拟态计算在大数据分析处理和数据挖掘领域实现高效能和高安全提供原创性技术路径[1]。当前,大数据应用平台主要是将通用处理器作为计算核心,效能比较低且系统结构较为单一,无法满足大数据的计算需求。如何有效地进行高效能计算且能满足高安全性的需求是当前大数据领域研究的重点问题。因此,有必要构建一个基于拟态计算的高效能大数据应用平台,拟态计算能够深度融合各异构部件,将拟态计算与大数据技术相结合,建立具有灵活和可拓展的体系结构,能够充分发挥系统整体执行效率,对降低功耗和提高效能比有着十分重要的作用。
1拟态计算概述
拟态计算的本质是计算结构的函数化,其根本目的是实现高效能计算。拟态计算(Mimic Computing,MC)的概念是由中国工程院院士邬江兴提出的。2013年9月,世界上首台拟态计算机原型样机由中国科学家研制成功,运算速度可提升数百倍,其原理验证采用了Web服务(输入输出密集)和N-body(计算密集)以及图像识别(存储密集)等进行了验证,应用后其效能比提升了几十到几百倍,高效能特点显著。拟态计算与其他计算有很大的不同,如表1所示。
拟态计算也被称之为拟态架构计算,主要是依靠动态变结构以及软硬件结合实现基于效能的计算,其适用领域主要在高性能和高效能计算处理方面。拟态计算与虚拟计算不同,拟态计算着重体现在物理和逻辑结构同时变换,而虚拟计算则体现在逻辑结构的变换,拟态计算与其他一般的计算也不同,一般计算主要体现在硬件执行体的物理基本结构不变。拟态计算机是指按照拟态原理来构造的计算机,其最大特点是通过计算机结构技术实现高效能。2020年7月,英特尔中国研究院院长宋继强在第十五届“开源中国开源世界”高峰论坛中提出了“神经拟态计算,探索智能互联时代的计算创新”,指出了英特尔在神经拟态计算领域的发展。
2大数据应用平台
大数据平台是一个集数据接入、数据存储、数据分析与处理、数据查询与检索、数据挖掘和数据可视化等功能于一体的平台[2]。大数据平台主要由大数据基础设施、数据源、数据采集、数据存储、数据处理、大数据应用、大数据安全管理和大数据运营管理等多个部分组成,基础设施可为大数据平台的底层提供必要的基础设施支持,数据源是指数据来源种类繁多,既包括结构化和半结构化数据,也包括非结构化数据。数据采集是进行数据存储之前必须要进行的步骤之一,是实现大数据价值挖掘的关键。数据存储(Data storage)是大数据平台架构中一个重要部分,主要有结构化数据存储以及非结构化数据存储等,传统的关系型数据库存储的都是结构化数据,如Oracle Database和MySQL以及SQL Server等,非结构化数据如HTML、各类报表以及图像和视频等。数据处理主要体现在数据挖掘、深度学习、社交计算等多个方面,数据挖掘又称为从数据库中发现知识、数据分析和数据融合以及决策支持。深度学习是机器学习研究中的一个新领域,社交网络每天都会产生海量的用户数据,吸引着无数研究者从无序的数据中挖掘有价值的信息。大数据应用主要体现在互联网和金融以及教育等多个领域。大数据平台的安全管理主要是考虑物理安全、网络安全、应用安全以及数据安全等多个方面。大数据运营管理主要体现在监控、告警、备份和恢复以及优化等方面。大数据平台是大数据管理的技术基础,也是有效地将大数据经过清洗、梳理、转换、再进行加工和深度利用,能够形成数据资产和产生数据价值的基础处理架构和工具。大数据应用平台是一个以数据分析与预测以及展现等为目的平台。数据分析是对海量数据的分析,通过分析预测以及展现加强大数据的价值利用。
3基于拟态计算的高效能大数据应用平台构建
拟态计算是一种基于认知的主动重构计算技术(Proactive Reconfigurable computing Architecture,PRCA),其根本目的是实现高效能计算[3]。大数据应用平台是一个包含前台和中台以及后台等多个部分的平台,其前台主要是用户应用方面,中台主要数据服务方面,后台主要是存储与计算方面。基于拟态计算的高效能大数据应用平台构建如图1所示。
基于拟态计算的高效能大数据应用平台主要包括数据源和拟态设备、拟态计算以及数据应用服务等多个部分,数据源部分主要包括结构化数据、非结构化数据和半结构化数据,拟态设备主要包括拟态计算机、拟态路由器、拟态文件存储器、拟态DNS服务和拟态WEB服务器等,其中,拟态计算机主要是指依据拟态原理构造的计算机,拟态计算机主要依靠的是动态变结构,将软硬件结合,实现基于效能的计算。拟态计算机的主要特点是通过计算机结构技术实现高效能,其效能比一般的计算机效能可提升几十到几百倍。拟态路由器是基于拟态防御机理研制的网络基础设施设备,具有丰富的路由性能,其具备拟态防御特性,可提供高可靠、高可性和高可用的三位一体的广义鲁棒性服务,路由协议的异构执行体具有冗余性和动态性,动态异构冗余特性决定了其不依赖于特征进行威胁检测与阻断,既可以减少具有同等功能的其他安全防护的部署成本,同时也可以降低不停打补丁堵漏洞的维护成本,最终可以降低用户的总体成本。拟态文件存储服务可为大数据应用平台提供高鲁棒性的文件存储服务,能够在保障用户数据的完整性和可用性的前提下,有效解决数据的安全性和私密性等问题。拟态DNS服务可以在不改变现有域名协议和地址解析设施的基础上,通过拟态防御设备的增量部署,能够有效防御多种攻击,可以提供安全可靠的域名解析服务。拟态WEB服务器是一个基于网络空间拟态防御理论,以动态异构冗余架构为指导构建的由内生机理保证的高可靠和高可信以及高可用的三位一体的具有广义鲁棒性的WEB服务器。拟态计算的本质是实现高效能计算,以服务于高效能大数据应用平台。
4结束语
大数据时代背景下,随着海量异构数据的不断增加,海量数据处理的复杂性和系统能耗以及数据安全等问题挑战也随之显现出来,通过拟态计算结合大数据平臺,将软硬件深度融合,来构建一个基于拟态计算的高效能大数据应用平台,可有效提升效能,为未来大数据应用服务个性化和精准化以及一体化提供精准的方案。
参考文献:
[1] 龙虎. 基于拟态计算的大数据精准服务架构研究[J].信息与电脑,2020,32(5):147-149.
[2] 龙虎. 大数据计算模式与平台架构研究[J].凯里学院学报,2019,37(3):73-76.
[3] 成平广,等. 基于拟态计算的社会网络划分算法[J].计算机科学,2015,42(8):136-156.
[4] 李斌,等.基于拟态计算的大数据高效能平台设计方法[J].计算机应用研究,2019,36(7):2059-2064.
[5] 崔冰萌,等.基于FPGA的拟态服务器设计[J].计算机系统应用,2018,27(4):219-225.
[6] 徐婧,等.基于大数据的重大工程智能群体决策支持系统研究[J].河南科学,2019(6):1014-1019.
[7] 林子雨.大数据导论[M].北京:高等教育出版社,2020.
[8] Neshatpour K, Malik M, Ghodrat M A, et al. Energy-efficient accele-ration of big data analytics applications using FPGAs[C]/ /Proc of IEEE International Conference on Big Data. Washington DC: IEEE Computer Society,2015:115-123.
【通联编辑:王力】