江苏省未来网络创新研究院 南京 211100
传统IT基础设施下的数据中心是以硬件为核心的静态结构,这样的传统数据中心无法满足云时代不断变化的需求。软件定义基础设施包含三个方面的内容,即计算、存储和网络。基于软件定义基础设施构建的数据中心是动态、高度自动化和软件定义的。用户可以根据自己应用的需要配置一个适合的、灵活的系统,可以更快地进行部署,更好地进行管理,以满足长期扩展的需要[1]。
“互联网+”战略就是利用互联网平台以及信息通信技术把互联网和包括传统行业在内的各行各业结合起来,在新的领域创造一种新的发展生态。互联网技术的快速发展对各行各业的生产流程、运营模式、渠道策略、服务方式和营销手法产生了深刻的影响;传统产业面临价值盈利危机、线下客户流失、渠道、资源、客户、经销商等传统资源的价值弱化,缺乏专业的互联网技术、人才积累等。面对互联网思维对传统行业的冲击,传统企业必须主动变革,抢先占领市场,克服过去的成功所造成的惯性思路;因此,我们利用当前最新的云计算、虚拟化等技术构建了一个基于软件定义基础设施的“互联网+”开放平台,以极低的成本为企业迅速建立起一整套现代化的运营管理平台,为传统企业向互联网转型提供整体解决方案及技术支持,推动移动互联网、云计算、大数据、物联网等与现代制造业结合,促进电子商务、工业互联网和互联网金融等健康发展。
基于软件定义基础设施(Sofware Defined Infrastructure,SDI)的互联网开放平台融合了云计算、软件定义网络等技术,将离散异构资源变为统一的资源池,集中管理所有软硬件资源、异构虚拟化基础设施,将传统以硬件为核心的数据中心的基础设施与服务解耦[2-3],并能够对这些资源自动发现、自动配置、统一调度和快速部署,快速响应市场的变化需求。同时,该平台提供相关开放接口,以便响应来自应用服务的请求,对基础设施业务流程和服务进行实时编排调整。其基础架构如图1所示。
图1 SDI资源管理平台架构图
传统的数据中心体系很复杂,系统的维护和管理难度大,缺乏统一化[4];并且系统以人工维护为主,效率低、易出现问题。SDI资源管理平台具有统一资源调度功能,即多中心融合统一管理和多资源池智能调度。多中心融合统一管理可实现多个数据中心统一管理、分权分域运维等多数据中心特性,并能实现融合云与非云的统一管理,基础架构和基础设施的联动管理;多资源池智能调度能够根据服务和资源制定调度策略,自动执行操作流程,实现所需资源的选择和部署。
统一资源调度可实现软硬件资源统一管理、精确量化、共享利用,充分发挥资源效率;可实现多中心融合统一集约化管理,降低运营成本。
随着企业数据中心的整合以及业务云化的转移,采用传统的以命令行驱动的配置方式去部署可以扩展到数以千计服务器、存储和网络设备的大规模的SDx应用程序,需要花费大量的人工劳动,成本高,服务水平也难以保证。企业越来越需要通过规范化、流程化的方式提高业务的部署、变更和迁移效率[5]。
SDI资源管理平台采用了基于策略与意图驱动基础设施的解决方案,增强了IT资源调配的自动化能力。SDI资源管理平台能自动将策略和意图转化为相应基础设施上的命令而不需要人工干涉,管理员只需要根据业务类型制定相应的自动部署策略和业务模板,管理平台根据制定的自动化策略完成资源的申请和业务部署/卸载,实现资源的快速分配与回收。同时,SDI管理平台持续监视事件和变化的基础设施,当某个应用或者虚拟资源到达策略所设置的阈值时,根据制定的策略实时地自动做出响应,进行服务器的扩容变更,或者动态迁移。自动化快速部署流程如图2所示。
SDI资源管理平台可以实现服务自动化快速部署,简化各种复杂的人工操作,避免各种低级的配置错误,可大大地提升业务效率,缩短客户新增业务上线的时间周期,而且随着运行效率的显著提高,成本也将不断降低。
传统业务的云化促进了数据中心业务规模的急速增长,面对庞大的业务流量,高并发的数据访问量,仅靠人工对系统进行调整,难以平滑应对流量变化。企业客户强烈要求业务系统在支持更高并发数的同时提供资源弹性伸缩的能力,以便轻松应对互联网流量的变化。
SDI资源管理平台支持资源的弹性扩展、收缩与自愈。通过持续监控各种资源的当前状态,并对这些海量数据进行存储、智能化分析、推断、感知、预测,做出正确的决策,合理优化资源配置,如图3所示。
图2 自动化快速部署流程图
图3 弹性伸缩与自愈流程图
当SDI资源管理平台感知到服务的访问请求数量增多,CPU利用率过高,其就会基于自身的详细资源情况和网络流量模型对整个资源进行快速配置与资源预留,根据策略及相应的业务类型选择对应的业务模板及镜像,创建出新的VM,并将新的VM加入到虚拟负载均衡器成员列表中,启动虚拟机实现资源的弹性扩展。
当感知到服务需求下降,资源长时间处于空闲状态,其就会根据相应的策略自动从虚拟负载均衡器成员列表中移出部分成员,并删除相应VM、释放资源、节约成本、实现弹性收缩。
SDI资源管理平台通过业务实例进行健康检查,一旦发现异常,自动根据策略创建相应业务健康的服务实例来替代状态异常的服务实例。然后,释放异常服务实例资源,并自动配置虚拟负载均衡器,实现服务的弹性自愈。
另外,SDI资源管理平台能很快借助机器学习能力从之前的决策中汲取经验并改进未来的决策,实现高效实时的动态配置和最大化的资源利用率。
SDI资源管理平台,通过集中部署的基于大数据的智能化软件去管理和协调各种资源和网络,实现IT资源和网络资源的无缝同步与协调配合,为云资源之上的各类应用提供最优化的、可动态调整的网络资源和连接,为终端和应用提供最佳的端到端体验与质量。
由于大规模Overlap网络技术的发展,在跨域异构的计算、网络、存储资源的控制和编排变得前所未有的开放和灵活[6-7]。基于SDI的“互联网+”开放平台架构设计分为两层,即基础设施层和平台服务层(如图4所示);基础设施层将计算、网络、存储等资源虚拟化;平台服务层对资源、数据进行监控、分析以实现自动化运维和管理。同时,平台将自身资源及服务以接口形式向用户开放,用户可以使用平台服务资源,按需自定义业务及服务。
图4 基于SDI的“互联网+”开放平台架构图
当前网络系统是封闭的、难以修改的,用户不能根据自己的需求,快速获取网络服务。当新业务上线时,用户必须将网络设备层层打通,并分配计算、存储资源,这些过程繁琐无比且有一定的技术壁垒,业务上线周期、运维成本都难以控制[8-9]。
基于SDI的“互联网+”开放平台提供了业务编排功能,涵盖网络基础设施虚拟化的物理/软件资源的编排和生命周期的管理,并通过集约化的网络资源管控以及自动化的业务编排,实现业务敏捷。
1)服务抽象。基于SDI的“互联网+”开放平台对用户业务、网络模型、设备功能进行抽象。例如:将从局域网访问远程数据中心的整个过程分为二层接入、IP路由网络、VPN网络、防火墙和数据中心网络、虚拟服务器等多个阶段,根据这些阶段抽象成不同模型,并在此基础上按照功能集归类,进行集约化管理。
2)服务实例化。基于SDI的“互联网+”开放平台将网络模型功能参数进行组合,形成可分发的服务。用户需要定义基础设施功能模型,然后为该模型添加自定义配置参数。这样就完成服务模型的实例化工作,在平台内将抽象的服务模型转变为可分发的服务。通过服务模型的创建,用户可以真正快速便捷地实现服务建立与部署,通过评估模型的建立与配置,用户可以直观并快捷地实现对服务的综合评价与监控。由此,将用户彻底从云服务建立、调整、扩容等繁杂的部署和配置工作任务中解放出来,从而专注于自身核心业务,聚焦于如何为客户提供高效率、高质量、高保障的服务。
3)自动化服务链。基于SDI的“互联网+”开放平台将抽象模版转换为可分发服务后,用户可直接使用可分发服务,也可以自定义自动化服务链模版,通过标准的连接器,将复杂流程中所需要的服务进行统一编排,实现自动化的服务链业务。同时,服务链具有访问控制、可视化异常处理、常规化自动处理等特性,这些特性使其在具有高扩展性、高容错性的同时,快速适应各种复杂的开发或测试环境。
基于SDI的“互联网+”开放平台能够台获取全局视图、感知和监控底层设备和全网状态。当故障发生时可以及时感知、定位以及排除故障[10],并通过大数据分拆模块提供数据和业务分析报告。
1)资源监控分析。平台提供了网络设备、物理服务器、虚拟机三位一体的监控方案。通过全方面的监控底层基础设施实时状态,为统一资源调度及故障检测提供决策依据,并通过平台的WEB界面将监控数据具象化、可视化。物理/虚拟机监控包括主机的CPU、内存、磁盘、网络、事件、警告、进程等信息。网络监控则通过SMNP、Trap、Syslog、CMIP等协议对网络设备和网络状态进行监控。流量监控通过SDN交换机组成监控网络,灵活地管理监控点,并将用户关心的流量数据导入指定监控工具。在网络层面,实现监控工具的复用和高可用,免去大量重复购买监控工具和部署运维成本。
2)大数据监控分析。基于SDI的“互联网+”开放平台整合、收集全局数据,提供语义分析、数据挖掘、预测分析三个维度的数据分析能力,并将数据进行统一分析处理后生成数据分析结果报表,为用户决策提供数据支持。如图5所示,平台基于开源软件Hadoop搭建,并在此基础上进行深入的二次开发定制,以保障用户数据的安全性和平台运营的稳定性。
根据用户业务需求,为用户量身定制业务模型,如客户流失模型、客户特征模型、付费客户转换率模型等,不同模型联合不同的数据源,作为输入导入平台通过分析业务模型中定义的数据源,如:交付数据、交易数据、设备活动数据、服务活动数据、网络状态数据、机器数据等数据,帮助用户分析网络隐藏的故障、客户行为偏好、业务服务能力及质量等信息。为用户提供远超结构化数据的洞察力,帮助用户了解业务中的潜在风险和不足,帮助用户提升业务质量。
图5 大数据分析模块架构图
基于SDI的“互联网+”开放平台具有智能的自动化运维功能,即故障自愈和服务迁移,平台可以准确预测缺陷状态和及时告警已经发生的故障状态,并实施对应的可靠措施,使服务停止范围降到最低程度,或者完全正常提供服务。当出现不可自主排除故障时,启动服务副本,切换主备进行故障转移。同时,系统在调度基础设施资源时会自动避开故障设备和拥塞网络,以提供更优质的服务。详细的故障自愈流程如图6所示。
图6 故障自愈流程图
基于SDI的“互联网+”开放平台以大数据监控分析模块的监控结果为决策依据,在故障发生前或发生初始时期,快速启动故障自愈机制,做到在用户“无感知”的状态下进行故障自愈或服务迁移。可大大减少企业的运维工作,从而减少企业在运维方面的支出,并同时保障企业服务无间断运行。
工业互联网把机器连入网络,并利用产生的数据为企业服务。工业互联网的数据来自安装在机器上的传感器。通过掌握和分析机器产生的海量数据可以精确地知道每一台机器每一个零件的运转情况,进而通过分析机制对每一台机器每一套设备提供量身定做的解决方案。传统的IT基础架构阻碍了业务的敏捷性和创新,并且在安全性、运营成本、资本投入上需要花费大量资金[11-13]。
基于软件定义基础设施的“互联网+”开放平台将硬件基础架构资源和软件基础架构资源分离开来,并自动执行计算、网络和存储环境的配置流程,并且该开放平台提供开放接口导入工业互联网上的海量数据。在此基础上,基于软件定义基础设施的“互联网+”开放平台,可以提取相关的数据进行分析。通过自动化运维系统,每一台机器,每一个零件都将具备智能分析、自我诊断和自我修复的功能。通过业务编排系统,形成生产全流程的智能决策,实现机器弹性控制、运营管理优化、生产协同组织与商业模式创新。具体实现如图7所示。
基于软件定义基础设施的“互联网+”开放平台架构能够通过工业全系统的互联互通实现工业数据的无缝集成,从生产系统的内部智能化改造升级和依托互联网的新模式推进工业互联网的发展。
目前,“互联网+”的典型应用车联网是一个新兴的行业,车联网基于电子识别、定位和无线通讯技术,打破了人车之间不能通讯的壁垒,建立了人车之间通讯的渠道,使得车辆运营监控、车辆实时参数获取与分析、远程协助与诊断等成为可能。通过车辆数据采集终端,读取标准化的信息和汽车厂商授权的车辆信息,获取大量车辆相关的基础数据。如此大的数据量如果在传统的IDC模式下,无疑会遭遇下列挑战。首先,服务器扩展性差;其次,运维不灵活;再次,信息安全无法保障;最后,车辆行驶的场景对动态网络要求较高,传统 IDC无法实时支持对网络的动态调整[14-16]。
以软件定义基础设施的“互联网+”开放平台为支撑,采用SDI技术整合计算、网络、存储后,采用高效实时的动态资源配置能力,实现SDI环境的动态控制、管理和服务。如图8所示,通过我们的平台,管理员可以自定义服务模板,例如车辆管理模板。在模板里定义相应的业务功能,如车辆定位及运营监控、道路使用及收费、车队管理、线路优化、安全管理等,各个功能组件的交互接口以及所需业务资源的描述。当车辆管理业务上线时,由服务引擎导入并解析车辆管理模板,向资源平面申请业务资源,并在申请到的资源上实现各业务功能和接口的实例化与服务编排,将业务切片迁移到运行态。业务切片可以实现运行态中快速功能升级和资源调整,在业务下线时及时撤销和回收资源。
图7 工业互联网应用场景
图8 车联网应用场景
目前,我国车联网行业处于初级阶段,车车通信与车路协同是未来发展方向。基于软件定义基础设施的“互联网+”开放平台,可以通过开放接口实现车与道路的信息交互,以获知周边车辆速度、位置信息等微环境信息,预测事故概率,提高行车安全性及交通效率等,为用户带来全新的用车体验和价值。
本文提出了一种基于软件定义基础设施的“互联网+” 开放平台架构设计,着重介绍了软件定义基础设施及其“互联网+”开放平台的构建技术。后续将围绕虚拟化、抽象开放、安全防护等方面进一步完善,同时拓展其在能源互联网、人工智能等领域的应用。
参考文献
[1]Shesha Krishnapura,Shaji Achuthan,Raju Nallapa,et al.软件定义基础架构在英特尔的演变历程[EB/OL].(2015-03)[2016-08-08].http://www.intel.cn/content/dam/www/public/cn/zh/documents/best-practices/how-softwaredef i ned-infrastructure-is-evolving-at-intel-paper-cs.pdf
[2]Hongxin Huy,Gail-Joon Ahn.Virtualizing and Utilizing Network Security Functions for Securing Software Def i ned Infrastructure[C]//Looking Beyond the Internet Workshops,2015
[3]John H Moore. SDN Infrastructure Ecosystem[C]//Looking Beyond the Internet Workshops,2015
[4]Inder Monga. End-to-end,multi-domain SDN with SDI bookends[C]//Looking Beyond the Internet Workshops,2015
[5]郑叶来,陈世俊.分布式云数据中心的建设与管理[M].北京:清华大学出版社,2014
[6]Larry Peterson,Andy Bavier.Central Office Rearchitected As a Datacenter[R].Open Networking Lab,2015
[7]Rodrigo Fonseca,Orran Krieger.Towards a Network Marketplace in a Cloud[D].Providence,RI:Brown University,2015
[8]汪洋.软件定义集中式数据中心组网架构及关键技术研究[D].北京:中国电力科学研究院,2014
[9]Network Functions Virtualisation (NFV) Management and Orchestration[EB/OL].[2016-08-08].http://www.etsi.org/
[10]梁军学.未来互联网试验平台若干关键技术研究[D].北京:北京邮电大学,2014
[11]纪成君,陈迪.“中国制造2025”深入推进的路径设计研究——基于德国工业4.0和美国工业互联网的启示[J].当代经济管理.2016,38(2):50-55
[12]胡晶.工业互联网、工业4.0和“两化”深度融合的比较研究[J].学术交流.2015(1):151-158
[13]田洪川.从先进制造战略到工业互联网 美国掀起再工业化浪潮[J].世界电信.2015(4):66-70
[14]李静林,刘志晗,杨放春.车联网体系结构及其关键技术[J].北京邮电大学学报.2014(6):95-100
[15]陈前斌,柴蓉,岑明.车联网何去何从[J].中兴通讯技术.2015(1):47-51
[16]马书惠,宋亚亮,房秉毅.对电信运营商发展车联网的思考[J].电信科学.2013(2):109-114