韦国森
南京审计大学信息工程学院 江苏南京 211815
在现今的复杂市场环境下,企业竞争压力不断加大。为适应竞争,企业不断调整经营策略。然而随着信息技术的发展,世界已进入大数据时代。大数据意味着主流计算机软件涉及的数据量太大,无法在一定时间内收集、分析、处理或转换,这使得决策者很难根据这些信息做出决策[1]。在大数据环境中,企业的决策活动取决于其管理信息资源的能力。这与通过信息系统和信息网络实现的传统信息资源管理不同。在大数据时代,信息资源管理需要更强大的收集、存储、计算和传输能力。因此,传统企业正面临着能够利用云计算等先进信息技术适应大数据时代的新兴实体的挑战。而企业也需要大量能够熟练使用云计算服务进行大数据分析的专业人才[2]。
为提高市场竞争力,企业通常采取多元化经营方式适应市场变化。这使得企业内部的生产和管理变得更加困难。生产技术、供应链系统、市场和客户的差异化等因素导致各种产品的不同生产决策。因此,企业对于信息分析的要求使得基层人员需具备较高的决策能力,帮助企业减少中层管理人员,从而减少决策与行动之间的延误[3]。在大数据环境下,底层员工获取和利用数据的能力大大提高,决策者正在从管理转向低级别的员工,决策者的复杂关系和整个企业的参与性特征日益凸显,这也为高校毕业生提出了更高的要求[4]。
为了适应大数据环境带来的竞争。云计算平台在大数据应用中发挥着越来越重要的作用。如何有效利用云计算的优势进行大数据分析成为很多高校的新兴专业。云计算的核心思想是将大量计算资源链接到统一管理网络中。它形成资源池以按需为学生提供服务。凭借其独特的并行处理能力,云计算扩展了数据处理和分析的方法。对于一个组织的信息化而言,云计算意味着组织的信息系统的数据存储、应用与维护效率的极大提升[5]。因此,在实践教学中,云计算环境下大量的决策信息和云计算环境中强大的处理能力可以为学生提供强有力的计算和决策支持。而且云计算平台的统一管理和调度可以按需为学生提供服务。
大数据和云计算是互补的。从技术角度来看,大数据依赖于云计算。通过云计算对大数据进行分析、总结和预测,增强了决策的可靠性,释放出大数据的内在价值。它们带来了一个新的决策模型,即数据驱动型决策。随着内部和外部数据量的急剧增加,组织中每个人获得信息的机会都会增加,这使得决策者在组织层次上更加多样化,层次更低。同时,企业决策者的角色被改变。从而使决策组织结构逐渐趋于扁平化,决策权分配趋于分散[6]。
在云计算环境下,以信息系统和在线应用作为数据采集的方式,企业实现数据的跟踪和采集,并映射集成到数据仓库中。然后,企业使用智能分析工具,通过不同的应用场景挖掘有用的数据。同时,数据挖掘可以为分析、预测和控制提供有用的资源。最终让企业可以实现高效的大数据系统。这个大数据系统基于现有的业务数据并匹配一系列相关功能,成为统一的大数据云计算平台[7]。
由此可见,云计算平台对于大数据分析有着重要的作用。而对于高校的实验教学而言,利用云计算高效的数据分析能力是培养面向大数据环境的合格专业人才的重要手段。因此需要打造适合高校的教学条件,模拟大数据环境下企业的经营与管理活动,形成新的教学方法。
在实验教学的应用中,利用云计算进行决策过程优化是贴近未来就业需要的重要教学内容。基于云计算的决策过程优化可以划分为数据资源层、资源管理协调层、云计算资源服务层、云计算智能学习层和用户层5个层次的框架。数据资源层包含在异构云计算环境中进行计算所需的数据资源。协调层负责云计算环境中的资源管理。云计算资源服务层负责接收企业决策单位提交的资源服务请求,并建立资源服务计划。云计算智能学习层采用云计算并行处理模型进行数据分类和智能学习。用户层是用户的访问端口。
当使用云计算进行数据分析时,有3个子系统:数据库、模型库和知识库。在云计算平台的知识库和模型库的基础上,对存储在数据库中的数据进行分析,得到数据分析结果。一方面,云计算平台将知识库中的结果作为知识储备引入到知识库中;另一方面,通过数据分析的结果修改和丰富了模型库。系统决策过程可以根据实际决策问题的复杂性选择单一模型或多个模型来进行决策组合。而云计算平台的计算能力极大地提高多个模型组合在大数据分析过程中的应用效率,不仅可以节省实践教学的时间,并且可以让学生在实践中掌握各类数据分析模型。
在利用云计算平台进行大数据处理和分析时,主要包括2个步骤,即数据提取和计算。在实验教学中,首先指导学生了解提高大数据的价值密度和数据可用性的方法。然后,学习如何由分布式计算完成分析和决策。从而使学生学会使用分布式计算实现数据处理和复杂的数据简化。因此,云计算辅助决策尤其适用于模拟组织结构扁平化的企业,并为各专业学生培养在扁平化组织中的角色提供有效的教学环境。
在云计算实验环境下模拟企业的决策优化过程就是学习如何利用云计算平台解决问题的过程。学生通过学生终端提交决策问题并利用云计算平台的信息服务来构建模型。同时,云计算平台通过使用推理模块和知识模块引导学生根据自己的需要选择合适的决策模型,并跟踪解决决策问题的过程。在实验过程中,决策任务是使用云服务模块分解的。在分解任务后,云服务通过资源管理模块将每个分解决策任务分配给相应的资源模块。决策模块集成了子任务的执行结果,并通过学生界面将执行结果返回给学生。
云计算平台的实验环境可以准确地模拟实际内容,学生可以在云计算平台上观察业务运营与他人的工作模块运行状态,并自动完成任何必要的调整。因此,云计算平台有助于培养团队协作能力。学生可以学习掌握云计算的分布式处理的功能,以提高决策个体理解和应用信息的能力。此外,学生可以通过云计算平台进行智能学习模型和编程模型的构建与使用,以此熟悉数据拆卸、重组和迭代计算功能。
通过使用云计算平台,参与实验的角色单元都可以独立收集业务数据信息。通过分析和研究这些数据与运行状况,学生可以在模拟经营中发现管理所存在的问题,及时调整有限资源,学习并掌握使企业的管理和决策更加科学可靠的各类方法。此外,借助云计算,学生可以充分利用内部和外部数据资源的各个方面进行各类经营活动的实验。并学习如何做出大数据管理决策,将数据优势最大限度地转化为资源优势。在云计算平台的帮助下,学生可以更深刻地理解管理和技术对于企业的支柱作用。凭借低成本云计算的优势,销售管理、生产管理和供应链管理三大重要功能被整合在一起。学生可以体会作为决策制订的最初被动参与者到决策信息的提供者的这种转变过程[8]。
在实践教学中,借助云计算的决策支持可以进行海量异构数据分析,并借助竞争情报分析提升商业舆情计算和精准营销的教学水平。例如可以用大数据分析为标准进行定价策略制订的模拟实验,可以使学生对市场和竞争对手的变化有更为直观的理解,并学习如何合理经营以保证组织的市场适应性。
由上文可见,云计算实验环境下,学生可以实现对海量异构数据的分析,并在其上展开不同类型的实验模式。其实验环境架构如图1所示。该图显示了基于云计算的实验教学环境所包含的云计算平台架构,以及平台组件之间数据资源的动态分配机理,并标示了实验过程中实验者与平台之间的数据交流模式。在此平台上展开的不同实验模式都具备类似的架构特征。实验都预先在云计算环境中已经存储了大量异构数据资源,参与实验的学生注册为云计算资源的使用者,并发送相关的资源申请信息到资源管理中心。通过云计算服务创建对应的实验角色,云计算的虚拟资源池的资源服务技术对学生的资源请求进行回应,再由云计算资源管理中心针对学生的请求将资源分配给学生,云计算中心根据学生所提交的请求与应用于实验的异构数据资源素材选择合适的云计算服务,并提供学生对应的数据访问权限。在图1的实验教学环境架构之下的实验步骤主要包括以下6个。
图1 基于云计算的实验教学环境架构
(1)实验参与者通过云计算平台创建异构数据资源,并将资源注册到虚拟资源池中,这通常是预先导入的海量实验素材。
(2)从访问平台的学生中创建参与实验的用户。同时根据实验需要,平台将分配不同实验用户以对应的角色,并建立他们之间的协作关系。用户角色按照其对数据的利用方式可以划分为两类:第一类是可以管理与调度异构数据资源的资源管理者。第二类是对云计算平台资源调用的资源调用者,其可以使用各类数据分析资源。平台具备资源管理协调功能以保证异构云计算环境中资源供应、使用及运算的效率,并使用户可以访问相应的云计算服务,如查询资源获取和模型训练情况等。资源管理者将数据及应用发送到异构云计算平台的资源管理中心,由该中心将其分配给相应的虚拟资源池,以实现资源调用者的数据应用。
(3)平台将实验素材发送给云计算资源管理中心。该中心则依据参与实验用户所传递的用户信息与服务需求对其用户的请求进行解析。并对参与实验的用户进行个性化分析,按照实验所要模拟的不同用户角色的管理策略得出相应的资源匹配部署方式。
(4)实验用户与云计算服务平台进行通信,关联具体云计算服务,进而根据实验要求从中选出最佳的云计算资源的组合,此过程是处于不断重新匹配与部署的状态,直到用户匹配到最佳的云计算资源。
(5)若资源调度协调成功,扮演资源调用者角色的用户便可利用云计算分配的资源(计算资源、存储资源、机器学习与模型库等)进行异构数据的分析。并且他们可以直接从云计算平台访问异构数据资源,利用其资源管理的服务模块对输入输出的结果进行比对以实现对数据分析结果的校验、反馈与汇总。
(6)对实验数据的分析结束,则输出数据分析结果。而无论实验结果是否符合需要,都将整个实验中的云计算资源管理协调过程存储到数据库中以便云计算平台能够继续优化。
笔者所在学校利用公开招标的方式,结合其经济管理实验中心与大数据实验室的设备资源,开始进行云计算实验平台的建设并在其上展开应用信息系统辅助教学的实践活动。尤其可以在平台上建立Hadoop集群,用于教学上传或访问Hadoop集群的数据,进而运行一个或多个MapReduce作业。目前已展开了初步的实验教学活动研究。这些活动包括展开针对云计算的Hadoop分布式系统的数据库管理与数据挖掘的教学研究,实现利用云计算平台整合信息获取、信息传输、信息处理与信息应用。并已在部分课程开始尝试增加云计算平台的实验教学内容,初步尝试已取得一定的成果。在云计算平台的帮助下,在教学中可以展开针对大容量数据样本的案例分析实验,如针对全国的审计大数据的分析实验,这不仅拓展了学生的视野,且更适合学生实现角色分工,帮助学生深入理解课程内容,提升他们的技术敏感性。并鼓励学生利用云计算平台开展创新实践项目申报。通过学生在平台的使用情况报告优化平台的配置与教学模式。这些措施不仅为平台提供了教学应用范例,同时也产生了大量的数据集,为以后的实验以及平台的进一步改造以及机器学习算法的优化提供了重要的数据支撑。
为了适应大数据环境带来的竞争,培养专业人才面对无法利用传统的智能决策方法解决的问题。高校应借助计算机技术和网络基础设施的发展,让云计算平台在大数据专业的实验教学中发挥越来越重要的作用。有效利用云计算优势和服务特色的方式训练学生处理大量异构数据的能力,增强学生决策的协同能力。同时教学更侧重于让学生熟悉扁平和智能化的组织结构。以便让高校学生具备未来大数据环境下的工作技能,并对多变的组织环境具备高适应性。