(上海立信会计金融学院,上海 201209)
随着世界经济一体化的持续推进,信息技术突飞猛进,人类社会正逐步从工业经济时代向知识信息经济时代转变。对于大部分行业和企业,与之相关联的信息技术已经成为组织关键性的、战略性的资源。信息系统在优化企业组织内部的知识、信息流动以及实现组织资源优化配置等方面有着举足轻重的地位,而数据资源管理技术则是信息系统必不可少的核心技术。目前,以大数据为代表的信息化浪潮将重塑数据管理理论,推动数据管理和信息分析的技术创新。
根据劳登夫妇给出的定义,从技术上讲信息系统就是一组相互关联的能够收集、处理、存储和传播信息来支持组织内部决策和控制的部件的集合。从管理信息系统的功能上来看,它可以从不同侧面满足企业各个管理层次的信息需求,同时给相应职能部门的管理活动提供支持,以使企业的管理活动更加科学有效。越来越多的企业领导者已经意识到管理信息系统的重要作用,主要体现在:一,信息是正确决策的基础。管理者要对环境变化做出正确的决策,除了借助个人经验进行理性判断外,还需要收集大量正确、及时、可靠的信息。信息管理系统的应用可以提高管理决策的准确性同时兼备预测功能,并且可以减少不必要的时间花费,提高效率降低人力成本。二,信息系统可以帮助企业收集到提高销售和市场技巧方面的数据,帮助企业降低内部成本、防止客户流失、紧固供应商。信息管理系统是可以使公司具有强力竞争优势的工具。最后,信息管理系统改变了人们的工作方式,使管理体制更加合理化。企业信息系统的引入使管理的分散化向集中管理转化。使得组织的机构扁平化,企业部门组织层次减少,形成部门之间的有机结合,保证高层管理者能够迅速对决策效果进行评价和控制。
随着云时代的来临,一场大数据革命正在进行。各行各业均存在大数据,根据文献的定义,这些数据量大类多、实时性强、蕴藏巨大价值,需要搜索、处理、分析、归纳、总结其深层次的规律。普遍认为“大数据”爆发的根本原因有二:数据价值越来越受到关注以及收集处理数据的技术显著提高。数据生产要素化使得信息系统模式和理念推陈出新,也使得大数据技术得以发展和深化。可以说大数据正是以信息系统这一有力载体为基础的前沿技术,代表着今后数据分析的发展方向。
近年来随着信息化技术的不断发展,现有的企业管理信息系统无论是规模还是架构都很难适应在海量数据场景下的数据管理和分析,直接影响了企业形势预判和重大决策。因此,需要创建新的能够匹配当前大数据场景的业务系统。借助此信息系统,可从海量数据中选取最有价值含量的信息,并对其进行有效整理和逻辑分析,以期发现隐藏在繁杂数据背后的因果逻辑关系,实现对海量数据的深度应用、综合应用和高端应用,承担起对组织战略应用的支撑和服务。具体来说,信息系统在大数据时代的适用技术如下所述:
不断推进的信息化建设以及飞速增长的数据规模,都对信息系统的数据存储能力提出了新的更高要求。为了满足大规模数据的存储和分析,信息系统应支持单一系统扩展至10PB以上规模,以满足数据爆发的存储需要。
高质量的数据是数据分析挖掘等应用行之有效的必要前提,面对企业不同部门之间产生的繁复数据,信息系统势必需要将这些多源异构的数据进行抽取、转换及装载,实现数据的整合、消重,提供高质量的数据,并在此基础上进行关联、建模,为实战业务提供可用的数据。
百亿条记录的检索、上千张表的碰撞、大量的移动互联网和社交媒体数据处理等应用,无一不对信息系统的数据分析能力提出更高的要求。
大数据的实质是对数据的管理与开发利用,要想借助大数据技术推动企业管理工作的发展和变革,在行业竞争中占得先机,技术选型非常重要。文献指出在各路组织和技术人员的助推下,信息系统在大数据相关领域中的技术呈现出百家争鸣的局面,在涵盖数据收集、存储、计算、挖掘、资源调度等方面不断取得突破和创新,下面就以最核心的计算层和存储层两个维度介绍一下信息系统的相关技术路线和发展趋势。
数据处理:无论使用何种应用,一台服务器面对海量数据的计算仍然束手无策,而分布式计算则对此类问题的处理游刃有余。与此同时,HadoopMapReduce的重要创新便是化繁为简把整体大数据集拆分成一个一个的小任务,并由同时运行的多个节点进行处理。这种批量处理框架常用于离线的复杂的非结构化数据处理,如ETL、数据挖掘等场景;与Hadoop的使用硬盘来存储数据不同,Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合;而Storm则是专门针对实时数据类型的流式计算分析框架,应用在低延迟的场景中,实现海量事件的实时分析、处理和决策。除此之外,为应对不断增长的海量结构化数据的存储和快速处理以及灵活的业务建模需求,信息系统所依存的数据库必将引入分布式架构、MPP处理技术。
数据存储:MapReduce可以将处理海量数据的任务分解至多个节点服务器同时进行。而对于分布式计算,每台节点服务器都必须拥有数据访问权限,这就是HDFS所具有的功能。HDFS有着高容错性、高吞吐量的特点,适合大数据集的应用。与此同时,业内也有许多其他类型的文件系统推出,不仅能解决了传统存储体系结构存在的难题,又能提高存储利用率和数据读写性能,可以替代HDFS作为Hadoop架构的底层文件系统/数据存储。
不同的技术思路各有偏重。由于不同类型的组织有着不同的组织结构,业务种类繁多,大数据应用场景多样化,只有积极引进大数据领域的先进技术,才能推动组织管理工作迈入大数据发展阶段。
通过上述分析,我们不难看出,未来信息系统必将围绕“大数据”进行建设。通过合理规划企业信息系统的建设路线,积极引进大数据技术,企业才有可能在未来激烈的市场竞争中占据优势地位。对未来信息系统在大数据时代的发展趋势,具体有下面几点思考。
作为二十一世纪最重要的战略资源,数据信息越来越受到关注和追捧。所以,企业为了能在市场竞争中取得先机,就必须提前制定有关大数据的企业战略。而在制订计划时,需要信息系统提供支持。那么,数据资源化就需要一个合理的规范和标准,以保证数据质量等要求。
云计算作为大数据的设备依托,是大数据产生的源泉。企业管理信息系统需要积极引进此类技术,主动进行技术革新,关注信息安全和接口安全等方面的新技术、新方法,为大数据革命添砖加瓦,让大数据在计算机时代发挥出更大的作用。
信息革命如火如荼,与数据相关的云计算、大数据等一系列新概念新观点也应运而生,这对全球企业来说是把双刃剑。为了把握机遇,积极迎接挑战,在行业竞争中拔得头筹,设计建立一个合适的企业管理信息系统意义重大。只有以信息系统平台为基础,实现企业信息共享,才能深度利用海量数据背后的有利信息,在竞争者中脱颖而出。更重要的是,大数据俨然成为信息时代一种最重要的资源,各个领域和各部门都受到其影响,从这一层面上来说,大数据对于推动国民经济发展举足轻重。