每个企业都可能拥有大数据,但是并非每个企业都能够成为大数据企业。
大数据因其体量之“大”而得名,然而体量并非大数据的唯一特征,甚至也不是大数据最为重要的特征。巨大的体量凸显的是技术需求。而对于管理者而言,刻意追求巨大体量的数据并不具有多少现实意义,大数据更重要的特征在于其多样化的来源和形态、持续快速的产生和演变,以及对深度分析能力的高度依赖。因此,企业对大数据的驾驭和掌控,其核心并不在于拥有多大规模的数据,而在于是否能够对来自于企业内外部多样化信息源的涌流数据进行敏捷持续的捕捉和整合,并通过深度分析开发其商务价值。
一家中等规模的百货商场,通过视频监控记录下商场各个区域的客流人数,从而评估每天各个时段客流的在店时长,进而结合销售记录数据估算出客流中带有明确购买目标的“搜索型”顾客和无明确购买目标的“浏览型”顾客的比例,从而为之设计针对性的营销手段和服务措施。这一实践中所涉及的数据量,从技术视角上看并不算庞大,但该商场对多源数据的整合和开发,不失为基于大数据管理的一种典型体现。
从这个意义上来说,在管理视角上,大数据既不是一种技术,也不是一种应用系统,而更应该是一种立足于企业内外部数据融合以提升管理效率、开拓价值创造模式的管理思维。建立这种面向大数据的管理思维,其基础是业务流程信息资源的高度集成化,以及信息创造和传播形式的高度社会化。
所以,企业大数据的一个重要焦点,在于业务流程信息与社会化媒体信息的全方位融合。以ERP为代表的企业系统应用推动业务流程信息资源从分割走向集成,日渐兴起的企业内外部社交媒体则推动信息的创造和传播形式从通道式/平台式走向社交式,二者的融合将成为企业大数据的核心特征。由此看来,未来的“大数据企业”,则代表着建立在这种融合基础上的新型组织形态和价值创造模式。
驾驭企业内部大数据
企业内部数据包括两个主要维度:一是与业务功能及流程紧密相关的数据,如库存信息、物料需求信息、生产计划信息、采购信息等,可统称为业务流程信息;二是企业内员工及各种管理系统在其日常工作及活动中所创造、记录、交换和积累的信息,例如员工间的交流记录、工作心得、经验分享、活动新闻等,可统称为知识及沟通信息,知识及沟通信息高度松散且非结构化,但可能蕴藏着企业的重大潜在价值。
这两个数据维度的发展和融合,催生出了企业内部大数据。如图1所示,在传统的企业组织中,业务流程信息分散地存在于一个个孤立的业务系统中。在过去二十余年的企业信息化进程之中,一个主要的方向是业务流程信息从分割走向集成。从库存管理系统、物料需求计划 (MRP) 发展到企业资源计划 (ERP),分散的业务信息被集成于企业系统之中,从而实现面向业务流程的信息共享和沟通,并在此基础上借助跨部门的协同实现业务流程的优化和决策能力的提升。
另一方面,近年来逐步兴起的企业内社交媒体应用,推动着企业内部数据环境在知识及沟通信息维度上的重大变革。在传统企业组织中,知识及沟通信息借助于通道式或平台式的媒体产生和传播。在通道式的媒体上(例如email),所有的人都可以发信息,但信息的发送对象是明确的、有限的;在平台式的媒体上(例如企业内的新闻网站),信息是开放的,但只有专门的人员才能发布信息。在企业内社交媒体中,这两种形式被整合在了一起:所有人都可以发布和分享信息,而且这些信息是开放的、可定制、可再分享的。在这样的应用环境中,跨部门、跨层级的社交联系成为可能,并使得企业能够更为敏锐地应对变化的环境,以即兴式的团队组织来捕捉发展机遇。这种转变带来了三方面的价值:企业知识的有效共享和管理;企业文化建设,增强员工的归属感;对企业内协同创新的有效支持和促进。
进一步而言,当集成化的业务信息与社交化的知识沟通信息相融合,便带来了企业内部大数据。在集成化企业系统、内部社交媒体以及深度数据分析技术的共同支撑下,杰克·韦尔奇所畅想的“无边界组织”在新兴环境下成为可能,并被赋予了新的内涵。部门边界、层级边界被紧密的业务联系和广泛的社交联系所弱化,结构化的业务流程信息与非结构化的知识及管理活动信息被多维度融合的深度数据分析能力连接在一起,从而使企业真正具有驾驭内部大数据的能力。
从另一种角度上看来,业务资源整合使得企业信息资源的管理从分散走向集中,社交媒体的发展使得企业内的信息创造和传播从集中走向分散,二者相辅相成,使得优化控制与灵活创新的并存成为可能(见图2)。基于业务流程与社交媒体的融合而展开的深度数据分析,将为企业的决策优化、协同创新以及灵活应变开辟广阔的空间。
驾驭企业外部大数据
在企业外部的视角上,数据资源也包括两个维度:一是与上下游交易直接相关的供应链信息,如交易报价信息、订单信息、上下游企业库存及生产能力信息等;二是市场及社会环境信息,如原材料价格走势、市场需求及消费者偏好信息、顾客服务及满意度信息等。
企业外部大数据的基本特征,也正是在这两个维度的发展之中呈现出来的。如图 3所示,在传统的商务活动形式下,上下游企业的业务系统相互独立,交易伙伴借助电话、传真、电子邮件等手段以实现上下游信息交换,企业通过市场调研等方式了解消费者,获取市场及社会环境信息。组织间信息系统的发展带来了供应链信息的集成。通过将合作伙伴的信息系统进行对接,或是借助于电子市场平台实现企业信息系统的相互连接,上下游企业的业务信息能够通过标准化的接口自动交换,从而使得企业能够在较为充分地掌握上下游信息的基础上进行业务决策,实现交易伙伴之间的协同优化。
在市场及社会环境信息的维度上,信息的创造和传播形态同样经历了从通道式/平台式媒体向社交媒体的转变。公众社交媒体的巨大影响力为社会化商务注入了强大的生命力。初期的社会化商务包括作为对外沟通渠道的企业邮箱、博客、微博或即时通讯等,其主要目的在于提升企业形象、提供客户服务。随之发展而来的社会化营销,则注重在社交网络中通过与顾客及其他商务伙伴的沟通和互动,进而通过实时化、精确化的市场洞察以获取商业机会、开拓市场、把握创新机遇。此外,基于社交媒体的众包、众筹与众创,也日益成为社会化商务的重要组成部分。
供应链信息集成与社会化商务信息的融合,构成企业外部大数据的核心特征。来自于社交媒体信息源的市场环境信息与来自于组织间信息系统的供应链信息相结合,借助于深度数据分析技术实现面向企业商务网络的预测与优化,并支撑起实时化、精确化、个性化的消费者洞察与敏捷响应,在此基础上为基于网络协同及社会化商务的模式创新提供了丰富的可能性。从而,对外部大数据的管理和驾驭,也将成为现代企业在网络化的商务生态系统中占据主导地位并获取经营优势的关键途径。
成为“大数据企业”
基于以上分析,企业内部大数据的焦点,在于业务流程信息与知识及沟通信息的融合;企业外部大数据的焦点,在于供应链信息与市场及社会环境信息的融合。进而,大数据时代企业组织的基本内涵,在于内部大数据与外部大数据的全方位融合。如图 4所示,大数据企业立足于内外部业务与社交媒体数据的集成交汇。
业务流程数据主要来源于以ERP为代表的企业系统,涵盖了产品、物料、采购、生产、销售、财务等与企业生产及服务提供过程紧密相关的数据;商务交易数据来源于以供应链管理系统 (SCM)、客户关系管理系统 (CRM)、电子化交易系统为代表的组织间信息系统,涵盖了供应商、客户、订单、物流等与外部交易活动紧密相关的信息;内部社交媒体数据包括了企业员工在内部博客、微博、Wiki、内容分享平台、群体化即时通讯工具等应用中创造和传播的信息,以及企业在办公自动化系统等交流协作平台上所记录积累的数据,涵盖并反映了员工的知识、建言、创意、心态、氛围等形式多样、内容广泛的信息;外部社交媒体数据主要来源于公众社交媒体,包括企业博客、企业微博/微信服务号、品牌社区等各种形式,所涵盖的信息内容包括市场环境、需求信号、全生命周期顾客行为、个性化偏好、营销互动记录等。
在这四大类型的数据之间,致力于大数据管理的企业可以有两种不同的发展策略。其一是以社交媒体与业务数据的融合为主导,以期通过敏捷响应快速发现并应对内外部环境中的变化和机遇。在这种策略下,面向高速数据流的实时数据采集和分析方法,将成为大数据管理的主要支撑手段。
第二种策略是以内外部数据融合为主导,以期通过全面汇集内外部信息,对中长期发展趋势作出准确的预判,从而实现高度优化的业务决策,并通过对信息环境的掌控,获取企业网络生态系统中的领导地位。在这种策略下,大规模多源异构数据的采集、清洗和整合方法,将成为大数据管理的核心支撑。
如何挖掘企业大数据的价值
企业大数据的价值开发高度依赖于深度数据分析能力。从内外部融合的视角上看来,企业大数据分析包括三个基本维度,即内容、关系和时空。
内容维度指的是数据本身所承载的信息内容。例如,G公司是一家大型电信服务商,其内部建设实施了一套“班组博客”系统。在这个内部社交媒体平台上,公司中的3000多个工作团队都开设了自己的博客,用于发布和交流工作经验、生活体验等方面的内容。经过数年的发展,整个博客系统中积累了博文700多万篇,评论超过1500万条,并保持着每月15万篇以上的博文发表数量,年阅读量超过1000万篇次。对于这一平台所积累的大量数据的价值开发,首先体现在对其信息内容的提炼上。平台上与工作相关的博文内容,如客服案例、经验分享等,经自动筛选分类、主题识别、关键词索引之后,被构建成企业知识库,为业务及管理工作提供快速有效的知识支撑,同时成为员工培训和自学的有力工具。而大量与工作无关的博文和评论内容,包括生活常识、娱乐信息、心情表达、心灵鸡汤等,在智能化的分类整理之后,也成为了该公司的一个独特的文化情景,支撑着企业中活跃的氛围,强化了员工的文化认同。
关系维度指的是数据及其所指代的对象之间的联系。在G公司的班组博客中,员工的发表、阅读、评论、回复、关注等行为详尽地反映了其相互之间密集而持续的联系,而这些联系毫无遗漏地被记录在平台的数据库之中。通过对这些关系结构的深度分析和挖掘,G公司获得了对员工及团队的影响力、凝聚力、创造力的更为准确而深入的评估手段。进一步而言,博客平台的行为记录数据与业务系统中的事务处理记录数据,以及员工及团队的绩效表现数据,也能够被有效地关联起来,从而使得管理者拥有强有力的工具,帮助其发现和理解员工的行为特质、工作表现、业务能力之间的潜在关联,进而实现良性优化的人员配置和人才培养。
时空维度指的是数据生成及传播的位置以及数据随时间演变的模式。对G公司而言,其数以千计的业务场所分散在众多城市的不同地点,因此,数据中的位置信息对于虚拟化的团队协同而言具有直接的意义。此外,位置信息也包括了数据在组织功能结构和层级结构中所处的位置。同时,在G公司的班组博客中,对特点话题时间演变规律的分析,也为管理者提供了有效的参考。其中对企业重要活动、运营理念相关信息在班组博客中的传播演变模式的跟踪,有效地揭示了员工对管理理念的认知、态度和接受过程。
更深入的价值开发来自于上述三个维度的交叉综合。例如,内容维度与关系维度的结合,使得G公司能够识别员工的兴趣偏好、社交特质、工作性质以及工作表现之间的匹配关系,也能够更为准确地发现那些分散在不同的员工手中、但具有重要潜在影响力的经验、创意以及机遇信号。内容维度、关系维度与时空维度的结合,使得企业能够更为深入地理解不同的员工特质、知识技能、团队特性、热点偏好在整个组织中的分布,以及这些结构随时间演变的过程和趋势,从而更为有效地调度和配置这些资源。
这些维度上的分析需求,主要需要三方面的数据分析技术予以支撑。第一类是全局视图技术。对于管理者而言,对大数据内容全局状况的把握,往往是开发大数据价值的一个基本需求。然而大数据的体量和结构复杂性往往远远超出人类认知的信息承载能力。因此,有效的技术应当能够在大量数据中提取出一个足够小的集合以呈现给管理者,并使得这个小集合能够充分地代表数据全局。例如,在G公司的博客平台上,一种“代表性博文提取”技术能够在每天所出现的数以千计的博文中自动选择出10篇。这10篇博文在很大程度上全面代表了当天所出现的数千篇文章,既充分反映热点,也不能忽略冷门信号,从而使得管理者能够通过阅读这些文章来了解全局。第二类支撑技术是关联发现技术,其目标在于敏锐识别数据间的联系。例如,当G公司试图整合博客平台、业务系统、人力资源系统中的数据以全方位分析员工、团队特质以及绩效信息时,大量的数据属性之间所构成的复杂潜在关联网络,就需要强有力的关联发现技术来加以处理。第三类支撑技术是动态跟踪技术,即实时化的流数据分析处理、快速增量数据分析。三方面技术都处于快速发展之中,但尚未全面成熟,有待于学界和业界的持续努力和探索。
结束语
从一定意义上说来,业务资源集成与社交媒体相融合的过程,是一个“信息去中心化”的过程。信息资源的创造和管理,从以往以经营和运作为核心的中心化模式,转化为以分散创造、自由传播、灵活汇聚为特征的众创模式。另一方面,内外部数据融合的过程,是一个“信息去边界化”的过程。企业部门之间的信息交换、企业之间的信息交换以及企业与市场环境的信息,以日益多样化、实时化的方式实现。
这样的转变对于企业组织及其员工而言,其影响将会是多方面的。正面的影响可能包括创新意识与创新行为的出现、员工能力和技能的发展、沟通满意度的提升、员工关系资本的建立和积累、员工对组织的认同和归属感的增加;而负面的影响则可能包括员工注意力分散、过度争论,以及负面情绪的传播等。所以,建设“大数据企业”的过程,也将会是一个伴随着困难与风险的过程。在此过程中,需要管理者有效地把握创新发展的长期收益与短期业绩之间的平衡,在推进大数据融合的同时防范和控制其中的组织风险,并审慎地思考和重新定义组织内外部边界。
换言之,对企业而言,大数据实质上是一种管理思维,其支点在于业务信息资源与社交媒体的融合,以及内外部数据的融合,在这样的支点上反思企业的组织形态、运作范式和价值创造模式,是“大数据企业”的真正内涵所在。
郭迅华:清华大学经济管理学院副教授