刘力钢,张 骅
(辽宁大学 商学院,沈阳 110036)
2012年,“大数据(Big Data)”开始成为国内外广泛研究的重要议题。研究之初,学者们纷纷对大数据定义、特征等进行研究,管理学者们普遍认为大数据是全球数据量的爆发,海量的数据可以成为企业的基础性资源,帮助企业提高绩效[1]。然而,随着对大数据研究的不断深入,国内外越来越多的研究者提出,只有将这种数据资源进行分析和转化,才能发挥更大的价值。于是,自2014年起,在大数据研究领域引发了2项较强的分析和发展:1)如果侧重于研究和管理方面,将大数据整合到组织流程中,就是大数据分析能力(big data analytics capability)或大数据能力(big data competence);2)如果侧重于计算机和基础信息设施方面,即技术与数据分析,则被称之为大数据分析(big data analytics)。虽然表述不同,然而通过概念梳理不难发现其研究内容是相似的,为了方便表述,本文统一称之为大数据分析能力。大数据分析能力是指,在以数据是重要资源的大数据思维指导下,在有效整合数据资源、技术资源和人才资源等基础上,并在一定组织机制的支持下合理、有效地对大数据进行收集、分析、挖掘以实现一定价值和达成一定目标的动态能力[2]。它是一种企业集聚、调动、配置、利用大数据资源从而获取有价值的洞察以及协调企业大数据活动与其他业务活动的能力,是提升企业应对环境的模糊性与不确定性的能力,有助于企业获取竞争优势和提升绩效[3]。
由于大数据分析能力是新兴的概念,本文对2014—2020年的外文和中文期刊中的研究趋势、研究主体、高被引文献、热点关键词、关键词聚类进行了分析和总结,希望能够提供一副理论路线图以为后续研究大数据分析能力在企业中的应用提供基础。
为了能有效地对研究现状进行总结,本文采用文献计量法和科学知识图谱分析法,对国内外大数据分析能力在企业中应用的相关文献进行可视化分析。本文所用的分析文献由外文和中文部分构成:外文期刊来源于Web of Science(WOS)核心数据库,中文期刊来源于中国知网(CNKI)核心数据库。为了避免数据过多而造成冗乱,影响研究的结果,本文选取的检索方式如下(表1):
表1 研究数据获取方式Table 1 Data acquisition methods
由图1所示,在外文期刊中,大数据分析能力的研究始于2014年,研究之初学者们的发文量较少,2014年共发文8篇。然而,随着越来越多的研究学者和机构对此领域的关注,从2014—2020年发文量呈现逐年上升的趋势,2020年共发文118篇。在外文期刊中,相关内容逐渐步入研究热潮。在中文期刊中,2014—2016年,相关研究发展较快,处于不断上升状态;2017—2018年,研究数量经历了短时期的下降,尤其在2018年,共发文21篇,发文量较少;经历了低谷后,2019—2020年,相关研究迅猛发展,2020年共发文139篇。在中文期刊中,相关内容呈现波动上升的研究趋势。由此说明,国内外学者对此研究领域越来越关注,已经掀开了研究热潮。
图1 外文和中文期刊发文量时间分布统计Fig.1 Time distribution statistics of publication volume of foreign and Chinese periodicals
2.2.1 作者合作分析
通过作者共现分析图能够梳理出研究学者在相关研究领域做出的贡献大小和相互合作关系,其中节点大小代表单个作者发文量的多少,节点之间连线的不同色彩和粗细代表合作的不同年份和关系紧密程度。在对研究文献进行作者共现分析时,将Node Type选择为Author,阈值设置为T50,其余选择默认(图2)。在外文文献中,专注于此研究领域的高产作者比较多,发文数量最多的是Angappa Gunasekarandunhao,从2016—2020年累计发文7篇;紧随其后,Patrick Mikalef、John Krogstie、Samuel Fosso Wamaba、Rameshwar Dubey以及Kim Hua Tan均累计发文5篇;Benjamin T Hazen、Shahriar Akter、Haili Zhang、He Li 以及Maryan Ghasemagha均发文4篇。在作者合作强度上,图中有202个节点(N=202),节点间有141条连线(E=141),Density=0.006 9,表明作者之间的合作关系比较密切,其中Samuel Fosso Wamaba、Angappa Gunasekarandunhao、Shahriar Akter等十几人已经形成一个庞大的科研合作圈,John Krogstie、Patrick Mikalef、Kieran Conboy等5人也在此领域形成了紧密的科研合作关系,另外Muhanmmad Usman Ahmed、Asad Shafiq、Farzad Mahmoodi的研究团队和Jiabao Lin、Lei Li、Xin Luo的研究团队也分别形成小型合作关系网。
图2 外文文献和中文文献作者共现分析图Fig.2 Analysis diagram of co-occurrence of foreignand Chinese literature by authors
在中文文献中,专注于此研究领域的高产作者也比较多,单个作者累计发文数量相对较多的有,刘力钢从2015到2020年累计发文6篇,王洋从2017到2020年累积发文6篇,刘珊、谢康、吴湘玲等20人分别累计发文5篇。在作者合作强度上,图中有206个节点(N=206),节点间有78条连线(E=78),Density=0.003 7,相比于外文期刊,作者间合作不够紧密,其中合作相对密切的团队有刘力钢、王洋、许宪春等7人,于施洋、杨道玲、王建东等4人,李天柱、马佳、侯锡林等4人,谢康、肖静华、吴瑶3人。由此可见,2014—2020年,外文和中文期刊都存在专注于此领域的高产作者,在合作强度上外文期刊的作者要高于中文期刊作者。
2.2.2 国家(地区)和研究机构分析
在国家(地区)和研究机构合作知识图谱中,节点越大代表国家(地区)和科研机构发文的数量越多,节点之间的连线的不同色彩和粗细代表国家(地区)和科研机构合作的不同年份和关系紧密程度。在对外文文献进行国家(地区)共现分析时,将Node Type选择为Country,阈值设置为T50,其余选择默认(图3)。在外文的研究中,发文量排前5的国家依次为美国(104篇)、中国(88篇)、英国(56篇)、法国(27篇)、意大利(26篇),并且这5个国家的累积发文量占总发文量一半以上,说明这些国家对大数据分析能力在企业应用的相关研究方面取得了一定成果。在国家间合作强度上,图中有62个节点(N=62),节点间有68条连线(E=68),Density=0.036,表明跨国家和跨区域之间的合作比较紧密。
图3 外文文献国家(地区)共现分析图Fig.3 Analysis diagram of co-occurrence of foreign language literature in countries (regions)
在对外文文献和中文文献进行机构共现分析时,将Node Type选择为Institution,阈值设置为T50,其余选择默认(图4)。在外文文献发表机构中,University of Nottingham发文量最多,累计发表8篇;紧随其后,Newcastle University,Norwegian University of Science and Technology,Hong Kong Polytechic University和University of Kent这4个机构发文量也比较多,均累计发表5篇文献。在机构合作强度上,图中有183个节点(N=183),节点间有108条连线(E=108),Density=0.006 5,表明研究机构之间的合作关系比较密切,合作相对紧密的研究团队包括Montpellier Business School,California State University Bakersfield,Audencia Business Schoole在内的近10个研究机构;类似地,Hong Kong Polytechic University,Newcastle University,California State University Fullerton等近10个科研机构也形成了相对紧密的合作网。部分机构之间已经出现了跨国界的国际合作关系。
图4 外文文献和中文文献机构共现分析图Fig.4 Analysis diagram of co-occurrence of foreign and Chinese literature institutions
同外文期刊相似,专注于此研究领域的科研机构较多。首先,发文最多的机构是中南财经政法大学经济学院,2014—2020年累积发文8篇;其次,清华大学经济管理学院和西北大学经济管理学院各自累积发文7篇;再次,西北大学经济管理学院、中国人民大学商学院、辽宁大学商学院、中山大学管理学院、云南大学工商管理与旅游管理学院以及暨南大学管理学院发文量也较多,各自累积发文6篇;最后,清华大学中国经济社会数据研究中心和南京大学商学院各自累积发文5篇。在机构合作强度上,图中有177个节点(N=177),节点间有47条连线(E=47),Density=0.003,表明研究机构之间的合作关系不够密切,大部分是孤立进行研究。其中,合作关系相对紧密的科研团队有,清华大学经济管理学院、清华大学中国经济社会数据研究中心、上海外国语大学国际工商管理学院等4个研究机构和中国人民大学财政金融学院、中国人民大学国家发展与战略研究院、中国财政金融政策研究中心等6个研究机构。虽然国内研究机构尚未形成大型的合作关系网,但是已经出现跨地域、跨城市的机构合作。总体来说,外文和中文期刊中专注于此领域的研究机构较多,在合作强度上,外文期刊的研究机构合作紧密,而中文期刊研究机构合作初现,大部分机构仍是独自进行研究。
本文对外文文献进行了文献共被引分析,将Node Type选择为Reference,阈值设置采用T50,其余选择默认。图中节点越大,代表文献被引用的次数越多,颜色越暖代表被引用的时间距现在越近。如图5所示,被引用率最高的论文是由Samuel Fosso Wamba等7人2017年发表于 《Journal of Business Research》上的论文《Big data analytics and firm performance:Effects of dynamic capabilities》。这篇论文通过实证分析验证了大数据分析能力是如何通过动态能力对企业绩效的产生积极影响的,成为大数据分析能力对企业绩效影响相关领域实证研究的奠基石[4]。同样被引用频次较高的一篇文章也是由SF Wamba团队发表的,是2015年发表于《International journal of production economics》期刊的《How “big data”can make big impact:Findings from a systematic review and a longitudinal case study》。作者认为尽管大数据具有很高的运营和战略影响,但缺乏评估大数据潜力的实证研究,因而在这篇文献中,作者在系统回顾和案例研究的基础上,提出了一个实证上的解释框架,分析了大数据的定义和应用[5]。具有较高影响力的文献还包括W Gang等4人2016年发表于《International Journal of Production Economics》的文章《Big data analytics in logistics and supply chain management:Certain investigations for research and applications》。这篇文章通过对大数据商业分析相关理论和应用的梳理,重点讨论了大数据分析在物流和供应链管理中起到的推动作用,为其应用提供了一副有效的路线图[6]。另外一篇具有较高影响力的文章也是由Shahrior Akter研究团队发表的,是2016年发表于《International Journal of Production Economics》的《How to improve firm performance using big data analytics capability and business strategy alignment?》。这篇文章从理论和实证角度共同验证了大数据分析能力、商业战略一致性是如何提高企业绩效的,成为大数据分析能力推动企业绩效提升相关研究的又一有利证据[7]。除此之外,由Anir Gandomi和Murtaza Haider 2015年发表于《International Journal of Information Management》的《Beyond the hype:Big data concepts,methods,and analytics》引用频率也较高。这篇论文对大数据的概念、方法及分析进行了系统地梳理,为如何有效地使用大数据分析提供了理论基础[8]。
图5 外文文献期刊共被引分析图Fig.5 Analysis diagram of co-citation of foreign literature and periodicals
在对影响力较高的中文文献进行分析时,主要通过对引用量较高的文献进行整理而进行。在中文文献中对被引用频次最高的5篇文献进行了统计(表2),其中被引用频率最高的文献是由冯芷艳等在2013年发表于《管理科学学报》的文章《大数据背景下商务管理研究若干前言问题》,文中主要提出,未来大数据对社会化的价值创造、网络化的企业运作、实时化的市场洞察等研究领域将会带来重大的研究挑战,这为后续学者基于大数据进行研究提供了分析方向[9]。另外一篇被引用频率较高的文章,是李文莲和贾健明于2013年在《中国工业经济》发表的《基于“大数据”的商业模式创新》,此文章提出了“大数据”对商业模式创新驱动的三维视角,为企业在“大数据”时代探寻商业模式创新切入点提供了一个系统化的分析框架[10]。同样被引用频率较高的一篇文章是由吴金红等于2013年在《情报杂志》发表的《大数据:企业竞争情报的机遇、挑战及对策研究》,这篇文章综合阐述了大数据的内涵和特征,提出了大数据有利于提高竞争情报的真实性、精准性以及实时性,然而也可能为竞争情报系统、情报安全制度等带来问题的双面性[11]。值得研究的另一篇论文是由徐艳在2016年于《江西社会科学》发表的论文《大数据时代企业人力资源绩效管理创新》,这篇论文提出了基于互联网修正后的360度考评方法,为大数据时代企业人力资源绩效管理创新带来了新的思路[12]。除此之外,值得研究的一篇论文是由蔚赵春和凌鸿于2013年在《上海金融》中发表的《商业银行大数据应用的理论、实践与影响》,这篇文章对商业银行大数据应用研究进行了综述,从挑战和机遇方面分析了大数据应用对商业银行带来的影响[13]。
表2 中文文献高被引文献Table 2 Literature with high citation frequency in Chinese literature
关键词是论文主要内容的提炼,能够代表性地体现出作者的核心学术思想和观点。图中节点越大,代表关键词共现的频次越多,它们在知识图谱之间的距离越接近,代表文献所研究的主题越接近。本文将Node Type选择为Keyword,阈值设置为T50,其余选择默认,得到关键词共现分析图(图6)。为了更详细地分析此研究领域的核心词汇,对核心关键词、词频及中心性按年份进行了排序。
图6 外文文献和中文文献关键词共现分析图Fig.6 Analysis diagram of co-occurrence of keywords in foreign and Chinese literature
如图6和表3所示,在国外文献的研究中,2014年出现的高频关键词有“big data analytics”“big data”“firm performance”和“challenge”,学者们开始关注大数据分析能力对企业绩效的提升以及对企业未来发展的挑战;除此之外,“framework”也成为高频关键词,说明研究之初多数学者关注大数据分析能力的理论框架。在2015年,“predictive analytics”成为热点,学者们开始提出大数据分析能力的核心作用是预测,同年的热点词汇还有 “information technology”“data science”“dynamic capability”“adoption”,学者们除了关注大数据分析能力带来的科技风暴之外,开始强调其作为动态能力对企业发展带来的作用。在2016年,热点词汇增加了“impact”“resource based view”,其中,资源基础理论是学者们公认的研究大数据分析能力的理论基础。在2017年,热点问题增加了“model”“supply chain management”“strategy”“innovation”“technology”“design”“industry 4.0”,其中,“模型”作为高频关键词,意味着学者们开始注重大数据分析能力提升企业绩效的实证研究,试图建立模型来分析其影响路径;其他几个高频词汇说明,学者们关注大数据分析能力对企业供应链的发展、对企业战略决策的制定、对企业创新活动、企业技术提升、企业设计环节等流程产生的作用。在2018年,新增的研究热点有“internet”“intelligence”“competitive advantage”,与相关研究关联最紧密的行业是互联网,学者们开始注重二者之间的关联,另一个研究重点是大数据分析能力能为企业带来哪些竞争优势。在2019年和2020年,“service”“block-chain”“opportunity”成为相对出现频率较高的关键词,一方面,学者们关注大数据对企业服务质量的提升,以及为企业发展带来的机遇;另一方面,更值得关注的研究方向是“Block-chain区块链”,从本质上讲,它是一个共享数据库,存储于其中的数据或信息具有不可伪造、全程留痕、可以追溯、公开透明、集体维护等特征,学者们开始注重数据质量,而不是传统意义的数据数量和规模,“Block-chain区块链”可能成为外文期刊新的研究方向。
表3 外文文献按年份排列高频热点词Table 3 Ranking of high frequency hot words in foreign literature by year
如图6和表4所示,在国内的文献中,2014年,“大数据”“互联网金融”“大数据时代”“云计算”“大数据技术”和“商业模式创新”成为研究热点,研究之初,国内的学者更加注重大数据带来的科技风暴和商业模式的转变,与相关研究紧密关联的行业是互联网金融。在2015年,“互联网+”和“物联网”成为新的研究热点,大数据推动了传统行业向“互联网+传统行业”新经济形态的发展。在2016年,“大数据分析能力”和“制造业”成为新增的热点词汇,学者们开始关注如何将数据资源转化成大数据分析能力,并且开始关注相关研究与制造业的关联。在2017年,研究热点词汇增加了“数字经济”“人工智能”“创新”“一带一路”,相关领域的研究开始与2013年提出的“一带一路”研究热点相融合,学者们开始关注大数据推动区域合作平台建设的相关内容。随后,2018—2020年,“参考质量效应”“高质量发展”“区块链”“数据治理”成为新增的研究热点,同外文研究相似,研究重点从数据数量和规模效应,转化到数据质量效应;除此之外,2019年的热点“工业大数据”和2020年的热点“数据要素”说明,研究学者关注由大数据带来的生产革命和政府对数据进行开发、利用、共享、管控等的相关内容。总体而言,在外文和中文期刊中,相关研究热点有企业绩效、预测、互联网、商业模式创新等,未来区块链、数据治理等将掀开新一轮研究风暴。
表4 中文文献按年份排列高频热点词Table 4 Ranking of high frequency hot words in foreign literature by year
对中/外文文献进行关键词聚类分析,聚类方法选择LSI,阙值选择T20/T50,其余选择默认,得到图7。
从图7可以看出,相关内容在外文和中文期刊中的研究方向有很多相似之处,都关注于大数据分析能力对商业模式创新的影响,但也有各自的研究重点,外文期刊中更关注大数据分析能力对企业具体生产流程的提升作用,中文期刊更关注大数据分析能力带来的技术革命。
图7 外文文献和中文文献关键词聚类分析图Fig.7 Clustering analysis diagram of keywords in foreign and Chinese literature
在外文和中文期刊中,大数据分析能力应用于企业的相关研究,整体上呈现上升趋势,已经掀开了研究热潮。外文和中文期刊都存在专注于此领域的高产作者和高产研究机构,在合作强度上外文期刊均要高于中文期刊。在外文期刊中,已出现了跨国界的国际合作网络,在中文期刊中,也出现了跨城市、跨区域的合作网络。此研究领域发文较多的国家有美国、中国、英国、法国、意大利等。目前,与此领域研究相关的热点问题有企业绩效、预测、互联网、商业模式创新等,在下个阶段,区块链、数据治理等将掀开新一轮研究风暴。