滕晓燕 吴忠
摘 要:利用文献分析法和VOSviewer可视化软件梳理大数据技术在数字化转型中的应用及研究现状。结果显示,大数据技术在数字化转型中的应用处于发展阶段,大规模应用还面临不少关键技术难题。数字化转型是人工智能、大数据、云计算等新一代信息技术引发的系统性变革,大数据是数字化转型的核心和数字经济的关键生产要素。大数据技术的战略意义并非在于获取大量的数据信息,而在于对这些具有意义的数据进行专业化处理及场景应用。
关键词:数字化转型;大數据;技术应用;VOSviewer可视化分析
中图分类号:F124 文献标志码:A 文章编号:1673-291X(2024)05-0055-03
1980年,阿尔文·托夫勒在其著作《第三次浪潮》中首次引入了“大数据”的概念[1]。2010年,美国麦肯锡公司发布了首个涉及大数据的专题报告。随后,该公司在2011年的报告中正式定义了“大数据”的概念。为了提高大数据和分析的认知,麦肯锡全球研究院于2011年5月发表了一篇名为“大数据:创新,竞争和生产力的下一个前沿”的开创性论文,从而引起了人们的关注。2012年,维克托·迈尔—舍恩伯格出版了他的著作《大数据时代》,他被公认为大数据商业应用的先驱。大数据为人类提供了一种全新的方式来认识和改造世界,因此被视为当代社会人类的新世界观和方法论[2]。刘维贵从四个角度论证了2013年是“大数据元年”[3],之后这一概念迅速成为热词。根据谷歌公司的趋势分析(它提高了人们对关键词的搜索兴趣),大数据和分析热潮在2016年6月达到了顶峰。本研究分析了大数据技术的原理及特点,梳理大数据技术在数字化转型中的应用及研究现状,探讨该技术在数字化转型进程中的发展前景。
一、大数据的技术原理和技术特点
(一)大数据的技术原理
目前关于大数据(Big data)的定义有多种说法。国际数据中心(IDC)将大数据定义为更经济地从高频率的、大容量的、不同结构和类型的数据中获取价值而设计的新一代架构和技术[4]。根据Gartner的观点,大数据是指信息资产的一个类别,它具有海量、高增长率和多样化的特点,并且需要新的处理模式才能发挥其更强的决策力、洞察发现力和流程优化能力。而在2011年,麦肯锡全球研究所对大数据进行了定义,他们认为大数据是指一个数据集合,其规模远远超出了传统数据库软件工具的能力范围,主要表现在获取、存储、管理和分析方面。大数据具有四个主要特征,包括海量的数据规模、快速的数据流转、多样的数据类型和价值密度低[5]。后两个定义得到的认可最多。
就目前对“大数据”概念的使用来看,在此我们限定研究作为技术工具、研究方法的大数据,具体到本文,大数据是数字化转型的利器。数字化转型是信息技术引发的系统性变革,需要一套涵盖“数据、技术、流程和组织”的系统性解决方案。组织可以利用设备设施、信息技术软硬件、网络和平台等资源,充分利用云计算、大数据、物联网、人工智能和区块链等新一代信息技术的先进功能,有序推进技术的整合、融合和创新[6]。
(二)大数据的技术特点
2013年,IBM公司总结了大数据的技术特点为“5V”,包括数据量大(Volume)、数据速度快(Velocity)、数据类型多样(Variety)、数据价值高(Value)和数据准确性(Veracity)。国际数据公司(IDC)用“4V+1C”的特征来定义大数据:庞大数据集合(Volume)、极速数据更新(Velocity)、多样数据种类(Variety)、难以估量的数据价值(Value)和精密分析处理(Complexity)[4]。以上都包含大数据的4个“V”:(1)大量。随着信息技术的高速发展,数据开始爆发性增长。(2)多样。广泛的数据来源,决定了大数据形式的多样性。(3)高速。数据持续涌现,速度更快者占据优势。(4)价值。只要合理运用并确切、准确地分析数据,将带来丰厚的价值回报。这也是大数据的核心特征[3]。
(三)大数据技术的发展历程
1997年10月,Michael Cox和David Ellsworth在美国计算机学会的数字图书馆中发表了一篇名为《为外存模型可视化而应用控制程序请求页面调度》的文章。这是该学会数字图书馆中首次使用“大数据”一词的文章。1999年8月,Steve Bryson、David Kenwright、Michael Cox、David Ellsworth和Robert Hemenway发表了一篇名为《千兆字节数据集的实时性可视化探索》的文章,该文章是在《美国计算机协会通讯》上使用“大数据”一词的第一篇文章。2001年,美国Gartner首次开发了大数据模型。2005年Hadoop项目诞生。2008年,著名的《自然》杂志推出了一期专门介绍“Big Data”概念的刊物。随后,从2009年开始,“大数据”逐渐成为互联网信息技术行业中的热门词汇。2011年5月,麦肯锡的全球研究院发布了一份题为《大数据:创新、竞争和生产力的下一个新领域》的报告,这是专业机构首次详细介绍和展望大数据。为了推动我国大数据技术的研究和发展,2012年中国计算机学会启动了CCF大数据专家委员会,并发布了《2013年中国大数据技术与产业发展白皮书》。此后,国内外学术界和工业界都积极行动起来,广泛开展大数据技术的研究和开发[7]。总之,论文奠定大数据技术发展基石,业务催生大数据技术不断突破,效率倒逼大数据技术迭代更新。
二、大数据在数字化转型中的应用
(一)大数据在国内数字化转型中的应用分析
2013年以来,大数据成为各行各业的新的研究热点之一。在中国知网CNKI数据库,以“大数据+数字化转型”为主题,检索日期为2023年3月,时间限定为2012年1月至2022年3月,共检索到相关研究文献3 910篇,其中学术期刊3 161篇,占比80.84%;学位论文272篇,占比6.96%;其他会议、报刊等478篇,占比12.20%。从主题看,以数字化转型、大数据为主题的文章为1 512篇,占比38.67%;数字经济、大数据时代、数字政府的文章为361篇,占比9.23%。其他文章为2 037篇,占比52.1%。从发表年份来看,2012年,学术界相关研究文献仅有两篇,此后的研究是爆发式增长,尤其是从数字化转型的元年2017年开始。2017—2022年分别为154篇、284篇、494篇、994篇、1 620篇、198篇,相关研究已经颇具规模。
(二)大数据在国外数字化转型中的应用分析
选定的同行评审数据库是web of science核心合集,以“big data”为主题进行搜索。检索日期:2022年3月,时间限定为1975年1月—2022年3月,检索到69 074篇。以“big data”组合“digital transformation”,检索到文献509篇。从发表时间来看,2015年检索到1篇相关研究文献,2016—2022年,相关研究文献分别是10篇、23篇、42篇、86篇、121篇、189篇、37篇。在国外,大数据的研究前五位的国家分别是德国(69篇),意大利(65篇),美国(61篇),英国(54篇),俄罗斯(34篇),中国(32篇)在国际排名第八。
三、大数据技术在数字化转型领域的热点
VOSviewer是一款基于JAVA的免费软件,主要面向文献数据,适应于一模无向网络的分析,侧重科学知识的可视化。通过Network visualization的主题共现发现研究热点的结构分布。Density visualization可用来快速观察重要领域以及某一领域知识及研究密度情况。据此我们总结出目前大数据在数字化转型中应用的主要研究方向,具体如下:聚类#1:Wessel L.等人(2021)研究了数字化转型和基于信息技术(it)的组织转型的两个区别;Zeki-Suac M.等人(2021)将大数据平台和机器学习纳入智能系统,以管理公共部门的能源效率;Manfreda A.等人(2021)的研究侧重于技术采用、对效益的认知、安全性、与移动性相关的效率和担忧等。聚类#2:Llopis-Albert C.等人(2021)分析了数字化转型对企业绩效模型和不同参与者满意度的影响;Abdel-Basset M. 等人(2021)以一个实证的案例分析实际COVID-19患者,并显示了破坏性技术对COVID-19分析框架的重要性。聚类#3:Liu H.等人(2019)确定了数字化转型的三个阶段:信息数字化、流程数字化和业务数字化;Osterrieder P.等人(2020)找到智能工厂研究模型,包括八个不同主题视角;Aheleroff S等人(2020)认为物联网(IoT)在降低成本、提高效率、质量和实现面向数据的预测性维护服务方面的潜力等。聚类#4:Szalavetz A.(2018)研究发现先进制造技术AMT显著提高了生产能力的所有组成部分;数字孪生等。聚类#5:Rijswijk K等人(2021)认为数字技术的设计和创造是成功实现社会—网络—物理系统数字化转型的条件;Manesh M.F.等人(2021)通过使用文献综述法,工业4.0中知识管理的知识结构和发展趋势;Ghobakhloo M.(2019)发现生产效率和商业模式创新等经济可持续性功能往往是工业4.0更直接的结果。聚类#6:Matarazzo M.等人(2021)发现数字工具有助于其商业模式的创新;Li H.等人(2021)研究发现数字技术促进了外部和内部关系以及数字技术业务战略协调;Tronvoll B.等人(2020)发现制造商越来越多地寻求数字化来推动服务增长,Vaio A.D.(2021)等人认为数字创新可以通过优化新知识来促进新的商业模式;Ciampi F.等人(2020)研究发现数字化转型工具在长期内有助于价值创造过程等。
四、讨论(未来研究方向)
使用VOSviewer1.6.16版本对以上在WOS里采集到的数据做出关键词标签视图。Overlay visualization可以分析领域内研究趋势的演变。2019年以前:云计算、数字创新、Dwivedi Y.K.等人(2020)认为,COVID-19流行病迫使许多组织进行重大变革,并使用技术来维持运营等。2019年1—5月:数字化制造、隐私、信息数字化等。2019年6—12月:机器学习、工业物联网、大数据科学等。2020年1—5月:Sb A.等人(2018)确定了数字化转型如何影响循环经济中优化采购流程的意图;Urbinati A.等人(2020)认为可以采用变革管理的理论视角来确定企业在开放式创新过程中实施数字技术所采取的组织和过程层面的管理行动,从而弥合这一差距等。2020年5—12月:企业绩效、大数据分析、机器人科学(或技术)等。2021年以后:Frank A.G.,等人(2019)从商业模式创新(BMI)的角度将服务化和工业4.0概念联系起来;Frank A.G.等人(2019)工业4.0技术(前端技术和基础技术)在制造企业中的采用模式等。
五、结束语
本文首先介绍了大数据技术的背景、定义,技术特点和发展历程。检索了CNKI和WOS的数据库里”大数据+数字化转型”主题的相关文献并梳理,通过可视化软件VOSviewer1.6.16版本梳理出目前的主要研究领域,最后本文对”大数据+数字化转型”主题的未来研究方向和科学问题进行了探讨与总结。
参考文献:
[1] 阿尔文·托夫勒.黄明坚,译.第三次浪潮 未来三部曲[M].北京:中信出版社,2018.
[2] 维克托·迈尔-舍恩伯格,肯尼思·库克耶.盛杨燕,周涛,译.大数据时代[M].杭州:浙江人民出版社,2013.
[3] 刘维贵.“大数据”研究综述[J].办公自动化,2014(1):27-30.
[4] Gantz J,Reinsel D. Extracting value from chaos[J].IDC iView, 2011: 1-12.
[5] Manyika J,Chui M,Brown B,et al.Big data:the next frontier for innovation,competition,and productivity[R].McKinsey Global Institute,2011.
[6] 中關村信息技术和实体经济融合发展联盟.数字化转型 参考架构 T/AIITRE 10001-2020[M].北京:清华大学出版社,2020.
[7] 陈颖.大数据发展历程综述[J].当代经济,2015(8):13-15.
[责任编辑 文 欣]