国内外商务智能及大数据分析研究动态和发展趋势分析

2021-01-06 01:58萧文龙王镇豪徐瑀婧
科技与经济 2020年6期
关键词:商业智能数据仓库热点

萧文龙 王镇豪 陈 豪,2 徐瑀婧

(1 浙江工业大学管理学院,杭州 310023;2 浙江农林大学暨阳学院,浙江 诸暨 311800)

0 引 言

近年来,随着信息技术的快速发展,商业智能(Business Intelligence,BI)已经成为企业核心竞争力的重要组成部分之一。商业智能也称商务智能,是指能够帮助企业分析关键业务数据以更好地了解自身业务和市场,并及时做出业务决策的技术、系统、实践、方法和应用程序[1]。商业智能可以将众多的数据进行整合,并从中提取有效信息,为企业提供决策支持,因此引起了学术界和企业界的广泛关注。从2012年起大量学术期刊都针对商业智能领域出版了特刊,如MIS Quarterly在2012年出版了主题为Business Intelligence Research的特刊、Information Technology & Tourism 在2016年出版了主题为Big Data & Business Intelligence in the Travel & Tourism Domain的特刊、Expert Systems with Applications在2018年出版了主题为Big Data Analytics for Business Intelligence的特刊。同时,众多企业为了应对数据量爆发性增长带来的机遇和挑战,更快地做出更明智的决策,加大了在信息技术方面的投入,特别是对商业智能技术的投入。最近一项由国际信息系统学会发起的针对769家企业的调研显示,商业智能技术是过去10年企业在信息技术投资中投入最多的领域,而且这一趋势在未来仍将保持[2]。

国内外学者已在商业智能领域进行了深入和广泛的研究,现有文献主要关注商业智能满足业务和用户需求的特点和其在高校、出版社、财务分析等方面的实际应用[3-6],缺乏对我国商业智能相关研究的梳理和系统性总结以及国内外研究发展的对比分析。本文运用Cite Space软件来呈现和分析近20年国内外商业智能相关研究,探寻国内外学者在该领域的研究热点、研究前沿以及发展趋势,并将二者进行对比分析,找出我国在该领域研究的优势与不足,为我国在该领域的后续相关研究提供参考。同时,对商业智能研究热点的分析可以帮助其他相关领域的学者快速了解商业智能研究,明确商业智能领域的边界,使其有效地探索自己感兴趣的研究课题。

1 数据来源和研究方法

本文关注商业智能研究热点和国内外研究差异,选取国内外商业智能相关文献进行总体和对比分析。国外文献数据来源为Web of Science核心数据库,检索方法:设置主题词为“business intelligent”或“business intelligence”,选择文献类型为“article(期刊论文)”,排除作者为匿名(Anonymous),设置时间范围为2000—2019年,检索得到相关英文文献1 117篇。

中文文献数据来源为CNKI。常用的中文数据库通常包括中国社会科学引文索引(CSSCI)和CNKI。由于CSSCI检索获取的文献数据量相对较少,作为可视化数据来源数量不足。因此,为保证样本的权威性,来源类别选取EI来源期刊、核心期刊、CSSCI、中国科学引文数据库(CSCD)。检索方法:将“商业智能”或“商务智能”作为主题检索词,来源类别选取上述权威数据库,检索时间范围同样为2000—2019年。下载检索到的文献经过人工筛选,删除会议通知、新闻等非研究性文献后,最终得到中文文献320篇。

Cite Space是陈超美教授基于Java开发的可视化文献计量分析软件,常被用来探索学科知识领域的发展及其研究热点[7]。Cite Space可以通过绘制知识图谱,从而较为直观地展现科学知识领域的信息全景。因此,本文使用可视化软件Cite Space作为数据处理工具,对近20年国内外商业智能相关文献进行了基本分析和关键词共现分析。

2 结果分析

2.1 发文年限分布分析

通过观测商业智能发文年限分布情况,可以了解该领域在某一特定时间内学者研究兴趣的变化。通过对文献数据年份进行统计,并记录在Excel表中,用以绘制国内外商业智能研究文献分布图(见图1)。根据图1结果来看,国外文献和国内文献在2005年有一个明显的增长,这是由于在2005年微软开发了Microsoft SQL Server2005,为商业智能的发展提供了开发平台,使得国内外的研究聚焦于此。而后,国外商业智能相关文献处于稳步上升的趋势,在2012年后商业智能相关文献数量大幅度增长,一方面可能是由于大数据进入快速发展的阶段,在企业信息化建设中扮演着重要的角色,并在信息技术应用中兴起了一股云计算的浪潮,也推动了商业智能领域的发展。另一方面,归因于2012年管理信息系统季刊(MIS Quarterly)中的商业智能特刊以及彼时的从业者兴趣。然而,从国内文献来看,我国文献在2005年后,出现下降的态势,可能是由于缺乏完善的理论以及商业智能建设不足等问题,但在2015年之后,随着人工智能技术的发展和政策推动,我国的商业智能相关研究总体呈现上升趋势。

图1 文献年份分布图

2.2 研究热点分析

2.2.1 国外研究热点

关键字共现分析是识别当前研究主题和未来方向的主要方法。节点类型(Node Types)选择关键词(Keyword),选择生成最小树MST剪枝策略,其他设置不变,得到外文文献的高频关键词(如表1所示)。为了展示更好的结果,做了两个修改。首先,清除同义词,把具有相同含义的关键词合并,如“data warehouse”“data warehousing”。第二,排除“business intelligence”。因为“business intelligence”是检索的关键词,所以数量会很大,可能会使中心度偏向商业智能,对结果具有一定影响。结果显示,除了商业智能外,最常出现的关键词是“big data”,其次是“management”“system”。这3个关键词描述了商业智能的概念,商业智能作为一种系统或者应用程序,在大数据的支持下可以获取更全面的信息,提供更合适的管理决策方案。

表1 外文高频关键词

最终得到的外文文献关键词共现图如图2所示,系统、管理、绩效、模型、技术等关键词处于中心位置。例如,在系统方面,Chung等开发了集成可视化的商业智能系统,用于在网页上进行知识发现,并可以减轻网页上的信息过载[8]。在管理和绩效方面,Goodhue等研究了商务智能技术和用户任务适配度对个人绩效的影响[9]。技术方面的研究主要关注,数据挖掘和数据仓库技术,Watson等研究了如何利用数据仓库实现组织价值的问题。[10]

图2 外文文献关键词共现图

但是,关键词共现图并不能显示知识的发展与时间相关。关键词突现图可以在一定程度上克服这个问题。它表示在特定时间段内任何关键字频繁出现的现象,它不仅可以显示研究热点随时间的演变,还可以指示近年来的研究趋势,并可能暗示未来的发展趋势。通过展示关键词突现图,可以帮助我们明确商业智能领域的研究前沿。得到的外文文献关键词突现图如图3所示。我们可以看到,2002—2012年阶段,突现的关键词包括数据挖掘、数据仓库、知识管理、框架等,研究热点主要围绕技术方面;2013—2016年阶段,突现的关键词主要包括系统、接受、优化等,研究热点主要围绕系统优化层面;最后,2017—2018年阶段,突现的关键词主要包括社交媒体、商业分析,研究热点主要围绕商业层面。企业通过挖掘社交媒体的非结构化数据,可以改善产品、功能、企业形象,并改善组织绩效,提升企业竞争力。Han等认为可以通过商业分析从商业新闻中挖掘信息有助于感知市场趋势,了解竞争对手的策略,并做出有价值的投资决策[11]。

图3 外文文献关键词突现图

2.2.2 国内研究热点

对于国内研究热点,为了展示更好的结果,我们也做了两个修改。第一,把具有相同含义的关键词合并,如商业智能和商务智能等。第二,排除商业智能。除了商业智能外,最常出现的关键词是数据挖掘、数据仓库,联机分析处理与企业管理,这是国内商业智能领域最重要和基础的研究。同时也说明了我国的商业智能研究注重技术,以及在企业中的运用。表2中列出了中文文献的高频关键词。

表2 中文高频关键词

得到的中文文献关键词共现图如图4所示,数据挖掘、数据仓库、决策支持、企业管理等关键词处于中心位置。现有中文研究认为商业智能是数据仓库、数据挖掘以及联机分析处理等几种技术的有效组合[12]。ERP与商业智能技术相结合以规范数据流程,促进企业业务信息再利用[13]。例如,韩向东认为需要构建一种基于商业智能的管理会计信息系统,以推进会计信息化体系建设[14]。

图4 中文文献关键词共现图

中文文献关键词突现图如图5所示。2010年之前,研究热点主要围绕数据仓库;2010—2012年,研究热点主要围绕云计算。一方面,云计算相关研究除了关注应用外,也关注大数据环境的数据安全问题[15-17]。2012年以后最新的研究前沿是人工智能[18]。它将是新一轮科技革命和产业变革的重要驱动力量。

图5 中文文献关键词突现图

2.2.3 国内外研究热点对比

通过对外文文献和中文文献关键词的分析,我们发现国外商业智能研究热点更加侧重于管理和决策支持系统(应用性),国内商业智能研究热点更加侧重于技术(技术化)。另外,从关键词突现图来看,国内外研究在该领域的研究主题都有所转移:国外研究前沿从技术和商业智能系统转为商业分析,特别侧重于社交媒体数据的分析研究;国内研究前沿由商业智能技术转向云计算和人工智能技术,侧重探索商业智能在各个领域的应用。

在早期阶段,商业智能研究尚未成熟,国内外研究人员都专注数据挖掘、数据仓库等技术研究,商业智能技术主要用于处理结构化数据,技术基础是统计学习方法。到本世纪初,由于互联网的兴起,基于网页的数据挖掘技术得以发展,研究人员通过网页挖掘信息以分析客户行为。在商业智能技术逐渐成熟后,国外研究逐渐转向利用商业智能系统分析商业信息以支持和改进商业活动的管理决策。另外,由于商业智能系统成本高昂和资源密集且复杂的特点,国外研究人员也关注管理和经营上的问题,例如研究商业智能的成功因素[19]。而国内商业智能领域还处于发展和探索阶段,虽然在技术应用方面已逐渐成熟,但是对相应管理问题缺乏重视。

目前国外商业智能的研究热点为商业分析,特别是社交媒体分析,强调社交媒体的影响。通过社交网络,用户之间可以建立联系并分享自己的信息和观点。通过这些联系和信息共享,社交网络有助于调查员工的背景、广告和营销、旅游业发展。国内商业智能的研究热点为人工智能及其应用。随着信息技术的不断发展,我国已将发展人工智能作为国家战略,并出台了很多扶持高新技术的政策,相关基础和应用研究也层出不穷,例如,医学机器人。此外,我国商业智能领域与国际上的交流也变得更加密切,共同推动商业智能领域的发展。

3 总 结

本文利用CiteSpace软件,选取2000—2019年间发表在Web of Science和中国知网(CNKI)的国内外商业智能和大数据分析相关文献,从文献结构特征、研究热点与研究趋势等方面进行可视化分析,以期了解现阶段我国在该领域研究的优势与不足,为后续相关研究提供参考和借鉴,以更好地推动商业智能和大数据分析领域的发展。研究结果显示,商业智能研究领域越来越成熟,国际上发文量呈稳步上升的趋势,我国相关研究虽起步较晚,仍处在探索和发展阶段,但是发文量呈逐年上升趋势。从关键词共现来看,国际上研究热点包括系统、管理、绩效、模型、技术和知识;国内研究热点包括数据挖掘、数据仓库、决策支持、企业管理;国外研究与管理和决策有关,而国内研究更侧重于技术和应用。从关键词突现图来看,国外研究前沿由技术转向商业分析;国内研究前沿由数据挖掘技术转向人工智能。

综上所述,国内学者与机构之间需要互相交流,促进科研进展,避免理论滞后于实践;其次,国内学者与机构也要与国外加强合作,拓宽研究视野,创新研究理念;最后,我国商业智能领域在大力发展人工智能的同时,也需要将方法和技术与企业相结合,运用商业分析手段,提升企业绩效。

猜你喜欢
商业智能数据仓库热点
热点
基于数据仓库的数据倾斜解决方案研究
热点
结合热点做演讲
什么是商业智能?它的定义和解决方案
关于实时商业智能的文献综述
探析电力系统调度中数据仓库技术的应用
数据仓库系统设计与实现
商业智能在当下出版社中的运用
数据复用在存储数据仓库中的运用