李桥兴 胡雨晴
1 (贵州大学管理学院, 贵阳 550025)
2 (贵州大学喀斯特地区发展战略研究中心, 贵阳 550025)
与IT 领域紧密关联的大数据将带来一场新的重大技术变革[1]。 不论是信息科技领域, 还是国家治理领域, 大数据研究与应用的相关产业发展已成为公众关注的焦点[2,3], 也因此再一次掀起新的产业革命浪潮。
产业演化能够清晰把握某单一产业的动态发展规律。 产业演化研究多集中于演化过程和演化机制两方面。 演化过程研究主要依据产业生命周期理论, 研究产业动态发展阶段及其特征[4], 其定量分析一般采用G-K 模型[5]、 A-U 模型[6]、 NW 模型[7]、 基于主体的仿真模型[8]等多种产业动态模型及计量经济模型[9], 如孙晓华等基于ABM框架动态模拟电动汽车业的演化过程[10]。 在演化机制研究方面, 创新通常被认为是产业演化的内在动力, 如Schumpeter 最早阐述创新在产业演变中的核心作用[11]。 除此之外, 需求异质性、 政策、学习等因素也能对产业演化产生影响[12-14]。 自组织理论的哈肯模型常用于产业演化机制研究, 从系统内部视角分析演化过程。 如朱永达等、 郭莉等基于哈肯模型研究区域产业系统演化, 并识别出相应的序参量[15,16]。 鉴于大数据产业研究还处在不断完善其基础理论阶段, 目前研究多集中于发展特征和产业结构等方向, 并主要采用定性分析方法。 如朝乐门等指出我国大数据产业正处于起步阶段[17]; Shari S C 等提出大数据产业系统包含数据、 应用程序、 技术和开放API 平台4 个方面[18], 以及部分学者探讨了大数据产业的服务模式[19]等, 但还未有学者涉及大数据产业系统的演化机制研究。 因此, 定量分析我国大数据产业系统的演化机制, 对预判和提升我国大数据产业发展具有重要的实践意义。 本文基于自组织理论的哈肯模型构建我国大数据产业系统的演化方程,并以已上市的17 家大数据相关企业为样本, 选取2017~2018 年的数据进行实证研究。 通过深入分析大数据产业系统的演化机制, 以期为探究我国大数据产业系统的发展规律提供理论参考。
大数据产业作为一个新兴产业, 其大多数企业是基于大数据思维模式并通过传统技术的升级改造而完成跃升, 表现为系统内各种因素的竞争与协同作用驱动该产业的演化过程。 大数据产业系统是一个复杂的动态演化系统, 其内部涉及多个子部门且各发展阶段和水平有所差异, 总体表现为非均匀、 不单一、 非平衡态的趋势, 即远离平衡态。 其演化虽然受到外部多方面因素的共同影响, 但其演化的主要方向在很大程度上还是取决于系统内部。 自组织理论从内部视角来探讨系统演化机制, 其思路为: 在外部控制参量达到某个阈值时, 伴随着随机涨落因素, 一个开放的、非线性的、 远离平衡态的系统可以突变形成更有序、 更高级的新结构[20]。 基于这一核心思想以及其他相关文献, 本文总结得出系统自组织演化需满足开放性、 远离平衡态和非线性等基本条件,还包括自我适应性、 涌现性、 突变性、 涨落等特征[21-23]。 由于目前尚未有学者采用自组织理论研究分析大数据产业的系统演化, 并且大数据产业系统与其他产业系统一样均从属于更高级的社会经济系统, 因此本文根据系统自组织理论尽可能全面地分析大数据产业系统的自组织演化特征。限于篇幅, 本文将从以下两方面展开探讨:
(1) 开放性与自我适应性。 开放性是大数据产业系统演化的基本特性。 开放性意味着大数据产业系统并非完全封闭, 系统内部和外部能够随时进行交互作用。 系统内部会受到经济、 文化、政治等来自系统外部因素的影响, 并且外部环境可以为系统提供物质、 信息、 人才、 政策等生存要素; 另外, 系统内部通过对来自系统外部的信息、 物质等要素的整合, 可以向外输出适应外部环境的产品、 服务和技术等, 同时这些输出又能够反作用于外部环境, 使得外部环境发生新的变化以及这种新的变化又能够为系统发展创造更有利的外部环境。 这两个方面正是大数据产业系统演化的自我适应性的体现。 如在国家大数据战略等一系列有利于大数据产业发展的政策扶持下,人才、 资金和技术等重要的生产要素正源源不断地输送至大数据产业系统, 并且系统内部也可以对各资源要素进行优化配置, 从而以产品的方式向社会、 政府提供更高级的技术和服务, 促使外部环境对大数据产业系统有了新的要求并输送相应的新资源, 从而促进大数据产业系统的更进一步发展。
(2) 非线性作用与涌现性。 非线性作用是大数据产业系统演化的内在动因, 指在大数据产业系统演化过程中, 系统中各因素之间呈现非线性的相互作用, 即“非加和性”。 系统中各个部分并不是简单相加, 而是通过复杂的竞争和协同作用,推动系统在宏观上的演化。 这种非线性作用能够推动系统在整体上呈现出复杂性和多样性, 促进新功能的涌现, 即涌现性。 如在大数据产业系统中, 研发部门、 生产部门等各子部门间存在着非线性的反馈和协同机制, 当系统的状态变量发生变化时, 这种反馈和协同机制又会发生新的非线性的正负变化, 从而导致新功能的涌现。
因此, 大数据产业系统的演化过程是从初始的混沌无序向清晰有序、 从旧式结构向新式结构不断演变的自组织过程, 其系统内部各组成要素对系统产生差异性和不平衡性的影响。 当系统控制变量的变化将系统推过线性失稳临界点时, 差异性和不平衡性随之显露, 从而区分出快变量和慢变量。 快变量的行为受慢变量支配, 慢变量主导系统演化进程并成为系统演化新状态的序参量[20]。基于大数据产业系统自组织演化特征, 采用哈肯模型对各变量间相互作用及结构演化进行分析,可以揭示大数据产业系统的演化机制。
协同学理论的哈肯模型采用数学模型对在一定外部条件下由系统内部各因素的相互作用促使系统演化的过程进行表述[24]。 哈肯模型中将影响系统演化的因素分为快、 慢两种变量, 其中起主导作用的慢变量往往只有1 个或几个, 是整个复杂系统演化的关键因素[25]。 通过计算并消去系统的快变量, 找出系统序参量, 得到其演化方程。
大数据产业系统虽然涉及多个子部门, 但哈肯模型主要涉及两个变量。 因此, 选取大数据产业系统的两个状态变量q1和q2并建立两者的模型关系为:
其中λ1、 λ2为阻尼系数, a 和b 为两个状态变量的相互作用强度系数。
显然, 由以上模型可得到系统的一个定态解为q1=q2=0。 当λ2≫λ1且λ2>0 时, 满足“绝热近似原理”, 表明q2为迅速衰减的快变量。 因此,采用绝热消去法, 令q′2=0, 由式(2) 可得:
将式(3) 代入式(1), 得到序参量方程,即系统的演化方程为:
从式(4) 中解出q1后, 再代入式(3) 解出q2。 由此可见, q1决定了q2, 即q2随q1的变化而变化。 因此, q1为系统的序参量, 主导着系统的演化。
对式(4) 的相反数积分解出势函数为:
存在两种情况: 当λ1>0 时, 方程(4)有唯一稳定解, 即q1=0; 当λ1<0 时, 方程(4)有3 个解,即由于q11是不稳定解, 现实分析中一般不予考虑。但q12、 q13是稳定解, 表明系统可通过突变进入新的稳定态。 实际应用中可将哈肯模型离散化为:
作为一个正处于发展中的新兴产业, 大数据产业的演化发展受到多方面因素的影响, 但目前还未有学者关注大数据产业的演化机制研究。 鉴于运用哈肯模型在研究其他产业的演化发展中已有较成功的案例[15,16], 本文拟采用哈肯模型并选取研发投入、 劳动生产率和资本投入3 个状态变量作为演化序参量的备选集具体分析大数据产业。
(1) 研发投入IR, 用研发费用表示。 研发投入反映了创新和技术的投入, 代表大数据产业系统中的知识和技术部门。 大数据产业中大数据是一类具有重要潜在应用价值的信息资源。 就管理视角而言, 大数据具有复杂性和高速增长性, 其潜在价值能够被重复挖掘并对决策起重要作用,但由于其价值稀疏, 也导致挖掘难度的增加[26]。不同于传统产业, 大数据产业更需寻求更优化的算法和处理模式来打破传统技术的瓶颈, 也才能够适应并充分利用复杂的大数据资源。 针对这一问题, 技术的进步和创新对于大数据产业发展来说至关重要。 研发投入促使创新成果的产出和技术的进步, 可以推动系统从原有的平衡态发展为不平衡态, 并最终达到新的更高层次的有序结构。由此可看出, 研发投入是系统远离平衡态的重要契机, 可以直接反映创新和技术的投入状况。 没有创新和技术进化引起的产品质量、 管理效率等的变化, 系统也就不可能打破旧的平衡态而跃升到新的稳定态。 因此, 研发投入变量IR可为哈肯模型备选变量。
(2) 劳动生产率PR, 即人均生产价值转化,用年收入与员工的比值表示, 代表大数据产业系统中的劳力部门。 劳动生产率涉及年收入和员工数两个指标, 其中年收入可以反映大数据产业的经济规模, 也可以体现生产部门的实际发展状况。当产业系统从稳定态转为不稳定态时, 由于系统环境的复杂性以及随机涨落的触发, 在形成新的有序结构过程中能够依然发展并持续壮大的企业往往都是竞争能力强、 创新进步快的企业。 显然,创新不仅包括产品工艺创新, 还包括经营管理创新、 员工素质提高等方面, 而这些创新和提高又集中体现在劳动生产率的增长[15]。 PR可反映人均生产价值的转化程度, 以及科技成果转向现实生产力的效率, 包括在组织、 管理、 经营等方面的科技创新。 因此, 劳动生产率也是系统自组织演化中需重点关注的变量, 可作为哈肯模型的备选变量。
(3) 资本投入RS, 反映了大数据产业系统的资本投入情况, 代表着大数据产业系统的资金投入部门, 用投资额表示。 企业的进步往往离不开资本的投入, 不仅仅是对于企业而言, 也可以上升至产业乃至政府层面。 在大数据产业演化过程中, 大数据企业通过对技术、 制度、 设备、 劳动者素质等的资本投入来获得收益和实现增值, 从而在系统演化中赢得竞争优势。 资本投入对大数据企业在大数据产业系统的演化中起着重要的推动作用。 因此, 资本投入也是系统演化应该关注的重要变量。 需要注意的是, 在技术进步、 设备更新等方面的投资既可以是资本投入的一部分,也可以是研发投入的一部分。 如设备更新费用可以作为资本投入中的固定资产投资, 也可作为研发投入中的硬件设备费用。 因此, 资本投入也包含了一部分研发方面的投入。 在大数据产业演化中, 研发投入往往是最直观考虑的因素, 但由于系统环境的复杂性, 演化过程往往受到多因素共同作用。 在具体分析时, 还需要将其他非研发投入因素考虑进来。 鉴于此, 本文将资本投入RS作为哈肯模型的备选变量之一。
综上所述, 研发投入、 劳动生产率和资本投入都是大数据产业演化发展中的重要因素, 基本能够反映大数据产业系统的本质特征。 由于研发投入与资本投入有重合部分, 为避免数据的重复性, 将对研发投入与生产率、 资本投入与生产率进行两两比较, 找出符合哈肯模型变量要求的一组变量, 再识别出推动大数据产业发展的序参量。
由于我国大数据产业目前还在起步阶段, 相关数据的统计工作还没有完善且统计口径不一致,导致缺乏完整、 准确的产值数据。 大数据产业又是由各个大数据企业等微观个体所组成, 企业的发展状况也能在一定程度上反映到产业上。 因此,考虑到数据的合理性和可获取性, 本文选取2018年《中国大数据企业排行榜》 中17 家大数据相关上市企业作为样本来代表我国大数据产业的现状, 其数据来源于沪深证券市场披露的2017 ~2018 年上市公司报告。 表1 和表2 为2017 ~2018年17 家上市公司的研发费用、 劳动生产率和投资额的测算结果。
表1 大数据相关上市企业数据(一)
表2 大数据相关上市企业数据(二)
本文选取研发投入IR、 劳动生产率PR、 资本投入RS3 个备选变量, 而哈肯模型的变量要求为两个, 因此需要对3 个变量进行组合再分析。 其步骤为: (1) 假设其中一个为慢变量, 即模型假设; (2) 建立相应的演化方程, 判断其是否成立; (3) 对方程参数进行求解, 判别是否满足绝热近似条件; (4) 对模型假设进行判别, 求出序参量[27]。 结合上文可知, 只需对IR与PR、 RS与PR这两组变量进行分析, 获得4 组计算结果如表3 所示。 模型方程均利用SPSS 23.0 软件对表1 数据进行回归求得。 由表3 可知, IR与PR的组合不能满足绝热近似原理, 也就是说研发投入目前还不能够作为哈肯模型的状态变量, 这一点体现了大数据产业与相关联的物联网产业、 高新技术产业的不同之处。 RS与PR的组合满足绝热近似原理, 其中PR(劳动生产率) 为序参量, 其分析结果可以揭示大数据产业系统演化的一般特性。
表3 变量两两分析结果
根据表3 结果, 获得大数据产业系统的演化方程为:
以及该系统的势函数为:
令P′R=0 得到势函数的3 个定态解: PR1=0,PR2=-1.546, PR3=1.546。
同时, 势函数v 的二阶导数为:
将定态解PR1代入式(10) 得v″=-0.153<0,表示势函数式(9) 有极大值, 即vmax=0, PR1=0为稳定解。 将PR2、 PR3代入式(10) 时, v 有极小值, 即vmin=-0.09144, 表明PR2、 PR3为不稳定解, 此时势函数的形状如图1。 其结构特性能够揭示大数据产业的演化机制, 即系统势函数会随着状态变量(λ1,λ2)和控制参数(a,b)的改变而改变, 系统状态由原有的稳定转向不稳定。 由图1可见, 当控制变量取适当值时, 大数据产业系统内部的资本投入和劳动生产率会产生非零作用,形成新的稳定的定态解PR=±1.546。 也就是说,在这两处, 系统的新有序结构出现。 而从式(7)可知, 此时支配大数据产业系统演化的序参量是劳动生产率。
图1 大数据产业系统势函数图形
通过以上计算结果, 可以清晰地揭示出大数据产业系统的演化机制。
4.3.1 劳动生产率是大数据产业系统演化的序参量
大数据产业系统演化方程式(7) 揭示了其演化特征: 在大数据产业系统演化(即科技成果转向大数据产业生产系统) 的临界点上, 支配系统演化的序参量为劳动生产率。 目前, 我国大部分的大数据企业已经达到这个临界状态, 表明我国大数据产业从发展到目前至少已经历过一次突变, 现在正处于一种新的有序结构的形成过程,并且在突变过程中劳动生产率起着重要的主导作用。 因此, 加速大数据产业向另一更高级、 更有序新结构演化的进程, 也同样需要重视人均生产价值的转化程度, 提高科技成果转向现实生产力的效率。
4.3.2 控制变量反映大数据产业系统演化行为
系统演化行为也能由哈肯模型中各控制参数体现出来。
(1) 控制参数a 为正值, 反映资本投入抑制劳动生产率的增长。 此时, 企业加大资本投入不能较大地刺激劳动者的积极性, 说明目前我国大数据产业中加大资本投入与提高劳动生产率之间还未具有协同效应。
(2) 控制参数b 为正值, 反映劳动生产率促进投资的增长。 在国家大数据战略支持下, 我国大数据产业得到充分发展。 无论是硬件设施建设、还是产品工艺等的改进都需要投入大量资金。 劳动生产率的提高能够推动技术、 设备等的更新,从而刺激投资的增长, 这也说明了投资的重要性。
(3) 方程参数λ1为负值, 表明系统内部已建立劳动生产率不断增长的正反馈机制。 劳动生产率的增长与λ1的绝对值呈正相关关系。 但此时λ1的绝对值并不大, 说明大数据产业系统的有序度还不是很高, 有进一步提升的空间。
(4) 方程参数λ2为正值, 表明大数据产业系统内部已形成资本投入递减的负反馈机制。 当大数据产业发展初期所需的基础设施、 设备等的投入逐渐趋于稳定状态时, 其产业日常运行所需的资本投入也会随之趋于稳定, 形成产业内部资本投入与生产经营之间的良性循环。 此时, 大数据产业的资本投入额度也会相应降低, 同时随着先进技术的持续进步以及大数据产业发展的逐渐稳固, 资本投入额也将呈下降趋势。 因此, 加强科技创新不仅有利于资本投入额的下降, 同时也能够提高大数据产业的投入产出效率。
大数据产业系统具有开放性、 自我适应性、 非线性作用与涌现性4 个自组织演化特征。 应用哈肯模型分析我国大数据产业相关上市公司, 建立大数据产业系统演化方程, 推导出反映人均生产价值转化的劳动生产率为大数据产业演化的序参量, 是大数据产业系统演化的决定因素。 大数据产业系统的演化在很大程度上取决于劳动生产率,当劳动生产率发生大幅变动时, 将役使资本投入等其他参量发生变动, 从而推动系统从一个有序结构向另一个更优的有序结构演进。 在大数据产业系统内部, 资本投入与劳动生产率的协同成为大数据产业快速发展的关键。 因此, 要利用开放条件的优势, 加强系统各要素之间的配合, 使两者之间实现良好的协同循环。