许丹丹,王宏起,李晓莉,李莹莹
(哈尔滨理工大学经济与管理学院,黑龙江 哈尔滨 150080)
数字经济时代,数据成为战略性资源。2020年国务院在 《关于构建更加完善的要素市场化配置体制机制的意见》中提出,要加快培育数据要素市场,畅通要素流动渠道,提升数据资源价值。海量数据联动融合是其价值实现的基础[1],特别是在先导性明确的新兴产业,数据敏感性高、内容密集、使用场景丰富、需求量大[2],是发挥数据价值的重要领域,然而数据获取困难、流通不畅等问题限制了新兴产业中数据的转化与利用,如在互联网产业中腾讯、阿里等掌握核心数据的企业为维持商业利益实施数据封锁导致产业链中其他企业无法获取数据并形成 “数据孤岛”,因此加速数据扩散、深度释放数据价值成为现阶段驱动新兴产业数字化发展的关键。
数据流通扩散对新兴产业数字化的重要作用已在学界形成共识[3-6],但尚未系统揭示产业数据扩散机理,梳理现有研究发现学者主要关注以下方面。首先,从数据价值出发探索数据扩散的前因,数据可以加速信息与知识的传递[3],加之其特有的整合融通、洞察赋能、复用性及边际报酬递增等经济性价值可以驱动多主体参与数据获取与开放[4]。其次,研究数据在不同主体间的流转过程,如薛晓娜等[5]从数据生态链运行视角出发将数据流转分为生产、组织、传播、消费、分解和监管6个环节,公司职工、合作伙伴、产业内竞争对手和政策制定者都参与其中[6]。此外,还有大量研究关注企业内部的数据管理活动,Xiao等[7]认为数据扩散中涉及的企业数据管理活动有数据采集、清理、存储、加工处理、可视化分析、公开、交易和使用等,其中数据质量影响数据接受者的采集意愿[8],提高对数据的认知可加速数据清洗与分析[9],扩大合作网络可以缩短数据传输距离并提高数据公开范围[10],算法和算力基础影响数据处理效果[11],数据重塑会提高其再传播可能性及复用价值[12]。由此可见,企业微观层面的数据管理活动对产业数据扩散效果有影响,同时在数据传播过程中形成了以数据为中心的连接、赋能的数字创新迭代与价值共创现象[13]。
综上,现有研究多关注数据扩散的前因、过程、参与主体及主要活动等问题,为新兴产业数据扩散机理的探索奠定了基础,但尚存在以下不足,一方面,已有研究多集中于企业层面的数据管理活动,较少从产业层面组合研究多个企业间的数据扩散互动行为及影响因素,难以加速数据在新兴产业的广泛传播;另一方面,鲜有研究将数据扩散的过程、参与主体及影响因素放置于统一框架下讨论,未系统揭示新兴产业数据扩散机理,不利于最大化发挥数据对新兴产业数字化的推动作用。因此,面向新兴产业数据扩散机理研究的现实与理论需要,本文基于现有研究成果从过程性视角划分出新兴产业数据扩散的阶段,通过SEIRI (易感者-潜伏者-感染者-拒绝者-重复感染者)模型仿真分析不同阶段的参与主体及影响因素,明确数据在多主体间扩散及价值实现的过程,进而揭示新兴产业数据扩散机理,并以区块链产业数据扩散实例检验机理模型的合理性,为加速数据价值实现、提升产业数据扩散效果和产业数字化高质量发展提供参考。
数据是以各类数据库为载体,基于数字技术的一种新型生产要素,形式上表现为0和1的二进制字符串,内容上是一切数据化的文字、图片、创意、信息与知识等[14],可以赋能企业创新[15]、产业升级与宏观经济发展[16]。数字技术搭建的虚拟传播环境消除了以往物理传递方式的束缚,新兴产业随之形成以数据为核心生产要素的新发展格局[17]。借鉴数据管理与传播相关研究[5,13,18],将数据扩散定义为数据依托数字技术的底层架构,以数据生产者为起点,以公开为前提,以价值实现为目标,在复杂主体 (数据需求者、加工者和使用者等)间的传播过程。
梳理有关数据及其管理活动的研究[7,13,19-22],数据扩散过程、形态演进与扩散特征见表1。
表1 数据扩散过程及特征
数据的低成本复制、可重用和重构等特征是其在新兴产业扩散的基础,数据扩散早期,企业可基于前瞻性认知来获取异质性数据并打破资源限制[22];中期需要进行适应性重构来提升数据价值并与其他企业互通共享数据[23];后期要依托高价值数据实现产业数字环境的迭代与升级[13]。
根据数据扩散过程中数据价值形态的变化可将其分为原始数据、数据子集和拓展数据集3类,其中原始数据不能直接发挥效用,数据子集是加工后的原始数据具有使用价值,拓展数据集是数据功能跃迁升级后的形态[21]。基于不同数据形态下数据价值的差异将其划分为基态和激发态两种状态,依托新兴产业数据扩散活动可将基态原始数据资源转化为能为企业创造价值的激发态数据子集与扩展数据集[18,21,23],如图1所示。
图1 数据扩散及价值能级演进过程
综合现有研究发现新兴产业数据扩散活动中数据价值实现的过程如下[13,21-23]:首先,企业通过观察与记录形成原始数据,开放后可能被具有前瞻性认知的企业认同并获取;而后,对数据进行清洗、加工形成可用的结构化数据子集,企业间可以访问、使用彼此数据;最后,数据被整合重构产生拓展数据集呈现出多元应用价值。可见,新兴产业数据价值实现是多方协同参与的过程,企业间以认知共识为前提,通过数据加工形成互惠共生关系,最终随数据迭代达到共赢目标[13,24]。
基于对数据扩散过程和数据价值能级演进的分析,将数据扩散划分为 “原生-使能-迭升”3个阶段,分别对应 “价值认知共识-价值创造共生-价值迭代共赢”的价值共创内涵。对不同阶段的数据扩散活动、参与主体及影响因素分析如下。
(1)原生扩散阶段。原生扩散阶段是数据开放、获取并实现企业间数据价值共识的过程。首位数据所有者公开数据,潜在接受者感知数据内容,经系统识别后形成初步认知并通过合作网络等途径获取,更新自有数据库并积累资源以备后用。这一阶段数据形态没有改变,参与主体为数据扩散者与潜在接受者,核心目标是识别数据价值,主要活动为数据转移、获取与存储,主要影响因素是企业数据认知能力与产业网络规模。数据认知能力是数据流转的前提[25],体现为企业对数据资源的感知与价值判断,高认知能力企业对数据反应更敏捷,能准确识别与评估其价值,理性参与数据扩散;网络规模通过影响企业间数据交互和学习来改变数据互动频率与扩散范围[26]。
(2)使能扩散阶段。使能扩散阶段是对数据提纯、加工与应用,并实现企业间价值共生的过程。数据持续公开,企业认知能力不断提升,经验和资源的积累催生了数据加工能力,数据经改造加工后再次开放,价值提升会吸引更多企业参与扩散。参与者增多后数据确权困难、利益分配不当和流通标准缺失等问题凸显,部分企业会合作制定相关标准和规则来解决以上问题,但由于影响力和约束力有限,并不能有效提高数据扩散效果,因而需要政府力量介入,规范产业数据扩散活动。这一阶段数据内涵更为丰富,涵盖信息与知识等,核心目标是提高数据价值,实现企业间数据高质量交互,进而达到互利共生,新增数据加工者,主要活动是数据清洗、运行维护、融合使用与加工赋能,主要影响因素是企业数据加工能力和政策。数据加工能力表现在企业对数据的使能上,数据价值不是固定不变的,加工者可以激发数据价值[27],增强数据影响力,进而提高扩散效果;政府主要通过制定法律法规等政策手段规范企业数据管理行为[28]。此外,还会使用补贴、税收优惠等方式激励企业在数据交流与加工等方面进行投入,促进数据产出与共享。
(3)迭升扩散阶段。迭升扩散阶段是对冗余数据进行剔除与革新再生,并实现新兴产业内价值共赢的过程。数据持续扩散使数据量激增, “数据爆发”和 “数据海啸”等问题出现,海量数据存储耗能巨大,大部分企业因高额成本会选择精简自有数据;数据内容方面,质量控制不严格导致 “数据废料”增多、数据效能下降和数据同质化严重等问题使扩散濒临终止。部分企业废弃原有数据,并将数字技术与应用场景新需求结合重塑数据内容与形式,使其价值能级发生跃迁,实现迭代升级。这一阶段数据发生巨变,技术应用占据主导地位,核心目标是数据价值重构与倍增,在高价值数据的扩散中实现新兴产业内各主体间互惠共赢,主要活动为数据重塑,主要影响因素是数据质量与企业数据重塑能力。数据质量体现在数据形式与内容两个方面,数据结构化程度会影响传输过程中的损耗,改变其完整性与可用性,数据内容决定数据中知识和信息的密度,二者共同影响数据扩散效果[29];数据重塑能力是企业的一种动态能力,体现为对数据实用价值的突破[30],重塑数据应用领域与范围会激发其他主体重获数据的积极性,进而影响数据复用与扩散。
通过以上分析明确数据扩散的阶段、参与主体及影响因素,如图2所示。
图2 新兴产业数据扩散阶段与影响因素
传染病模型在舆情、知识、信息、创新和风险扩散等领域研究成果丰富,能够刻画不同主体在扩散过程中的时变特征并定量计算扩散范围的变化。数据扩散具有速度快、动态性及网络外部性等特征与传染病传播过程相似,适合采用该模型进行刻画,具体表现如下。
(1)病原体—原始数据。数据所有者首次公开的原始数据是扩散活动的病原体,新兴产业中数字技术的广泛架构可以帮助数据快速实现复制与裂变,暴露数据需求的企业成为宿主,感染数据后即实现扩散。
(2)传染性—数据扩散实现。新兴产业相较于传统产业具有信息和知识密集等特征,企业间数据交互活动频繁,数据能够通过扩散者的关系网络以交易、交换和共享等途径传播,感染数据的企业在存储、加工和使用后可以将数据再扩散至其他企业,呈现出传染性。
(3)流行性—数据扩散规模。数据流转能打破传统组织边界并无限增长,传播级别达到爆发性程度,形成分布广泛且规模巨大的流行性特征。数据的自增长性有助于其持续扩散,新兴产业数据集成规模随之不断扩大。
(4)免疫形成—数据拒绝与重塑。无论是数据的显性应用还是隐性采集,企业都会经历数据识别、激活、价值释放和记忆过程,如数据无变异发生,企业会凭借记忆拒绝原有数据,形成免疫,而这种免疫一般具有时效性,随着数据进化及应用场景变化,拒绝者可能会再次感染 “新型”数据。
基于以上关于数据扩散与传染病模型适配性的分析,建立其对应关系,见表2。
表2 传染病模型下数据扩散概念映射
原生扩散阶段企业对数据的认识处于空白状态,只有单个或少量数据扩散者公开数据,部分跟随者涌入,此时系统中潜在接受者与扩散者的时变微分方程为:
dS(t)/dt=-βS(t)I(t)
(1)
dI(t)/dt=βS(t)I(t)
(2)
S(t)+I(t)=N
(3)
使能扩散阶段数据量增大,数据价值逐渐显现并成为企业间竞争性资源,加工型企业出现,扩散呈现出停滞、无序等混沌状态[32],数据获益纠纷易发、频发,政府介入调控,在激励性与限制性政策的双重作用下数据实现规范高效传播,时变微分方程为:
dS(t)/dt=-βS(t)I(t)
(4)
dE(t)/dt=βS(t)I(t)-αE(t)
(5)
dI(t)/dt=αE(t)
(6)
S(t)+I(t)+E(t)=N
(7)
式中,E(t)为t时刻数据加工型企业数量,α为企业数据加工能力。基本再生数R0表示政策,当R0减小时,限制性政策发挥主要作用,数据扩散趋于消亡,反之激励性政策发挥效用,根据再生矩阵FV-1的谱半径计算R0=βS(0)/α。
迭升扩散阶段数据呈爆发式增长,随着企业数据认知能力与需求的提升,大量数据转变为低质量、低效用数据,企业开始淘汰现有数据,成为数据拒绝者。部分企业尝试开展数据增值活动,对现有数据进行革新再造,成为数据重塑者,数据质量和企业数据重塑能力成为数据扩散的主要影响因素,时变微分方程为:
dS(t)/dt=-βS(t)I(t)
(8)
dE(t)/dt=βS(t)I(t)-αE(t)
(9)
dI(t)/dt=αE(t)-δI(t)+λR(t)
(10)
dR(t)/dt=δI(t)-λR(t)
(11)
S(t)+E(t)+I(t)+R(t)=N
(12)
式中,R(t)为t时刻淘汰低价值数据的企业数量,包括拒绝者与重塑者,重塑者淘汰低质量数据后会对数据进行改造升级并成为新扩散者,拒绝者则直接退出数据扩散系统,δ表示数据质量,λ为企业数据重塑能力。
借助MATLAB2019a软件对数据扩散过程进行仿真,将仿真结果导出并使用origin绘图软件呈现,观察不同阶段数据扩散的速度与范围,分析各因素对数据扩散效果的影响,其中扩散速度以扩散者单位时间的数量变化衡量,扩散范围用扩散者数量表示。参考杨湘浩等[33]关于传染病模型的参数设置思想,将新兴产业网络规模N定在100000~1000000之间,数据认知能力β、加工能力α、质量δ和重塑能力λ的取值均在0.1~1之间,系统内各群体数量稳定时间为仿真结束点,步长为1。
(1)原生扩散阶段。改变潜在接受者的认知能力β,新兴产业数据扩散情况如图3所示。
图3 数据认知能力对扩散效果的影响
增大潜在接受者认知能力,数据扩散范围无明显变化,但扩散速度显著提高。由于原始数据有公共基础资源的性质较易获得[21],加之新兴产业先导性优势,数字基础设施完善,组织间数据传输壁垒低,一旦数据公开企业基本都能获得数据,接受者数量会稳定在群体总数附近,持续数据扩散使企业完成了基础学习并对数据价值形成共识。企业认知能力越高数据搜寻意识越强且能准确把握数据获取机会,进而缩短反应时间,加快数据扩散速度。改变新兴产业网络规模N,数据扩散情况如图4所示。
产业网络规模显著影响数据扩散速度和范围。保持数据认知能力不变,增大产业网络规模,扩散者单位时间接触的潜在接受者数量增大,数据扩散速度显著提高。高速传播提高了数据的暴露程度,传染可能性变大,感染者数量增多且流行性增强,扩散范围随之扩大。
(2)使能扩散阶段。改变加工者的数据加工能力α,新兴产业数据扩散情况如图5所示,由时间轴向后依次为潜在接受者、加工者和扩散者3类群体。改变数据加工能力数据扩散速度呈阶段性变化,但范围基本不变。
数据加工能力在0.1~0.4时,增大加工能力扩散速度显著提高,原因主要有两个,一是数据价值能级低企业保护意识不强,使得数据获取难度小,扩散速度快;二是加工水平低时边际效用高,提高加工能力数据价值变化明显,因而数据获取敏感性强,扩散速度变化显著。加工能力在0.5~1.0变化时对扩散速度影响不大,由于新兴产业知识迭代性强,为应对快速变化的数据需求,加工成本不断增高,持续进行数据加工的企业减少,高价值数据成为竞争性资源 (数据资产)并被企业囤积,扩散速度受限。由于新兴产业数字基础设施较为完善,扩散环境阻力低,改变数据加工能力很难影响扩散范围。使能扩散阶段数据加工、开放、获取和交互活动密集,企业既可以获取外部数据也能开放自有数据,多主体间构成互利共生关系。
图4 产业网络规模对扩散效果的影响
图5 数据加工能力对扩散效果的影响
根据基本再生数公式可知,改变β和α比例可以实现对政策R0的调节,将α设置为0.1,通过改变β的大小来调节R0,新兴产业数据扩散情况如图6所示。
R0增大时,数据扩散速度提高,范围变大。R0的大小变化代表不同政策调控方向,R0增大时表明政府采取激励性政策,如补贴、税收优惠等,提升了企业积极性,扩散速度和范围随之提高。新兴产业数字化发展与数据扩散都具有极大不确定性,需要及时引导,R0减小时表示限制性政策出台,政府为防止企业在抢占数据时失去理性,造成新兴产业数据扩散系统盲目扩张及数据泡沫的产生,会出台相关风险提示政策,阻断不良数据传播,数据扩散范围和速度随之下降。
(3)迭升扩散阶段。改变数据质量δ的大小 (δ越大数据质量越低),由时间轴向后依次为潜在接受者、加工者、扩散者和拒绝者4类群体,新兴产业数据扩散情况如图7所示。
数据质量下降时,扩散速度减缓,范围缩小。新兴产业具有高成长性,企业经历数据学习与交互后很快形成认知与加工能力,对数据的价值判断更加准确,不再盲目获取,当数据质量低于标准时将会被拒绝,无法大范围扩散。数据质量越低扩散者的出现越滞后,这是由于大部分企业虽不再认可低质量数据,但对数据的价值期望没有消失,会等待数据增值后获取,延长了系统的均衡时间,导致整体扩散速度缓慢。改变数据重塑者的重塑能力λ,新兴产业数据扩散情况如图8所示。
图6 政策调控对扩散效果的影响
图7 数据质量对扩散效果的影响
图8 数据重塑能力对扩散效果的影响
增大数据重塑者的重塑能力,数据扩散速度显著提升,扩散范围扩大。随着数据应用需求的提高,原有数据无法满足企业发展需求并沦为低价值数据,大量企业开始退出扩散系统成为数据拒绝者。数据相对于信息、知识和技术等要素,重塑性高且改造门槛低[14],拒绝者可通过数据重构及高阶赋能成为数据重塑者,实现数据价值的颠覆与迭代。数据重塑者的重塑能力越强,高价值数据产出越高,高价值数据的涟漪效应能显著增强其他企业的数据获取意愿,提高扩散速度与范围。数据重塑使原有数据的价值发生跃迁,成为数据资本,优化了整个新兴产业的数据应用环境,实现了新兴产业内的价值共赢。
通过对原生扩散、使能扩散和迭升扩散3个阶段影响因素的仿真与分析,揭示新兴产业数据扩散机理。其中,数据公开与学习是新兴产业数据扩散的起点,加工应用是价值创造的手段,而迭代重构可以促进价值共赢实现,如图9所示。
图9 新兴产业数据扩散机理模型
以区块链产业中比特币白皮书的扩散为例[34],检验区块链产业数据扩散过程、特征和主要影响因素是否与机理模型一致。区块链产业是新兴产业中以数据为关键资源的典型,产业有可溯源、开放式和去中心化等特点,数据易获取且能追溯数据扩散全过程。案例资料来自国家互联网应急中心的区块链数据服务平台 “区块链之家”,其提供2009—2021年注册经营范围含区块链及相关内容的企业、实施的区块链项目,注册经营范围含区块链及相关内容的企业为数据接受者,包括加工者和扩散者,开展区块链项目的企业为数据扩散者,梳理数据接受者与扩散者数量变化情况,如图10所示。整理2008—2021年区块链产业数据扩散相关政策及企业活动,揭示数据的扩散与演进过程,如图11所示。
2008—2016年区块链产业处于数据扩散原生阶段,以数据开放、学习并建立企业间数据价值共识为主。2008年比特币白皮书公开,创世区块诞生,区块链产业开启数据扩散活动。2009—2014年,企业对数据的认知还较为模糊,多围绕比特币和以太坊来进行数据获取与传播,虽吸引了部分数字货币关注者,但仅有少数参与者选择注册公司成为数据接受者,数据扩散规模小。2014年企业基于数据学习需求自发组织成立研究联盟,加速了数据价值共识形成,数据接受者数量随之提升,但由于产业网络规模的制约,数据扩散速度较慢,扩散范围有限。
图10 区块链产业数据扩散情况
图11 原始数据在区块链产业的扩散与演进
2017—2021年,区块链产业处于数据扩散使能阶段,以数据加工赋能、融合使用并在企业间建立数据价值共生关系为主,同时政府开始频繁发布各项政策调控数据扩散。数据加工先导型企业接受原始数据后,对数据应用进行构思与实践,实现了数据与现实世界的融合,部分数据价值创造案例见表3。为激励企业持续进行数据加工,2017年国务院等部门发布促进数据融合使用的政策和标准,数据接受者数量显著提高,扩散速度加快。2018年腾讯上线云平台之后其他企业迅速跟随模仿,部分模仿者对其进行加工创新后再开放,企业间形成价值共生关系,数据价值得到普遍认可。但在模仿环境下企业很难掌握核心数据,持续参加扩散的动力不足,易产生泡沫效应,五部委及时出台风险提示政策以优化数据扩散环境,但也导致区块链产业数据扩散速度在2018—2019年大幅度下降。为了缓解暂时的数据扩散困境,2019年起政府不断出台各项促进政策,数据扩散速度再次回归到较高水平,扩散范围也有所扩大。
表3 数据价值创造案例
当前区块链产业尚未进入数据扩散迭升阶段,企业数据认知与数据应用范式仍局限于数据的自然属性,即信息、知识的传递与记录,并未将数据与技术、商业模式的创新相联系以重构产业发展方式。此外,数据确权、交易定价和隐私保护等环节也存在标准不明、监管不力等现象,导致部分数据所有者暂时囤积数据。未来,如果在产业层面完善相关技术与标准的布局以引导数据扩散方向、提高数据质量,构建以数据为核心的产业互联生态;企业层面利用共识机制、智能合约和信息加密等手段探索新的价值创造模式,全面重塑数据内容与结构,深度开发数据潜能,区块链产业将稳步进入迭升扩散阶段并最大化释放数据价值。
(1)新兴产业数据扩散包括原生扩散、使能扩散和迭升扩散3个阶段。原生扩散阶段以数据的开放获取为主,并依托原始数据扩散者展开数据认知普及,是数据价值实现的基础环节。使能扩散阶段通过对数据的清洗与加工,由核心企业主导形成数据应用范式,是全方位、大范围开发数据价值的关键环节。迭升扩散阶段关注数据的剔除与革新,数据功能不断迭代,是数据应用架构延展与扩张的高阶状态。
(2)伴随数据扩散阶段的演化数据价值形态经历资源化、资产化和资本化的转变。将碎片化的原始数据汇集整理形成可视化、易得的数据资源是数据价值实现的前提,数据资产化是对数据进行加工整合与产业实际应用需求相融合以实现数据价值提升的过程,数据资本化是拓展数据应用范围、发挥数据乘数效应的最终结果。
(3)新兴产业数据扩散不同阶段受不同因素影响。原生扩散阶段,潜在接受者认知能力与产业网络规模分别影响主体搜索意识和数据价值共识的形成速度;使能扩散阶段,在政策手段调控下数据加工者不断赋能数据价值提升,以促进企业间数据传播及利益共生关系的建立;迭升扩散阶段,数据重塑者以数据质量跃迁为目标重塑数据内容与结构,推进新兴产业数字化进程及整体价值共赢的实现。
(1)提升企业数据管理能力,加速数据在企业间的流转与扩散。企业的数据认知、加工和重塑能力是数据获取、价值实现与增长的基础,可以依托各类数据平台提高企业数据运营与管理能力进而促进数据价值实现:①建设专业化的数据服务平台,开展基础设施建设、应用场景识别和运行管理等咨询服务,提高企业的数据认知能力;②企业间可以联合建立数据共享平台,汇集多方数据,供成员复制导出,实现数据开源获取、分布式加工重组;③企业可以成立数据研发中心,建立数据存储平台,提高数据资源储备,加强数据资产的统一管理,以培育数据重塑能力。
(2)提升数据质量,提高产业数据扩散效果。高质量数据是新兴产业数据扩散的动力源泉,因此要以产业应用为导向促进数据扩散活动,首先要设立数据准入标准,提高数据进入门槛,促进结构化高质量数据生产;其次要规范企业间的数据交流与合作,形成适应产业发展的数据定价、交易和传播规则,并通过产业白皮书等方式吸纳和扩散数据成果,实现产业内数据兼容与互联。
(3)进一步完善数据扩散相关政策。保障数据扩散质量、协调利益关系和促进产业数字化发展是当前数据扩散活动的核心,为此政府要做好战略规划与引导。一是要关注数据从公开到利用再到重构的各个环节,探索数据溯源、确权与质量评估方法,保障数据质量;二是协调利益相关者,引导产业建立数据定价和利益分配制度,充分保障数据开放企业的权益,推动数据流通共享;三是开展数据标准化评估与抽检工作,引导企业形成价值共识,并激励数据交互活动,深化企业间共生关系,可认定部分企业为高价值数据产出示范型企业,促进数据价值的提升与共赢。