李志宏,余 悦,许小颖,陈铠敏
(华南理工大学工商管理学院,广东广州 510641)
大数据时代背景下,科研数据作为最活跃、最基本的一类科技资源[1],是数据密集型现代科学研究获取数据的重要途径之一,对于推动国家科技创新、促进社会经济发展具有重要意义,因此科研数据共享一直是学术界和科研机构广泛关注的热门话题。科研数据共享能有效避免重复性的工作,有利于促进数据资源流动、提升科研数据价值,从而增强科研人员的科研创新潜力。此外,有学者如Borgman[2]、Vlaeminck 等[3]、Sayogo 等[4]认为,科研数据共享可为后续研究提供原始数据,保证了研究的可复制性,有效促进科学研究取得重要进展。我国国务院办公厅在2018 年颁布了《科学数据管理办法》,其中明确提出的“开放为常态,不开放为例外”原则为科研数据的管理利用指明了方向。但吕昕等[5]认为我国的科学数据开放与共享仍面临着法规政策保障不足、平台建设与基础设施开放不充分以及开放文化和激励机制欠缺等诸多挑战。
科研数据共享的核心问题是数据所有权和使用权相分离[6],但数据所有权制度设计的缺乏导致数据主体无法获得开放数据的利益,因此便不愿意共享数据[7]。某些人类学领域的研究具有一定的隐私性[8],存有海量未经修饰的原始敏感数据,考虑到可能导致的不良后果,领域内科研人员的共享意愿较低,其数据共享行为存在被限制的现象。此外,Nelson[9]、Schofield 等[10]研究认为,免费共享数据能否保障数据不被弄丢、窃取、盗用或误用以及是否可以得到合乎道德且负责任的使用等,是科研人员在数据共享过程中经常质疑的问题。在有关科研数据共享的影响因素研究中,卢祖丹[11]以普通读者的身份向2020—2021 年间发表在期刊《大学图书馆学报》和《情报学报》上的10 篇数据型论文作者请求共享其论文相关数据,仅有2 位作者响应了请求。
区块链技术的发展或将为科研数据共享困境的突破提供新的解决思路。区块链的本质是一个分布式数字账本,具有去中心化和数据不可篡改等特性,已广泛应用于解决各种领域的数据安全互信、可溯源等问题[12]。已有学者关注到区块链技术在科研数据领域的实践,例如,郝世博等[13]从主体、客体、功能角度对科研数据共享应用区块链的适用性进行阐述,并深入探讨了科研数据共享区块链交互信息、数据区块、共识激励机制、智能合约等实现机制;王倩等[14]基于区块链技术与演化博弈论,构建了一种面向科技服务数据共享策略的智能合约激励机制;黄茂汉[15]基于区块链技术构建了一个疫情防控情报系统模型,旨在对疫情实时情况、疫苗研发进展、患者信息等进行数据共享;鲍锋等[12]运用区块链技术构建了科研信息共享平台并实现了科研信息共享;Balistri 等[16]提出了BlockHealth 系统解决方案,以实现不同公司间个人健康数据的共享;王继业等[17]构建基于区块链的数据安全共享网络体系,为数据安全共享构建了一种可信网络环境;王瑞丹等[18]尝试使用区块链技术来解决科技资源的可信认证和权益认证等问题,以有效推动包括科研数据在内的科技资源的流通、交易与共享。
虽然学界对区块链技术在科研数据共享领域的研究取得了较多的成果,但较少关注区块链技术下科研人员数据共享意愿的讨论。科学数据共享是研究人员认识科学的新钥匙、知识发现的新引擎,而提高科研人员共享科学数据的积极性、加强科研数据共享意愿则是关键环节[19],若科研人员之间无法实现数据共享,科研项目建设各方协同工作的优势也就无法充分展现[20]。一方面,区块链技术的发展使得科研数据共享的实现方式发生了较大变化,该视角下的科研人员数据共享意愿研究仍需进一步深入;另一方面,科研人员的科学数据共享意愿决定着他们的共享行为[21],如果共享意愿较低、动力不足,则区块链技术也难以发挥作用。
综上所述,区块链技术下的科研数据共享是近年来理论与实践关注的焦点问题,国内外的有关研究集中于技术可能性和架构设计等方面,对区块链技术视角下科研人员共享意愿的分析尚不充分。鉴于此,本研究将采用演化博弈的方法,对区块链技术下科研人员共享意愿进行分析,通过对演化稳定策略与机制实施效果的对比分析,提出针对不同情况下的动态激励机制。
在整个科研数据共享体系中,科研人员是科研数据的主要生产者和使用者,科研人员对于数据开放共享的态度在很大程度上决定着科研数据共享的发展和进程,因此,从科研人员角度探讨如何促进科研数据开放共享对推进科研数据的最大化使用具有重要的价值和现实意义。
在数据共享过程中,科研人员的数据共享行为受其数据储备、数据共享风险态度以及客观环境的复杂性与不确定性影响,是一个动态选择及学习调整的过程,符合有限理性的群体行为特征,因此本研究基于演化博弈的方法,引入奖惩机制后科研人员的最优决策。为了构建模型和简化计算,将数据共享博弈模型定义为一个四元组。其中:
在数据共享博弈模型中,科研人员通过计算本次共享收益与共享成本,对是否参与数据共享作出决策。直接收益表示数据提供者参与数据共享可以获得平台的通证奖励,主要与共享数据的价值和系统科研人员的奖励系数有关。奖励系数代表系统对科研人员共享科研数据的奖励力度,在一定程度上可以反映科研人员的历史分享行为。本研究中将采用对数函数来计算直接收益,该函数符合现实社会的经济学特征,即在科研人员数据共享的现实情景中,平台给予科研人员的通证奖励在达到最大值前的增长是边际递减的,有一定的增长抑制,不会随着数据价值的增加而无限提高[23]。数据共享生态中引入通证激励机制后,科研人员的数据共享行为逐渐发展为一种投资行为,持有通证会获得额外的投资收益率,这在一定程度上会激励科研人员积极共享科研数据,朝着共享生态正向发展的方向进行决策,科研人员进行数据共享获得通证的收益率只与共享生态的发展有关。当参与决策的科研人员选择数据共享时,双方数据信息的互补融合会促进科研人员创新,降低问题解决的难度,在该过程中产生间接收益。
科研人员在参与数据共享阶段需要花费一定的数据共享成本,主要包括将数据整理、打包、上传等所耗费的时间、精力,将数据共享的成本记为另一方面,参与数据共享的科研人员会增加相应的风险,共享数据越多越有可能泄露科研人员核心数据或者令其损失知识优势,用数据共享风险系数刻画不同博弈主体的风险态度。
从战略管理角度,Kampakis[22]强调在区块链技术上建立起来的人造经济环境中,通证的发行可以为整个经济环境带来更多的可能性:通过设计激励机制来引导科研人员产生特定的行为,同时结合智能合约的技术手段防止通货膨胀、完成经济自治平衡。当数据共享生态向好发展时,通证在市场上的流通兑换可以为科研人员带来额外的投资收益;当数据共享生态不良发展时,通证持有将会给科研人员造成一定的投资收益损失。以此实现科研人员与数据共享生态之间的激励相容。因此,本研究也考虑到了通证流通兑换的投资效应,引入通证收益率r,即科研人员持有的通证在市场上流通所获得的投资收益率,其值由数据共享生态的发展决定,将直接影响博弈双方的收益。
数据共享博弈模型收益分析中涉及到的参数符号如表1 所示。
表1 模型收益分析的有关符号及其含义
基于数据共享群体的数据共享决策行为的博弈关系及相关定义,得到博弈过程中各群体科研人员的收益函数。两个科研人员的决策情况可以分为以下3 类:
情况一:科研人员1 和科研人员2 都采取数据共享策略。在这种情况下,参与数据共享的双方获得的收益包括通证收益和因获得他人共享数据而产生科研创新成果的间接收益,后者与科研人员个人的科研创新能力有关,同时需要付出数据共享成本并承担数据共享的风险,且受到通证收益率的调节,持有不同数量通证的科研人员在加密货币收益率下的成本/收益是不同的。因此,科研人员1 和科研人员2 数据共享的收益函数分别为:
情况二:科研人员1、科研人员2 均不参与数据共享。这种情况下,科研人员无法获得通证奖励,也无法获得因他人数据共享带来的科研创新等间接收益,不存在参与成本,不承担数据共享的风险。即双方的收益为0。
情况三:科研人员1 参与数据共享,科研人员2 不参与数据共享。在这种情况下,科研人员1 可以获得通证奖励,但由于无法获得科研人员2 的数据,因此无法获得创新收益,需付出数据共享成本,承担数据共享风险,同时还会受到通证收益率的调节。则科研人员1 的收益为:
科研人员2 不参与数据共享时,可以获得科研人员1 因共享数据带来的科研创新等间接收益,但利用其他科研人员共享的数据进行科研创新获得投机收益的“搭便车”行为会遭受惩罚,包括减少合作、降低科研人员声誉等方面(用惩罚系数代表惩罚力度);同时,因其不进行数据共享,既不存在数据共享成本,不承担数据共享风险,也不会受到共享生态中通证收益率的调节。在此情况下,科研人员2 的收益为:
综合以上分析,科研人员在数据共享博弈中形成的支付矩阵如表2 所示。
表2 科研人员数据共享博弈收益矩阵
在本研究的场景下,每个科研人员有两种策略选择:参与或不参与数据共享。科研人员1 选择参与数据共享时的期望收益为:
而科研人员1 选择不参与数据共享活动所获得的期望效用为:
由此得到科研人员1 的平均期望收益为:
因此,选择科研人员1 进行数据共享的复制动态方程为:
同理,科研人员2 进行数据共享的期望收益为:
而科研人员2 选择不参与数据共享活动所获得的期望效用为:
科研人员2 平均期望收益为:
因此,选择科研人员2 进行数据共享的复制动态方程为:
结合上述分析可以得到该博弈模型的雅可比矩阵为:
根据演化稳定策略(ESS)判定条件,可以得到各平衡点的稳定性分析结果,如表3 所示。
表3 科研人员数据共享博弈演化稳定状态分析结果
图1 科研人员数据共享博弈模型均衡点相位
为不失简约性和一般性,参考王倩等[14]的做法,令科研人员1 和科研人员2 共享数据的价值分别为2.5 和10.0,科研人员进行数据共享所付出的成本,且。根据模型参数的定义域及奖惩机制的运行特点,将各参数的初始值设置如表4 所示,同时可以计算出博弈模型鞍点为(0.560,0.365)。
表4 仿真参数设置
采用MATLAB 编程对博弈模型进行仿真模拟,分析不同参数以及双方初始状态对博弈结果的影响,以验证奖惩机制的引入对科研人员参与数据共享的推动作用。以上得出演化博弈的鞍点为(0.560,0.365),由此将初始策略选择概率设定为(0.56,0.37),使其位于紧靠鞍点而又更接近理想均衡点W位置坐标。仿真试验结果如图2 所示,在初始参数设定条件下,当(x,y)=(0.56,0.37),科研人员1 和科研人员2 选择进行科研数据共享的概率都将收敛于1,系统将达到理想的演化稳定状态。
如图3 所示,当科研人员1 进行数据共享的初始概率大于0.56,如(x,y)=(0.60,0.37),科研人员1 和科研人员2 均以更快的速度收敛于理想状态;而当此初始概率小于0.56,如(x,y)=(0.50,0.37),系统将收敛于不良状态。当科研人员2 进行数据共享的初始概率大于0.37,如(x,y)=(0.56,0.40),科研人员1 和科研人员2 均以更快的速度收敛于理想状态;而当此初始概率小于0.37,如(x,y)=(0.56,0.43),系统将收敛于不良状态。
图3 不同初始策略选择概率对科研人员数据共享策略的影响
图4 显示了系统对科研人员1 的奖励系数R1分别为0.10、0.15、0.20和0.25时的演化博弈过程。可见,当奖励力度降低时,双方均收敛于(0,0),无法达到理想状态;反之,当奖励力度加强时,双方会以较快的速度收敛达到(1,1)的理想状态。
图4 不同奖励系数对科研人员数据共享策略的影响
图5 显示了系统对科研人员1 的惩罚系数F1分别为0.30、0.35、0.40、0.45 时的演化博弈过程。当惩罚力度降低时,双方均收敛于(0,0),无法达到理想状态;反之,当奖励力度加强时,双方会以较快的速度收敛达到(1,1)的理想状态。
图5 不同惩罚系数对科研人员数据共享策略的影响
如图6 所示,当科研人员的数据共享风险态度不同时,会影响其最终演化稳定时的策略选择。当科研人员1 对数据共享过程的态度越消极,其有可能面临数据滥用、成果被他人窃取等的风险成本增大,系统将收敛于不良状态;相反,持积极态度时,其数据共享的风险系数降低,系统将以更快的速度收敛于理想状态,即博弈双方都趋向于选择数据共享策略。
图7 显示了r分别为-0.1、0、0.1、0.2 时科研人员1 的演化稳定策略。当r=-0.1 时,数据共享生态处于不良发展中,科研人员持有通证在市场上流通不仅无法获得额外的投资收益,还会贬值,科研人员之间互相进行模仿学习,不断调整自己的策略,使自己的利益最大化,最终会选择不进行数据共享;相反,当r=0.1 或0.2 时,数据共享生态处于向好发展中,科研人员持有通证在市场上可以获得额外的投资收益,最终会选择进行数据共享。由此可以证明,通过设计基于区块链技术的奖惩机制可以实现科研人员数据共享相位和共享生态的绑定,消除两者之间的利益冲突,实现激励的相容性。
图7 不同通证收益率对科研工作者1 数据共享策略的影响
根据图8 可以发现,总体上科研人员采取数据共享的概率随着奖励和惩罚程度的增强而提高。为了进一步对比分析系统奖励程度和惩罚程度对科研人员博弈演化过程的影响,参考汪旭晖等[24]在探究监管机制实施的不同时期,不同的监管奖励对平台电商积极监管策略的影响,将仿真时间分为3 个临界点:15、30、50,分别代表奖惩机制实施的初期、中期和后期。初期,演化时间为0~15,当R1=0.30 与F1=0.55 时,科研人员1 采取数据共享策略的概率均为0.9 且逐渐趋近于1.0;中期,演化时间为15~30,当R1=0.2 时,科研人员1 采取数据共享的概率均在0.5 以上,随着时间的推移,科研人员1 采取数据共享策略的概率趋向于1 的速度较慢,当R1=0.25、0.30 与F1=0.45、0.50、0.55 时,科研人员1 采取数据共享策略的概率逐渐接近于1;后期,演化时间为30~50,当R1=0.2 时,科研人员1 采取数据共享策略的概率在0.9 以上,当R1=0.25、0.30与F1=0.45、0.50、0.55 时,与奖惩制度实施中期变化趋势相同,见图8(a)。由此说明,系统在初期对科研人员1 采取较低程度的奖励和较高程度的惩罚时,促进科研人员进行数据共享策略的效果相同;相反,系统初期对科研人员2 采取较低程度的惩罚和较高程度的奖励时,促进科研人员2 进行数据共享的效果相同,见图8(b)。可见,奖励机制和惩罚机制在实施初期可以互补,对不同的科研人员应考虑实施不同的奖惩程度:对共享数据价值较低者,在初期可以考虑采取较高程度的惩罚和较低程度的奖励,而对共享数据价值较高者,在初期可以考虑采取较低程度的惩罚和较高程度的奖励,以充分提高科研人员的数据共享意愿。
本研究运用演化博弈的方法分析了引入区块链技术和奖惩机制的科研人员数据共享过程,仿真验证各类因素对博弈过程的影响,并采用数值分析描述了不同的案例情况,得出主要结论与管理启示如下:
(1)在奖惩机制实施的初期,当科研人员共享数据的价值较低时,采取较低程度的奖励和较高程度的惩罚会促使其采取数据共享策略;相反,当科研人员共享数据的价值较高时,采取较高程度的奖励和较低程度的惩罚会促使其采取数据共享策略。因此,应综合考虑奖惩机制的实施效果,根据科研人员共享的数据价值采取差异化的奖惩措施,以提高科研人员的数据共享意愿。
(2)在建立健全奖惩机制的基础上提升科研数据共享平台的运营能力,加强共享平台的推广,吸引更多的科研人员加入并共享高质量的科研数据,以促进共享生态的良性发展,提升通证在市场上流通的价值,实现科研人员与平台二者之间的激励相容,使科研人员规范共享数据的行为实现长期稳定。
(3)加强平台的监管力度。区块链技术是完全去中心化的,通过分布式存储方式保证了单一或少数节点遭受攻击时仍然能够保证数据的完备和不被篡改,降低了数据泄漏的风险,科研人员的共享、下载等行为皆可记录,这在一定程度上可以保证科研人员共享数据的安全,可有效提升科研人员的数据共享意愿。
然而,本研究虽考虑了通证收益的特性、数据共享的风险态度等因素,但影响主体策略选择的因素很多,如科研人员间信任程度、共享数据的异质性和互补程度等,未来需要对此作进一步的更深研究。此外,本研究采用数值分析进行仿真试验,参数的取值均参照相关文献,缺少真实数据源的支撑,未来将针对科研人员的数据共享问题通过发放调查问卷等方式获得一手数据,更准确描述模型中的变量参数。