邓灵斌 肖洪伟
摘 要 在國家创新发展过程中,科学研究、产业发展、政府决策越来越依赖于科学数据及对其分析的能力。在推动科学数据应用的过程中,加快开放和共享是核心问题,而加强科学数据共享意愿则是其中的关键。为了证实这一关键,本研究以计划行为理论和社会影响理论为基础,构建了科学数据共享意愿的理论模型。采用问卷调查收集数据,利用SPSS24.0检验模型假设,并对验证结果进行了分析,结果表明,互惠关系和人际信任对共享态度有积极影响,主观规范和共享态度对共享意愿有积极影响。文章最后对如何促进科研人员之间的数据共享提出建议。
关键词 科学数据 数据共享 共享意愿 计划行为理论 社会影响理论
分类号 G252
DOI 10.16810/j.cnki.1672-514X.2021.05.003
The Empirical Research on the Willingness of Scientific Data Sharing Among Scientific Researchers in Chinese Universities
Deng Lingbin, Xiao Hongwei
Abstract Scientific research, industrial development, and government decision-making rely more and more on scientific data and its ability to analyze. In the process of promoting the application of scientific data, accelerating openness and sharing is the core issue; at the same time, strengthening scientific data sharing willingness is the key factor. Based on the theory of planned behavior and the theory of social influence, this study constructs a theoretical model of the willingness to share scientific data. Data were collected using a questionnaire and the model hypothesis was tested using SPSS 24.0. Finally, the verification results were analyzed and suggestions were made on how to promote data sharing among researchers. The empirical analysis shows that reciprocal relationship and interpersonal trust have a positive impact on sharing attitudes, and subjective norms and sharing attitudes have a positive impact on sharing willingness.
Keywords Scientific data. Data sharing. Sharing willingness. Theory of planned behavior. Social impact theory.
Abstract Scientific research, industrial development, and government decision-making rely more and more on scientific data and its ability to analyze. In the process of promoting the application of scientific data, accelerating openness and sharing is the core issue; at the same time, strengthening scientific data sharing willingness is the key factor. Based on the theory of planned behavior and the theory of social influence, this study constructs a theoretical model of the willingness to share scientific data. Data were collected using a questionnaire and the model hypothesis was tested using SPSS 24.0. Finally, the verification results were analyzed and suggestions were made on how to promote data sharing among researchers. The empirical analysis shows that reciprocal relationship and interpersonal trust have a positive impact on sharing attitudes, and subjective norms and sharing attitudes have a positive impact on sharing willingness.
Keywords Scientific data. Data sharing. Sharing willingness. Theory of planned behavior. Social impact theory.
大数据时代,科学数据已成为支撑国家创新发展的珍贵资产和战略资源。随着我国科技投入的不断增长,各类科学研究、产业发展、政府决策等需要建立在对科学数据的分析和应用基础之上,使科学数据呈现出“井喷式”增长。为了不断提升科技创新能力,持续汇聚和整合本国乃至全球科学数据资源,有必要在推動科学数据应用的过程中,加快科学数据开放和共享,这是加强和规范科学数据管理的核心问题。我国首部关于科学数据管理与共享的法律规范——《科学数据管理办法》已于2018年3月17日正式发布实施,这对加强与促进我国科学数据管理的法制化、提高科学数据的安全、共享保障具有重要意义[1]。科学数据共享正成为人们认识科学的新钥匙、知识发现的新引擎,而提高科研人员的积极性、加强科学数据共享的意愿则是关键环节。
1 目前相关研究简要述评
对于科学数据共享意愿的分析研究起始于1986年[2],国外这方面的研究较早。通过在CNKI、Web of Science等中英文数据库检索有关“科学数据共享意愿”文献,在比对、分析的基础上得知,主要涉及医学、计算机信息管理、生物科学等领域,在研究方法上大多采用通过大规模的现场访谈和调查表来收集研究数据并加以分析,其研究结果表明这些领域的科研人员科学数据共享意愿相对较强。
相比之下,我国科学数据共享意愿的研究起步较晚,但研究成果增长迅速。张晋朝在构建科研人员数据共享研究模型的基础上进行分析研究,其结果显示,主观规范对科学数据共享意愿存在直接显著性影响,而信念则仅存在间接影响[3];何琳、常颖聪在计划行为理论基础上引入经典行为预测理论和技术接受模型,将科研人员对数据共享的态度、疑虑等加入调查问卷中,并提出促进科研人员数据共享的策略建议[4]。周珊珊等学者分析了科学数据共享中存在的“邻避现象”,并采用干预培训方法来解决,通过实践证实了干预培训可以明显提高科研人员数据共享的意愿[5]。吴丹、陈晶等学者通过对比分析医学从业者数据共享意愿的特点,提出了实施不同的数据共享激励措施[6]。傅天珍、郑江平还研究了国外科学数据共享的影响因素,指出开放获取压力、个人利益权衡、技术与标准问题、利他心理和文化法律等五个因素是共享意愿的关键[7]。余玲通过问卷调查和分析,指出组织氛围、主观规范和共享态度对科学数据共享意愿有显著的正向影响[8]。罗晓兰、李明通过研究认为国内期刊实施的数据共享政策直接影响作者的投稿意愿[9]。郑琳对国内外科研人员数据共享的意愿及其影响因素研究进行述评,并提出相关建议[10]。邹威威以计划行为理论为基础,对支付宝用户消费数据的共享意愿进行了分析,并提出相应对策[11]。
综上所述,国内外有关科研人员数据共享意愿的研究已取得一定的成果,从研究内容来看,主要是围绕科学数据共享意愿的影响因素、数据共享存在的阻碍、数据共享行为的激励等多个方面来开展研究。由于研究领域的不同,国内外科研人员的数据共享意愿也有差别。国外的研究往往围绕特定的领域,针对性较强,国内的研究一般没有特意地针对某一领域,显得较为宽泛,研究层次相对较浅。因此,本研究准备调查某一研究领域,如医学领域、计算机技术领域、经济管理领域等的科研人员的科学数据共享意愿。在研究方法上,国外大多数采用的是大规模的访谈及调查表,以获取较多的数据并进行深层次的挖掘;国内的研究大多数以小规模的形式进行,通过问卷调查、干预实验、文献分析等方法进行数据共享意愿方面的研究。总体来看,虽然目前的研究内容涵盖了数据共享的主要方面,但涉及社会影响因素与科研人员科学数据共享意愿的研究甚少,本文将在社会影响理论和计划行为理论相结合的基础上进行科学数据共享意愿的研究。
2 理论基础及研究模型构建
2.1 影响共享意愿的理论基础
影响个体共享意愿层面不仅包含个人层面,也有社会影响层面,因此根据计划行为理论对人的行为意愿的新解释和预测,结合社会影响理论三种影响人的行为态度的机制(顺从、认同、同化),以此分析研究影响其共享态度与共享意愿的相关社会因素,如物质激励、互惠关系、人际信任等。
计划行为理论[12-13]在理性行为理论的基础上增加了一项感知行为控制变量,完善了个人对特定行为缺乏实质性控制的问题,其核心是使用行为态度、主观规范和感知行为控制3个变量共同来解释和预测行为意愿。计划行为理论作为社会心理学领域广泛认同的理论,成功地应用于众多领域[14],其被绝大多数研究证实它能用来解释和预测人们参与各种活动的意愿和行为。
社会影响理论的核心在于指出了顺从、认同、同化三种影响行为态度的机制[15]。在某种社会因素的影响下,顺从是指个体为了获得物质回报或者避免惩罚而采取某项行为;认同是指为了维持或建立良好关系而采取某项行为;同化是指个体认为某项行为与自己的价值观相吻合且助于实现自身价值。在此基础上,Venkatesh和Davis对其进行了修订[16],指出顺从产自于控制性社会影响因素,会直接作用于个体的行为意愿,并不会改变个体的行为态度。个体仅是将诱导行为视为工具或手段,而不会将其视为真实信仰[17-18]。例如,在某种社会影响因素(物质激励)作用下,个体对某项行为(数据共享)表现出公众附和,但该行为态度转变是表面化的,个体的价值观并未发生改变。在另一种社会影响因素(互惠关系、人际信任)作用下,个体会发自内心接受某项行为(数据共享),这种态度转变是由内及外的,并且根植于个体的价值观。由此,在社会因素中,有部分是通过顺从机制直接影响共享意愿,也有部分是通过认同与同化机制影响共享行为态度,从而间接影响共享意愿。
一般认为,科学数据共享意愿分为两个方面:一是捐赠意愿,即向他人提供、交流自己所拥有科学数据的意愿;另一个是收集意愿,即通过询问、搜寻来获取他人所拥有科学数据的意愿;这二者共同决定科学数据共享意愿的强烈程度。
2.2 影响共享意愿变量的研究假设
以上述理论为基础,同时为保证变量测量的准确性,借鉴学术界较成熟的量表来进行研究,本研究的因变量为知识共享意愿,并确立6个自变量,分别为共享态度、主观规范、感知行为控制、物质激励、互惠关系、人际信任。
(1)共享态度与科学数据共享意愿。结合计划行为理论和社会影响理论认为,共享态度对科学数据共享所持的正面或负面感觉直接影响科学数据共享意愿,共享态度的形成也受到互惠关系、人际信任等其他社会因素的影响。本研究把科学数据共享态度作为一个因变量,并提出第一个假设:
H1:共享态度会积极影响科学数据共享意愿
(2)主观规范与科学数据共享意愿。主观规范是指他人或群体对个体行为决策的影响程度,亦即个体所感知到进行科学数据共享决策时所面临的社会压力;主观规范将对组织、个人的科学数据共享意愿产生积极影响。因此,提出第二个假设:
H2:主观规范会积极影响科学数据共享意愿
(3)感知行为控制与科学数据共享意愿。感知行为控制能反映出个体是否具有科学数据共享所需的资源及是否把握共享相关的机遇[19],亦即个体对执行科学数据共享行为的难易掌控程度;个体对信息技术的感知行为控制对知识共享意愿、组织信息化知识共享行为有一定促进作用。基于此,提出第三个假设:
H3:感知行为控制会积极影响科学数据共享意愿
(4)物质激励与科学数据共享意愿。物质激励是指通过满足数据共享人员的某些需求,来调动和激发该人员的数据共享积极性。在经典的激励理论中,物质激励是激励人员常用的激励手段。对于科学数据共享行为,阻碍其共享的因素之一是数据捐赠者担心会丧失自己的数据优势,可能会降低其竞争力,因此造成科学数据共享积极性降低。而一定程度的物质激励手段可能降低科学数据共享的阻碍,对数据共享人员之间的共享意愿产生积极作用。据此提出第四个假设:
H4:物质激励会积极影响科学数据共享意愿
(5)互惠关系与科学数据共享态度。互惠关系是指交换双方期望通过交换来获取各自利益、满足自身需求的一种联系方式。社会交换理论指出,交换活动的价值体现于能获取相应的经济资源或社会情感资源;互惠关系作为一种情感资源获益非常有效的社会交换活动,将积极作用于组织和个体之间的知识共享行为。当个体相信能通过与他人共享科学数据而获得互惠关系时,将会产生积极的数据共享态度;基于此,提出第五个假设:
H5:互惠关系会积极影响科学数据共享态度
(6)人际信任与共享态度。人际信任是指个体将他人的言词、许诺或口头、书面陈述视为可靠,并承诺付诸实施的情感关系,一般分为认知信任和情感信任两方面。当个体对他人产生信任时,将会愿意向他人提供数据资源以促进数据共享行为。在科学数据共享的大环境中,个体之间的人际信任越强,数据共享的态度也会越强,那么数据共享行为就易发生。基于此,提出第六个假设:
H6:人际信任会积极影响共享态度
2.3 研究模型构建设计
由以上理论基础和假设可知,对科研人员的物质激励及科研人员的共享态度、主观规范与感知行为控制能正向影响科研人员数据共享意愿;科研人员之间的互惠关系及人际信任能正向影响科研人员的数据共享态度,推测其变量之间存在着一定的因果关系,故构建理论研究模型如图1所示。
3 科学数据共享意愿调查问卷设计及信度检测
本研究选取了湖南省一些典型高校作为此次调查的对象。调查问卷通过线上与线下结合的方式进行发布,在线上通过社交平台将网络问卷的链接发给一些高校的师生,并请他们帮忙转发。在线下通过拜访学院寻找老师帮忙填写,咨询并前往研究生上课地点发放纸质问卷,以此达到足够的问卷数量。经过一个月的问卷发放,共回收了307份问卷,其中有261份合格。考虑到研究的需要,其中约70%的受访者为硕士及博士,具备一定的科研经历,属于学历层次较高的群体(硕士以上),而本科生因缺少科研经历而未被纳入此次调查范围。
问卷中设计的主要问题多数采自于国内外成熟量表,基于上述各假设,共设计了29个问题,其中,人际信任共设计6个测量题;物质激励共设计4个测量题;主观规范共设计4个测量题;互惠关系、共享态度、共享意愿、感知行为控制,分别设计4、5、3、3個测量题。对于回答设计,设计了非常不同意、不同意、中立、同意、非常同意。
为了检验测量结果是否具有稳定性、可靠性和可预测性,本研究进行信度与效度检测。对于量表来说,通常使用Cronbach'sAlpha系数来评价量表中各题项得分间的一致性。效度是指问卷内容是否能真实反映所调查的内容,常通过结构效度和内容效度进行评判[20]。表1为使用数据分析软件SPSS24.0得出的信度和效度检验结果。
问卷中量表的总体α值达0.872,其中各变量的α值也均在0.7以上,说明问卷的内在一致性信度较好,即本次调查收集的数据可信性高。而各变量的Bartlett球形检验的显著水平低于0.05,且对应的KMO值均大于0.6,表明各变量适合做因素分析。
4 科学数据共享意愿调查描述性统计分析
在进行信度、效度分析之后,发现调查问卷的总体信度及效度不错,因而收集到的数据是可信的。下面针对调查样本作进一步的描述性统计分析。
4.1 受访者特征统计分析
受访者的基本信息如表2所示。在收集到的样本中,男女比例比较接近(经济管理类的受访者居多),女性比例略高一点,占51.3%。年龄方面,35岁以下的受访者居多,超过样本总体的60%,主要是因为科研群体中的成员大多偏年轻,硕士研究生占有较大比例,为样本的90%。通过分析,样本的数据是合理的,但科研的代表性尚有待加强。
4.2 各变量的描述性统计
对各变量数据进行集中趋势的均值分析,以便对比各变量的总体差异及反应各变量的总体情况。从表3可看出,各变量的均值都大于3,这说明参与本次调查的受访者对科学数据的共享意愿较为积极。其中,感知行为控制得分最低,说明被调查人员对科学数据的支配能力较低,可能原因有二:一是受访者中有近一半是数据收集者,科学数据的支配能力相对较低;二是受访者大多为硕士生,对科学数据共享活动的参与程度不高。
4.3 人口特征对研究变量的差异分析
为了进一步确保后续分析结果的可靠性,需排除年龄、性别和学历水平等对结果带来差异的因素。采用独立样本T检验对性别差异进行分析,结论如表4所示。其中,除主观规范(0.036)外,各变量方差检验的相伴概率值p均大于显著性水平0.05。也就是说,在科研人员数据共享中性别对主观规范的影响有显著差异,对其他各变量的影响无显著性差异。由于年龄分组较多,使用独立样本F检验方法,结果显示:共享态度的显著水平(0.008)小于0.05,说明在年龄特征上有显著的差异。其他各变量的显著水平都大于0.05,说明在年龄特征上并没有显著的差异。
4.4 相关分析
相关分析的目的是为了探求各变量之间是否存在某种关联,在此之前已通过各变量对共享态度和共享意愿的散点图进行了线性假设判断。在确定各变量之间存在线性假设后,进行Person相关分析,结果如表5所示。
人际信任和互惠关系与共享态度的相关系数分别为0.575和0.411,均大于0.3,这说明人际信任与共享态度存在正向中强度关联;也就是说,人际信任和互惠关系的值越高,共享态度也越强烈。物质激励、共享态度、主观规范和感知行为控制与共享意愿的相关系数分别为0.656、0.525、0.717和0.564,也都大于0.3,符合本研究所作的假设。
5 科学数据共享意愿和共享态度回归分析
在模型1中以共享意愿为因变量,物质激励、共享态度、主观规范和感知行为控制为自变量进行分析;在模型2中以共享态度为因变量,人际信任和互惠关系为自变量,对模型进行共线性诊断和回归分析,结果如表6、表7和表8所示。
表6中物质激励、主观规范、共享态度和感知行為控制的容差值逼近于1,且VIF值均小于10,表明自变量相互独立,不存在多重共线性。表7中调整后的R方为0.420,说明物质激励、主观规范、共享态度和感知行为控制解释了共享意愿的42.0%。表8中方差分析的检验结果的显著水平低于0.05,表明回归效果良好。
表6中主观规范和共享态度对共享意愿的回归均在显著性水平0.05之下,因此假设H2、H1成立;同理,假设H5、H6成立。而物质激励和感知行为控制的Sig.值均大于0.05,说明物质激励和感知行为控制对共享意愿的回归不显著,也即假设H3、H4不成立。表9为该研究进行回归分析的假设检验结果。
6 结果汇总及策略建议
本研究从结果来看,总体上共享意愿的均值为3.6分,少于“同意”的4分分值,表明参与本次共享意愿调查的科研人员的意愿处于中等偏上的水平,但因样本的代表性不错,也反映出我国高校科研人员的数据共享意愿还有待加强。人际信任、共享态度、主观规范、互惠关系、物质激励和感知行为控制对共享意愿的相关系数都大于0.3,表明各变量之间存在着中等强度的正相关。
但是,物质激励对共享意愿的影响并不明显,这与预期假设不一致。笔者认为,物质激励不能直接影响共享意愿,可能的原因有两点:第一,研究者不重视科学数据共享所提供的物质奖励,而仅仅是为了科学研究而分享数据。第二,本研究中大部分受访者是数据共享的接收者,由于仅是接收而未进行捐赠,自然也体会不到捐赠所带来的物质奖励,所以也会在某种程度上降低物质激励对共享意愿的贡献程度。
除此以外,感知行为控制没有显著正向影响共享意愿,这点与计划行为理论模型中反映的结果不一致。分析其原因可能有:第一,计划行为理论中的态度、主观规范和感知行为控制对共享意愿的解释并不一定都涉及,可能只涉及一两个因变量。第二,因为样本中数据接收者居多,接受者对自身数据和资源的掌控程度相对较低,促使感知行为控制的均值较低,这导致感知行为控制对共享意愿的解释程度偏低,甚至低至显著水平以下,成为不可能发生的小概率事件。
通过上述分析,可从以下四个层面提出建议供参考,希望能提高科研人员共享科学数据的意愿。
(1)从国家和国际组织层面看,应该加快国家和国际科学数据共享工程的建设进程,扩大科学数据共享平台的分布,使共享的氛围深入人心,让更多的科研人员树立更好的主观规范,让其懂得数据共享是大势所趋,具有国家层面的强大支持,以降低科研人员共享数据所面临的压力,从而提升科学数据的利用率和实现价值。
(2)从政府及研究机构层面看,应完善相应的政策法律,以提高科研人员数据共享的信任度,使科研人员不再担心自身知识产权是否会被侵犯的问题,如果被侵犯也能得到很好的保障;在共享数据得到一定的保障时,也须充分认识到对科学数据进行信息化管理的重要性,通过信息化的痕迹管理,提升科学数据共享管理安全性。
(3)从科研团队层面看,良好的科研团队合作氛围可以激发科研人员对数据的共享意愿,同时能影响科研人员的习惯。如果能在科研团队内部营造一种信任、平等、合作与奉献的共享氛围,那么科研人员能在团队数据共享中得到良好的感知体验,这种良好的感知同样能激发科研人员科学数据共享的意愿。
(4)从科研人员本身层面看,应不断学习接受教育,提升自身的科学数据文化素养,并对科学数据共享行为有一个正确的理解;让科研人员做一个“数据开放共享”的倡导者,树立正确的“拿来主义”观念,合理借鉴和参考别人的成功经验,同时尊重他人的知识产权和智力劳动成果,实现双方的互惠共赢。
参考文献:
[1]人民政协网.《科学数据管理办法》出台,科学数据管理要“以用为主”[EB/OL].[2019-07-22].http://whkj.rmzxb.com.cn/c/2018-04-18/2028312.shtml.
[2]NEUHAUSER D. Sharing research data[J].Medical care,1986,24(10):879-880.
[3]张晋朝.我国高校科研人员科学数据共享意愿研究[J].情报理论与实践,2013,36(10):25-30.
[4]何琳,常颖聪.科研人员数据共享意愿研究[J].图书与情报,2014(5):125-131.
[5]周姗姗,翁苏湘,毕强,等.科学数据共享中的邻避现象及应对研究[J].图书情报工作,2015,59(17):84-88.
[6]吴丹,陈晶.我国医学从业者科学数据共享行为调查研究[J].图书情报工作,2015, 59(18):30-39.
[7]傅天珍,郑江平.国外面向科研人员的科学数据共享探析[J].图书馆论坛,2015(2):76- 81.
[8]余玲.科研人员科学数据共享意愿的影响因素研究[D]. 衡阳:南华大学,2016.
[9]罗晓兰,李明.国内期刊论文科学数据共享政策与投稿意愿研究[J].中国科技期刊研究,2017,28(8): 696-703.
[10]郑琳.科研人员数据共享意愿及影响因素研究述评[J].图书馆理论与实践,2018(9):39-44.78.
[11]邹威威.支付宝用户消费数据共享意愿影响因素研究:基于計划行为理论[J].当代经济,2019(3):82-83.
[12]AJZEN I,MADDEN T J . Prediction of goal-directed behavior: Attitudes, intentionsand perceived behavioral control[J]. Journal of Experimental Social Psychology, 1986, 22(5):470-474.
[13]AJZEN I.The theory of planned behavior[J].Organizational Behavior & Human Decision Processes, 1991, 50(2):179-211.
[14]段文婷,江光荣.计划行为理论述评[J].心理科学进展,2008,16(2):315-320.
[15]KELMAN H C. Compliance, identification, and internalization three processes of attitude change[J]. Journal of Conflict Resolution, 1958, 2(1):51-60.
[16]DAVIS V F D. A theoretical extension of the technology acceptance nodel: four longitudinal field studies[J]. Management Science, 2000, 46(2):186-204.
[17]黄彦婷, 杨忠, 金辉,等.基于社会影响理论的知识共享意愿产生模型[J].情报杂志,2013,32(6):141-146.
[18]金辉,杨忠,黄彦婷,等.组织激励、组织文化对知识共享的差异化作用机理:基于修订的社会影响理论[J].科学学研究,2013,31(11):97-107.
[19]ROWHANI-FARID A, ALLEN M, BARNETT A G, et al.What incentives increase data sharing in health and medical research? A systematic review [J].Research Integrity & Peer Review,2017,2(1):4.
[20]数据分析培训.KMO和Bartlett 的球形度检验[EB/OL].[2019-09-18].http://www.cdadata.com/8145.