科研人员数据重用意愿的影响因素研究

2020-05-20 07:12魏银珍邓仲华杨改贞黄冈师范学院计算机学院武汉大学信息管理学院
图书馆理论与实践 2020年3期
关键词:科研人员主观意愿

魏银珍,邓仲华,杨改贞△(.黄冈师范学院计算机学院;.武汉大学信息管理学院)

1 引言

信息技术的发展及其在科学研究领域的广泛应用加速了科学数据的产生,形成了以数据驱动计算的“大科学”,使得科学研究范式开始向数据密集型科研范式转变,数据已经不仅仅是科学研究的产出品,更是开展科学研究的基础性资源。因此,科学数据的共享和重复利用已经不再局限于某个领域或某个学科,而是几乎涉及到了所有的领域和学科。在国外,科学数据多被称为Research Data或Scientific Data,两者在本质上并无显著差异,均指科研活动中原始的数据。在国内,科学数据也称科研数据,是科技创新的基础性资源,本研究中的科学数据是指人们在科学研究活动中为特定的研究目的而创建的原始数据,包括观测数据、调查数据、实验和仿真数据,具有可访问、可重复利用、高可靠性等特点,有潜在的研究价值和经济价值。

Karast等认为数据重用是指没有收集数据的人使用数据;[1]Zimmerman认为数据重用是指数据的二次使用,这些数据不由其原始目的定义,而是旨在解决新问题;[2]King指出数据重用包括对已有研究结果的再现,有助于新知识的发现;[3]Fienberg等指出数据共享和重用的目的是让研究再现、增加创新的可能性、提升数据的价值。[4]本研究将数据重用定义为为研究新问题而搜集使用已有的(他人创建的)数据,并将“数据重用”“使用他人的数据”“二手数据”和“数据再利用”视为同义词。数据重用过程包括数据发现、数据选择、数据获取与理解、数据使用等阶段。

2 数据重用意愿影响因素模型构建

2.1 计划行为理论和技术接受模型

本研究采用综合理论框架,将计划行为理论(Theory of Planned Behavior,TPB) 与技术接受模型(Technology Acceptance Model,TAM)进行整合。TPB是一种社会心理学理论,它将个体行为与行为的态度、主观规范以及行为控制相联系。[5,6]在TPB中,对行为的态度、主观规范和行为控制是由个人的态度信念、规范信念和控制信念决定的。本研究使用TPB理论有如下考虑:① 科研人员对待数据重用行为的态度即科研人员对重用他人数据全面的评估;② 科研人员对数据重用的主观规范,即科研人员的社会近他者对其数据重用行为的期望;③ 感知行为控制(或资源促进条件等)即数据资源库或机构的支持。TPB使用意图作为实际行为的代理,解释了态度、主观规范和感知行为控制如何影响科研人员个体参与数据重用行为的意图。

尽管TPB提供了一个理解人类行为如何受到态度、主观规范和感知行为控制等因素影响的基本理论框架,但是并没有揭示影响态度、规范和感知行为控制的特定信念。由于“数据重用的态度”可能受到多种态度信念的影响,故本研究采用TAM来解释科研人员对数据使用的特定认知。TAM认为效用和效率预期可以解释人们采用某一技术的意图,如感知有用性和感知易用性。在数据重用意愿研究中,TAM提供了两个重要的研究构念,即数据重用的感知有用性和感知的努力(与感知的易用性对应),因此将TAM与TPB整合是可行的。为了更好地提供TAM中数据重用的效率预期,本研究将TAM中的“感知易用性”构念改为“感知努力”。同时,本研究还将数据重用中的风险认知整合到模型中,以更好地解释科研人员对数据重用的态度。感知风险主要指数据重用中的潜在风险,如侵犯版权、无法发表其科研成果等。文章基于TPB和TAM,为理解和解释科研人员数据重用意愿提供理论模型,该模型考虑了态度、主观规范和行为控制,提出了特定的态度信念,这些信念表达了科研人员对数据重用的态度从而改变他们的行为意图。文章的研究假设和模型均基于上述理论框架。

2.2 研究假设与理论模型构建

2.2.1 研究假设

(1)假设H1:感知有用性正向影响科研人员对数据重用的态度。感知有用性(Perceived Usefulness,PU)是指科研人员相信他们通过使用其他科研人员的数据而受益的程度。在TAM中,PU是决定一个人是否使用信息系统的构念之一,被理解为一个人认为使用某个系统会增加相关的工作绩效的程度。[7]科研人员重用数据的决定主要基于所预期的好处和现成的数据符合其研究需要的观点。[8]Pienta等认为提高科研产出的效率是数据重用的动力之一。[9]数据重用者意识到利用现有数据可以提高其研究效率,因此,如果数据与研究主题相关且能够解决研究问题,那么,科研人员将愿意利用现有数据进行研究。

(2)假设H2:感知风险负向影响科研人员对数据重用的态度。感知数据重用的风险(Perceived Risk ofDataReuse,PR)是指科研人员认为数据重用会涉及潜在风险的程度,如使用他人的数据会降低研究发表机会,或因使用他人数据造成侵犯版权行为。Yoon指出在社会科学领域中,科研人员对数据重用表示担忧,由于数据重用者在尝试发表重用现有数据的文章时遇到困难。[10]另外,数据表示不当、信息本身在传递过程中丢失、上下文信息的缺失也是数据重用者所担心的问题。[11]感知风险的因素包括数据重用中涉及的潜在风险,Wu等扩展了TAM模型,使其包含了感知风险构念,[12]这些潜在的风险可能会导致科研人员对重复利用其他科研人员的数据持消极态度。

(3)假设H3:感知努力对科研人员重用数据的态度具有负向影响。假设H4:感知努力对科研人员重用数据的意愿具有负向影响。感知努力(Perceived Effort,PE)是指科研人员认为数据重用需要时间和精力以获取其他科研人员的数据且处理该数据使之符合当前要求需要的程度。在TAM模型中,Davis使用“易用性”作为模型构件,指用户认为使用系统将花费很少力气的程度。[7]本研究使用“感知努力”而不是“感知易用性”,是为了强调数据重用过程中所期望的努力程度。数据重用文献研究显示,当数据重用者花费较少的时间和精力获取和处理数据时,他们对重用数据的满意度会提高。[13]

(4)假设H5:数据重用的主观规范对科研人员重用其他科研人员数据的态度具有正向影响。假设H6:数据重用的主观规范对科研人员重用其他科研人员数据的意愿具有正向影响。数据重用的主观规范(Subjective Norm of Data Reuse,SN)是指科研人员认为数据重用在其所在的研究社区实践中普遍存在或者被接受的程度。早期针对特定学科和跨学科的数据重用的研究表明,数据重用实践具有多样性和学科特征,[14,15]缺乏数据重用规范会对科研人员的数据重用行为产生不利影响。[16]由此,SN会对科研人员对数据重用的态度产生正面影响,提高科研人员对数据重用的意愿。

(5)假设H7:对数据重用的态度正向影响科研人员重用数据的意愿。对数据重用的态度(Attitude,A)是指科研人员认为数据重用有好处的程度。TPB理论表明个体对某种行为所持有的态度极大地影响其对该行为的意愿。

(6)假设H8:数据资源的可用性对科研人员重用数据的感知努力具有负向影响。假设H9:数据资源的可用性对科研人员重用数据的意愿具有正向影响。数据资源的可用性(Availability of Data Repository,ADR)是影响科研人员数据重用的重要因素,数据资源的基础设施和促进利用的条件被认为是TPB中的外部行为控制因素。[17]数据资源可以降低感知努力,并影响科研人员关于数据重用的实际行为,科学数据资源在数据重用中发挥着重要作用,其不仅提供简单的数据访问,还通过提供增值服务来确保当前和未来数据使用。[18]数据资源的功能、声誉和结构有助于科研人员决定是否信任并重用数据,良好的功能、较高的社会声誉以及以用户为本的数据资源结构的设计将促进科研人员从存储库中重用数据。[19]因此,数据资源的高可用性将减少科研人员的感知努力,并促进其数据重用的意愿。

(7)假设H10:感知数据质量对重用数据的意愿具有正向影响。假设H11:感知数据质量对感知努力具有负向影响。数据质量可以从技术属性和科学属性两个方面来理解,技术属性包括元数据、文档、文件格式等,科学属性包括适当的收集方法、有效性、可靠性。数据重用与否需要考虑的信任情境包括:数据重用者明确需要数据重用,但又缺乏确保数据质量的标准,并且数据重用者意识到使用不当的数据可能对研究造成的潜在危害。2.2.2 理论模型构建

基于上述概念,本研究构建了科研人员数据重用意愿影响因素研究模型(见图1),以测量数据重用的感知有用性、感知风险、感知努力以及这些感知因素认知对数据重用态度的影响。

图1 研究模型与数据重用意愿假设

3 研究方法

本研究采用调查问卷方法对科研人员的数据重用情况进行评估。调查问卷主要通过电子邮件和社交网络发放,共回收239份问卷,其中有效问卷222份。各个理论变量的测量问项使用了从“非常不赞同”到“非常赞同”的7分李克特量表,采用结构方程模型方法分析各个变量之间的影响路径和强度。

(1)样本选择。本研究对研究样本所在机构和学科背景以及科研用户的经验等方面进行了控制。样本主要来源于“985”“211”研究型高校和重点科研院所,年龄低于25岁者不列入本次研究范畴,从未进行过数据重用的科研用户不列入本研究范围。

(2)理论变量的测量。表1为8个理论变量所属的27个测量项目。

表1 测量项目列表

4 研究分析

4.1 样本人口统计

研究样本中有139名男性(63%)和83名女性(37%);平均年龄为37岁,其中25-34岁共112人(50%),35-44岁共73人(33%),45-54岁共33人(15%),55-64岁和65岁以上的分别为3人和1人(共 2%)。

在学历方面,被调查者学历均为本科以上,其中博士81人(37%),硕士94人(42%),本科47人(21%)。

从工作年限来看,10年以上的66人(30%),5-10年的36人(16%),3-5年的42人(19%),3年以下的78人(35%)。

所调查的样本人群中共有正高级职称20人、副高级职称64人、中级职称39人、初级职称22人、其他(在读博士和在读硕士)77人;从学科背景来看,有68人属于人文社会学科、137人属于理工类学科、17人属于农林医学类学科;数据重用经历调查中,有77人经常重用数据(35%),70人偶尔重用数据(32%),很少重用数据的有41人(19%),选择“几乎不”的有18人(8%)。

4.2 测量模型评价

在实际数据分析之前,需要对测量模型的信度和效度进行评价。

(1)通常使用Cronbachα系数、组合信度(CR)和平均方差萃取量(AVE)值作为信度评价指标,测量模型的评价结果见表2。所有测量项目的Cronbachα系数均在0.831(数据资源的可用性)到0.958(感知数据质量)之间,超过了0.70的可接受值;CR值从0.897(数据资源的可用性)到0.971(重用数据意愿),也都高于0.70的可接受阈值;AVE值从0.701(感知风险)到0.960(感知数据质量),所有的值都在可接受阈值0.50以上。

表2 测量模型信度评价结果

(2)模型效度的检验测量包括收敛效度和区分效度,本研究采用理论变量的平均方差萃取量AVE的平方根与理论变量之间的相关系数的比较关系来评价测量模型的收敛效度和区分效度。如果AVE的平方根的值高于不同理论项目之间的相关系数的值,则表明测量具有较好的收敛效度和区分效度。从表3可以看出,AVE的平方根(对角线粗体数字)大于不同理论变量的项目之间的相关性(下三角非粗体数字)。AVE平方根的范围从0.838(感知风险)到0.958(对数据重用的态度),均大于不同理论变量的项目之间的相关系数。测量模型评估结果表明,每个理论变量的测量结果可靠、有效,可用于结构模型评估的进一步分析。

表3 效度评价结果

4.3 结构模型拟合验证

本文使用偏最小二乘法结构方程进行模型的路径分析。基于SmartPLS2.0,采用Bootstrapping算法,设置1,000的随机抽样,计算结果见表4。其中,T值在1.96(p=0.05)以上均对应显著性水平为p=0.05,T值在2.58以上均对应显著性水平为p=0.01,表示路径关系显著。

表4 路径分析结果

综上,数据重用意愿的影响因素按照影响效应大小依次为对数据重用的态度、主观规范和感知数据质量,其路径系数分别为0.531、0.228和0.111,均在0.05概率水平下显著,同时未发现感知努力和数据资源的可用性对数据重用意愿有直接影响。在影响科研人员对数据重用态度的诸因素中,按照影响效益大小依次为感知有用性、感知努力、感知风险和主观规范,路径系数为依次为0.421(p<0.01)、-0.208 (p<0.01)、-0.138 (p<0.05)、0.141 (p<0.05)。研究结果还发现,虽然数据资源的可用性对数据重用意愿没有显著影响(路径系数0.031,p>0.05),但其通过感知努力间接影响数据重用态度,最终影响数据重用意愿,没有发现感知努力对科研人员的数据重用意愿有任何重要影响(路径系数为0.026,p>0.05)。在结构模型中,数据重用的态度、主观规范和感知因素一起解释了科研人员数据重用意图总变异的60.4%(R2=0.604)。图2显示该模型拟合检验结果,表5总结了研究假设的检验结果。

图2 路径模型分析结果

表5 假设检验结果

5 研究结论与建议

本研究融合TPB理论和TAM模型提出了影响科研人员数据重用因素的整体理论概念模型,同时,基于扎根理论得出科研人员数据重用的态度和意愿也受到外部环境的影响。

(1)从描述性统计数据来看,科研人员数据重用意愿的均值达到4.99,说明科研人员有较高的数据重用预期。在影响数据重用意愿的因素中,感知数据质量的均值达到5.595,说明规范的数据管理和可靠准确的数据是科研人员愿意利用数据的前提,同时感知风险因素的均值也达到了4.99,说明科研人员在数据重用过程中最为担心的是重用数据可能会带来的侵犯版权行为、对数据理解不够透彻、研究成果发布受阻等问题。

(2)依影响效应强度排列,直接影响科研人员数据重用意愿的因素依次为对数据重用的态度、主观规范和感知数据质量,其路径回归系数分别为0.562、0.248、0.097。

(3)依影响效应强度排列,对数据重用的态度的影响因素依次为感知有用性、感知努力、感知风险和主观规范,其中感知有用性和主观规范是正向的影响,其回归系数分别是0.408和0.123,感知努力和感知风险为负向的影响,回归系数分别是-0.223和-0.169。科研人员之所以考虑重用他人的数据,是因为他们认为这样做可以提高其研究效率、提升其研究能力。同时,科研人员对数据重用的积极态度正面影响其重用数据的意愿,那么对其进行教育和宣传将是促进数据重用的第一步,这就要求学术界在降低潜在数据重用风险的同时,引导科研人员正确使用数据。

(4)感知数据质量和数据资源的可用性对感知努力有负向的影响,其路径回归系数分别为-0.388和-0.217。尽管未发现数据存储库的可用性与数据重用意图存在显著关系,但它通过其对感知努力的影响间接地影响数据重用态度,进而影响数据重用意愿。这一发现表明数据资源的可用性可以降低获得数据所做的努力,数据重用过程中较低的努力预期可以增加科研人员数据重用的态度,此外,对数据重用过程中所付出的精力、时间成本的认知对科研人员对数据重用的态度有较大的负面影响。因而,可通过科学数据共享平台提供相应的支持来减少科研人员重用数据过程中所作出的努力。

(5)本研究发现既有社区和学科数据重用规范对数据重用态度和数据重用意愿均有显著的积极影响。当科研人员认为数据重用被学术社区和学术界所倡导和接受时,他们更有可能拥有强大的数据重用规范并对数据重用抱有积极的态度。因此,学术界需要一种更好、更强的数据重用的规范,以促成科研人员更加活跃的数据重用行为。到目前为止,很少有研究定义科学界各个领域中数据重用的规范具体是什么,但是有些领域有更积极的数据重用文化,如地球系统科学、农业科学、社会科学等。即便在特定领域内,数据重用的主观规范也可能根据所完成的研究类型而有所不同,在实际数据重用的不同水平上反映出不同的规范。无论是否有强大的数据重用规范,进一步探索各学科中的数据重用行为都将有助于更好地理解主观规范在数据重用中的影响,有助于更好地理解和帮助科研社区创建数据重用文化。

猜你喜欢
科研人员主观意愿
健全机制增强农产品合格证开证意愿
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
科研人员揭示油桃果实表皮不长毛的奥秘
“美好生活”从主观愿望到执政理念的历史性提升
科研人员破译黑猪肉特征风味物质
汪涛:购房意愿走弱是否会拖累房地产销售大跌
加一点儿主观感受的调料
挣多少钱,才可以买到快乐
企业科研人员激励问题及对策研究
对立与存在