国内研究生科学数据素养能力评价及高校图书馆培养体系构建研究

2021-12-06 07:58叶新友张路路孔成果
农业图书情报学刊 2021年11期
关键词:研究生科学素养

叶新友,张路路*,孔成果,张 群

(1.江南大学图书馆,无锡 214122;2.中央财经大学图书馆,北京 100081)

1 引言

科学数据素养是“数据密集型时代”科学研究人员应必备的能力之一,研究生作为高等学校科学研究主力军,其科学数据素养能力是开展科学研究的必备技能,也是研究生阶段应培养的核心能力之一。高校图书馆承担着环境育人、管理育人、教育育人、服务育人的责任,对学生素养教育起着至关重要的作用。

目前高校图书馆对于研究生科学数据素养教育的研究主要集中在两个方面,一方面是从宏观角度提出数据素养教育体系[1],另一方面是开展实证研究,通过对研究生数据素养能力进行调研评价,提出相应的培训讲座[2]或开发相应软件[3]来提高素养。通过文献调研整体来看,国内高校图书馆研究生科学数据素养教育仍处于起步和探索阶段[4],同时基于实证评价来构建科学数据素养培养体系的研究较少,因此本研究在调研研究生科学数据素养能力基础上,从培养对象、目标、内容、方式及评价培养体系等角度出发,构建了有针对性、系统性的高校图书馆研究生科学数据素养培养体系,以期为高校图书馆开展用户培训提供借鉴和参考。

2 研究设计与分析

2.1 研究问题及问卷编制

本研究采用调查问卷对国内高校研究生用户科学数据素养能力进行分析,主要探索两方面内容:一是从整体角度出发,探索研究生科学数据素养能力整体概况;二是从具体指标出发,分别从数据的意识、收集、组织与管理、分析、利用与保存及伦理6 个维度出发进行详细分析,对研究生在每类指标下的具体能力进行详细分析,针对研究生的科学数据素养能力现状构建符合中国高校图书馆研究生实际情况的科学数据素养培养体系。

问卷调查对象是江南大学研究生,从科学数据素养能力的内涵出发,结合前期开展研究[5]构建科学数据素养测试量表,分为数据意识、数据收集、数据组织与管理、数据分析、数据利用与保存和数据伦理6 个维度,在每个维度下又进行细分,共设计了42 个具体指标,如表1 所示。问卷采用评分制调查方法来完成,被调查者根据自己的实际情况进行自评,5 分为最高分,1 分为最低分。

表1 科学数据素养测试量表Table 1 Scientific data literacy test scale

2.2 数据收集与信度分析

研究采用“问卷星”平台收集问卷,通过多个渠道发放共收集有效问卷182 份。从性别来划分,男生有76 人,占41.76%;女生有106 人,占58.24%,男女比例为1:1.4。从学历层次来看,硕士一年级学生有131 人,占全部人数的71.98%;硕士二年级学生有38人,占20.88%;硕士三年级学生有10 人,占5.49%;博士一年级学生有3 人,占1.65%,需要说明的是问卷收集是当年5—6 月,硕士一年级也在学校进行了一年的学习,因此无论学习还是科研都会对科学数据素养有一定的需求和了解。从学院和专业类别来看,覆盖了江南大学全部学院,同时专业类别也符合江南大学专业划分比例。

为确保样本数据的真实性和可信性,借助于SPSS统计分析软件采用克朗巴哈系数(Cronbach's α)对问卷信度进行验证,得到:问卷的整体信度为0.975,信度非常高。进一步对各指标进行验证,得到Cronbach's α 值均超过0.97,表明国内研究生科学数据素养能力有较高稳定性和一致性,同时也说明问卷信度良好。

2.3 数据分析与讨论

通过对研究生科学数据素养能力各项指标进行量化统计分析,发现国内高校研究生在科学数据素养能力上表现出一定的显著性特征,具体表现为:国内高校研究生整体科学数据素养能力均值为3.58,标准差为0.93,表明整体研究生科学数据素养能力不高,同时用户个体差异较大。图1 进一步对各维度的得分进行统计得到:用户数据意识和数据伦理均值最高,总体均值为4.01,其次是数据利用与保存,均值为3.56,分数最低的是数据分析能力,均值为3.33,因此在科学研究过程中,国内高校研究生的数据意识和数据伦理素养较高,其次是数据利用与保存能力,数据组织与管理、数据收集及数据分析能力较弱。

图1 国内研究生整体科学数据素养能力Fig.1 Scientific data literacy ability of domestic graduate students

通过对6 个维度的总体标准差进行统计得到:数据分析能力标准差最大,为0.96,表明研究生在数据分析方面存在较大差异;数据伦理标准差最小,为0.75,表明研究生在数据伦理方面差异性较小。整体来看,研究生在数据伦理方面的素养是最高的,同时个体间的差异性较小,而在数据分析方面的素养是最低的,同时个体间的差异性也最大。

图2 进一步对各维度下的指标进行统计,得到国内高校研究生在各指标分值所占比重。下面将从数据意识、收集、组织与管理、分析、利用与保存及伦理角度进行深入分析,全面系统地了解国内高校研究生科学数据素养能力现状。

图2 国内研究生科学数据素养能力具体指标分值占比统计Fig.2 Statistics of specific index scores of scientific data literacy ability of domestic graduate students

2.3.1 数据意识

数据意识是研究生在科学研究过程中能够认识到数据重要性并以认真负责态度对待科研过程中所产生数据的基础,影响着整个科研过程。数据意识包含用户可以正确认识数据的重要性、准确性和实效性,了解数据的生命周期等内容。

(1)据统计可知,国内研究生的整体数据意识很高,90%以上的研究生都认同科学数据对科研的重要性,认同数据具有表层、隐含两层价值,同时能够认识到科学数据的有效性、可信性和敏感性。这与已有研究发现有较高的一致性,如黄如花[6]在调研 《信息检索》 MOOC 课程学生的数据素养时发现学生的数据意识普遍得分较高。WIOROGóRSKA 等[7]也发现波兰弗罗茨瓦夫大学和华沙大学两所大学的科研人员和博士研究生的数据意识很高。

(2)约有20%的研究生表示对科研数据流程和数据生命周期相关知识欠缺,需要加强相关知识积累。QIN 等[8]研究雪城大学本科生和研究生数据素养需求时也发现学生对数据生命周期相关知识有需求。

(3)此外约有42%的研究生表示无法用明确的语言表达科学数据需求。因此应有针对性的对相关学生进行引导和培训,增强其科学数据需求表达能力。

2.3.2 数据收集

数据收集是整个科研过程的基础,包括选择正确的方式来获取、收集数据,在海量数据中挖掘有用数据,检验获取到的数据正确性等。通过分析可知,国内研究生的整体数据收集能力较弱,张晓阳[9]等的研究也有相似发现,具体表现如下。

(1)有40%的研究生对于选择有效方法、工具收集数据和分类数据表示能力欠缺。DOUCETTE[10]在调研加拿大社会科学与自然科学专业研究生科学数据素养水平时发现,研究生在如何有效收集数据方面的技能有待提高。

(2)有一半的研究生表示无法完全从海量数据中发掘出有用信息并使其显性化。

(3)仅有38%的研究生表示能够构建数据模型同时可以挖掘科学数据的隐藏含义,其他研究生表示这方面能力需要培养。FEDERER 等[11]在研究美国生物医学科研人员的科学数据素养时发现,科研人员对数据建模、挖掘数据深层含义需求很高。

(4)有54%的研究生表示在借助相关工具或指标来检验科学数据正确性活并剔除无效数据等方面的能力需要提高。

2.3.3 数据组织与管理

数据组织与管理能力分为数据组织与数据管理两方面内容,具体包括根据问题设计操作性方案、制定数据管理计划、明确本学科领域的数据标准、对不同类型科学数据进行分类管理等[12]。整体来看,研究生在数据组织与管理方面主要表现如下。

(1)在数据分类组织和管理制定方面,约6 成的研究生表示可以在数据过程中设计操作性方案、制定数据管理计划并实施管理。

(2)约一半的研究生表示缺乏对本学科领域数据标准的了解,这表明国内研究生对科学数据标准知识有相关需求,应加强这方面的知识培养。BRACKE[13]在研究普渡大学农业与生物科学专业用户时发现用户希望能够有专业的处理工具帮助他们了解并运用元数据。CARLSON[14]在研究教师数据素养需求时发现教师希望增强对数据质量标准的了解。

(3)在对不同数据进行区分管理、评级及跟踪学科发展更新数据等方面,大部分研究生表示具备这些技能。郝媛玲等[15]研究中国图书馆专业研究生的数据素养能力时也发现研究生对于数据科学管理、分类评估等技能需要提高。

(4)数据安全方面,仅有52%的国内研究生表示会通过加密或设置权限等方式来控制数据访问确保数据安全,其余研究生表示需要加强相关技能培训。JOHNSTON 等[16]在研究明尼苏达大学结构工程专业的用户科学数据素养需求时也有类似的发现,用户很注重数据安全问题,同时希望能增加保护数据安全的技能。

(5)在研究生对于科学数据交由专门的数据管理机构管理方面,仅有40%的研究生会选择交由专门的数据管理机构,这表明研究生对于科学数据管理持谨慎态度。

2.3.4 数据分析

数据分析能力是将数据转化为决策支持信息的基础,包含了正确选用数据分析方法和工具分析数据,采用多种方式展示结果,对科学数据的内在规律进行解读并对未来趋势进行预测等内容。经统计得到如下结果。

(1)约有94%的研究生表示能够正确有效选择数据分析方法、熟悉领域内数据处理流程和数据分析工具,表明研究生在这两方面具有较高素养。

(2)在用多种方式呈现数据分析结果并进行数据建模和监控分析操作流程并确保分析过程的精准两个方面,仅有4 成的研究生表示具备这两项能力,说明研究生在数据呈现、数据建模和控制数据分析操作流程方面技能较弱,需要加强培养。雷擎[17]发现经济管理类研究生运用信息技术和工具开展数据分析的能力较弱,尤其是使用统计软件、建模工具的能力。

(3)有一半的研究生表示能够对科学数据的内在规律解读并预测趋势。

(4)在能够解释和重现实验数据方面,仅有16%的研究生明确表示不具备该项技能,证明研究生解释和重现数据方面有较高技能。

(5)在数据结果方面,有约6 成的研究生表示能够对分析结果进行质疑并以此改进数据分析方法或通过分析结果发现研究不足的地方来完善优化研究。

整体而言,国内高校研究生的数据分析能力是整个科学数据素养中最弱的一项,同时个体差异性较大。已有研究中也有相类似发现。FRANK[18]在分析挪威奥斯陆大学气象学学生数据素养时发现学生数据分析能力需要进一步增强。

2.3.5 数据利用与保存

数据利用与保存包含数据利用、保存与共享3 方面内容。整体来看,研究生能够很好的制定数据管理计划,并对不同数据进行分类保存,具体表现如下。

(1)数据利用主要包括利用实验过程中的空白数据或可能存在的争议数据来再次确定研究目标、利用结果分析来支撑研究结论并发现新的研究问题、将科研数据价值最大化、在数据关联中总结新的知识并开展循环探索等4 项具体内容。超过一半的研究生表示具备数据利用技能。

(2)数据保存主要指能够采用合适的方式完整保存科学数据以方便数据的重复利用。有70%以上研究生表示具备数据保存能力,能够合理保存数据。但朱德瑛[19]在调查大数据时代烟台大学的大学生数据素养能力时发现大学生的数据保存意识普遍较低,这表明研究生比大学生的数据保存意识强。

(3)数据共享是指用户了解数据共享原则并表示愿意在一定范围内共享科研数据。仅有7%的研究生表示不会共享科研数据,这表明多数研究生了解科研数据开放共享的相关信息,同时也愿意在一定范围内共享数据。SCARAMOZZINO[20]在研究教师的数据素养能力时也发现教师愿意进行数据共享。

2.3.6 数据伦理

数据伦理是用户在科学研究过程中利用数据时所遵守的法律法规和道德规范的总称[21],包括对科学研究过程中数据真实性、有效性负责,能够科学合理的引用相关数据、整个科学数据使用过程符合相关学科规范,熟悉并遵守学术道德和相关法律法规要求等具体内容。

经统计得到国内研究生的数据伦理水平很高,仅有不到5%的研究生表示缺乏本学科数据所涉及的知识产权和隐私权相关知识,同时对在科研过程中对所获取的数据真实有效性信心不足,因此应加强数据学科规范及知识产权、隐私权方面相关知识宣传,增强个别研究生对于科研过程中数据真实性及有效性的信心。

2.4 结论

整体来看,高校研究生的数据意识和数据伦理呈乐观趋势,数据保存与利用、数据收集、数据组织与管理及数据分析能力有待于进一步提高,尤其是数据分析能力急需提高。表2 进一步对各指标均值和标准差分析得到如下结论。

表2 国内研究生在科学数据素养能力各指标均值和标准差Table 2 The average and standard deviation of each index of scientific data literacy ability of domestic graduate students

(1)数据意识方面,国内研究生的整体数据意识较强。但在使用明确语言表达科学数据需求方面,用户能力较弱,同时个体差异较大。

(2)数据收集方面,整体而言研究生的数据收集能力有待于进一步提高,主要表现在4 个方面:一是缺乏从海量数据中准确挖掘出对科研有用的数据并将其显性化的能力;二是缺乏挖掘数据内涵并进行数据建模的能力;三是缺乏借助合适工具、软件或指标来验证数据有效性和正确性,并剔除无效数据的能力;四是缺乏选择有效研究方法和工具收集所需数据的能力。其中研究生在数据建模和数据挖掘方面的能力是最弱的,同时个体差异大。

(3)数据组织与管理方面,需要加强对国内研究生整体数据组织与管理能力的提升,尤其是在对本学科领域数据标准的了解与运用。同时在将科研数据交由专门数据管理机构方面,研究生的得分不高,同时个体差异较大,这表明未来对于专门数据管理机构的建立和用户对管理机构的认识有待进一步加强。

(4)数据分析方面,研究生整体数据分析能力较弱,尤其是在将数据结果多种方式呈现并进行数据建模方面能力最弱,同时个体差异较大。研究生数据分析能力亟需提高。

(5)数据利用与保存方面,研究生能够很好的制定数据管理计划并实施分类保存,同时愿意在一定范围内共享科研数据,但在数据利用方面,尤其是利用空白数据、存在争议数据来制定科研问题方面,研究生个体差异最大。

(6)数据伦理方面,大多数研究生都能够对科研中的数据负责,引用数据能够遵守相关法律规范和学术道德,同时符合学科规范。整体来看研究生数据伦理较高。

3 高校图书馆研究生科学数据素养培养体系

构建系统化、整体化、科学化的研究生科学数据素养能力培养体系,是在用户数据意识、知识、技能和伦理得到提升的同时,科研数据得到良好保存和高效共享的有效方式。研究基于对国内高校研究生科学数据素养能力评测现状,从培养对象、培养目标、培养内容、培养方式和培养评价5 个方面来搭建科学数据素养培养体系(图3)。

图3 国内研究生科学数据素养培养体系Fig.3 The cultivation system of scientific data literacy for postgraduates in China

3.1 明确培养目标,制定素养教育政策

对于研究生科学数据素养能力培养,不仅是高校图书馆应该重视的用户素养培养,更应该是高校内部教学、科研、服务部门多重协作来完成的。以高校图书馆为主导开展数据素养教育,多方协作来共同制定培养策略,从数据意识收集、组织与管理、数据分析、利用与保存和伦理6 个维度出发,根据研究生不同的知识基础、专业背景、科研方向和科研要求等因素来开展教育,从而构建一个由浅入深、循序渐进的培养体系,既包括了科学数据素养全部环节,同时针对不同数据素养指标开展针对性教育。在调研中发现,高校研究生的数据意识和数据伦理情况良好,而在数据保存与利用、数据收集、数据组织与管理及数据分析等方面的能力有待于进一步提高,尤其是数据分析能力急需提高,因此应基于此现状来制定素养教育政策。

3.2 完善培养内容,4 种教育同步开展

采用通识教育、专业教育和个性化教育相结合的方式构建研究生科学数据素养培养体系,从意识教育、知识教育、技能教育和伦理教育4 个角度出发来开展培养内容。

结合实际调研结果可知:①在意识教育方面,重点培养研究生需求表达能力,确保其使用明确语言来表达科学数据需求;②在知识教育方面,增强研究生对于数据本质和规律的认识,包括数据的格式、类型、特性、元数据、数据生命周期理论等内容;③在技能教育方面,着重培养研究生对数据挖掘、管理和分析的技能,增强其使用相关工具和方法的能力,从而使用户能够根据不同数据资源来发现科学问题并分析解决,为开展科学研究做数据支撑;④在伦理教育方面,培养研究生科学规范引用数据的能力,使得引用的数据既符合相关法律规范又符合学科要求。

3.3 丰富培养方式,线上线下相互结合

面向研究生的科学数据素养教育既有专业性特征,同时具有学科化特征,因此针对不同年级、不同专业的研究生而言应该开展不同的教育培训内容,从而将系统化教育与个性化教育相结合。针对于研究生通识教育需求和专业教育需求,图书馆可通过开展专业数据技能课程、在线培训课程及专题讲座等形式来帮助研究生建立系统化数据知识体系和技能。而针对于个性化需求,图书馆可通过嵌入式教学的方式来完成。图书馆员嵌入科研团队,在团队中开展科学数据素养教育。

3.4 评价培养体系,根据具体情况调整

完整的培养体系应包含对整个培养过程和效果的评价,评价方式包括内容评价、方式评价、效果评价和用户反馈等多种方式。内容评价包括对数据意识、数据收集、数据组织与管理、数据分析、数据利用与保存和数据伦理6 个部分的具体教学内容评价。方式评价包括用户选修科学数据素养培养课程情况专题讲座参与情况、嵌入式教学培养程度等内容。效果评价主要是研究生对培养内容和培养方式的满意度以及未来可以继续开展的可持续程度评价。用户反馈主要是测评参加培训后用户的科学数据素养能力,通过对比培训前后用户素养能力来评价。

4 结语

对国内高校研究生科学数据素养能力的探索不仅可以用户丰富用户素养研究理论,还可以进一步指导高校图书馆开展相关素养培训,具体包括如下。

(1)通过参考已有研究,构建了详细的用户数据素养能力调查量表,从意识、收集、组织与管理、分析、利用与保存和伦理6 个维度出发,设置42 个具体指标来对研究生的科学数据素养能力进行调研。这对于未来分析影响用户科学数据素养的因素研究、探讨科学数据素养对用户科研能力、科研创新水平影响等的研究做了理论基础。

(2)为用户数据素养能力培训提供参考意见,从培养目标、内容、方式和评价体系等角度出发,对高校图书馆开展研究生科学数据素养教育提出了具体操作。围绕着提升研究生科学数据素养能力为目标,构建“用户需求导向、科研数据素养能力导向、素养教育提升导向”三位一体的培养模式,为高校图书馆开展具体业务提供建议,同时推进国内研究生科学数据素养能力的提升。

猜你喜欢
研究生科学素养
必修上素养测评 第四测
必修上素养测评 第三测
必修上素养测评 第八测
必修上素养测评 第七测
点击科学
科学大爆炸
蔡智及其研究生作品选登
沈铭存研究生作品选
科学拔牙
幸福院里出了个研究生