张云秋,郭明昊
(吉林大学公共卫生学院,吉林 长春 130021)
随着大数据时代的到来,大数据对教育的影响将是巨大而深远的。在医学领域,伴随着现代技术的发展,精准医疗的推进,大数据将与医学进行高度融合。获取数据、管理数据、分析与利用数据将成为医学工作者和医学科研人员进行研究和学术交流的必要素养之一。为了培养适合未来医学科学发展需要的创新型医学人才,开展针对医学生的数据素养教育研究已迫在眉睫。
最早提出数据素养概念的Schields M认为数据素养是信息素养的延伸,强调了数据的访问、处理和组织能力[1]。虽然对于数据素养的定义尚未形成统一,但数据素养离不开数据。在大数据语境下,数据的范畴要大于信息的范畴。因此,较之信息素养,数据素养的外延应更广,数据素养应是指贯穿于数据生命全周期的数据采集、表示、描述、发现与检索、选择与评价、分析、利用、引用、整合、复用、保存、管理等一系列活动所需的技能,其核心是数据的分析与利用。
当前,对学生数据素养能力评价的相关研究主要面向研究生。例如李楣利用包括数据意识、数据收集与评估、数据组织与管理、数据处理与分析、数据利用与归档及数据伦理等六大类19个指标的数据素养评价量表对305名研究生进行了调查[2];程璐设计了包括数据意识、数据知识、数据能力、数据伦理和道德四个方面共20个题的问卷对武汉大学345名研究生的数据素养现状进行了调查[3]。对不同学生群体数据素养现状的调查与分析是开展数据素养教育实践的基础。本研究针对医学本科生这一群体,设计数据素养调查问卷,以吉林大学为例,对其医学本科生的数据素养现状进行调查,并据此提出教育策略,为开展相应的数据素养教育提供参考。
基于数据素养概念及其评价指标,针对医学生的特点,确定了数据意识、数据获取、数据组织与管理、数据分析、数据共享与安全、数据伦理6个评价维度17个指标的数据素养评价体系。该评价体系将数据素养作为一个表现数据生命周期各环节要素综合能力的基础,保证了整个体系的完整性,并且各维度以及指标间有内在的逻辑关系。维度1到6是递进的过程,表示数据生命周期中各环节需要掌握的能力,也可以看成是利用数据的流程。
据该评价指标体系采用李克特五点法的测量方法设计,涵盖各维度和指标,包括被调查者基本信息以及用以筛查无效问卷而设置的问题共计52道题的调查问卷。为确保调查问卷的精确程度,首先随机发放50份问卷,回收50份,根据结果对问卷的信效度进行检验。
结果显示该调查问卷信、效度良好(α系数为0.951,KMO值为0.941)。
(一)现状调查。
1.样本说明与被调查者基本情况。本研究使用问卷星系统通过微信、QQ等方式发放给吉林大学白求恩医学部各学院、各年级、各专业的共822份电子问卷,回收822份问卷,回收率100%。剔除无效问卷67份,剩余755份,有效率达到92%。对有效问卷的基本情况进行统计。
被调查者的基本情况为:男生占29.8%,女生占70.2%;三年级接受调查的人数最多,占48.87%;学院分布中,临床学院和药学院受调查者占总人数的55.89%。68.48%的被调查者上网时间范围在1~5小时/日;其上网目的顺序为:休闲娱乐、查阅资料、网上聊天、浏览新闻;获取数据信息途径的顺序为:手机、电脑、纸质文献、广博和电视;在掌握数据处理与分析工具方面,利用Excel和SPSS的人较多,但相较于被调查总人数,其占比仍然比较小,说明总体上掌握利用相关工具的人数很少。
从被调查者基本情况可以推测,虽然医学本科生经常使用网络,但少有学生能利用网络来获取数据,分析数据,并且能掌握相关技能。为了验证这一推测,继续对调查问卷的结果进行统计分析。
2.数据素养水平分析。(1)总体水平分析。本研究调查问卷包含38道主体问题,反映数据素养水平,通过对调查问卷这部分内容的结果进行统计分析,得出总体的得分情况。数据呈偏态分布,被调查者的平均得分为(123.76±21.44),最大值为190,最小值为38,四分位间距P25=114、P50=125、P75=137,其均值处于P25~P50之间,说明被调查的医学本科生数据素养总体属于中等偏下;标准差为21.442,说明总体水平的波动较大,被调查者的数据素养水平差异明显。(2)各维度水平分析。本研究的调查问卷共分为六个维度,分别对其结果进行统计,结果如下(见附表)。由结果可以看出,各维度的得分都在中等偏下,均值都在P50左右分布;“数据分析”维度的标准差较其他维度来说更大,说明结果波动较大,该维度上被调查者的差异性明显,能力参差不齐。数据伦理得分较其他维度偏高,说明被调查者在数据伦理维度水平较其他维度好。
附表 吉林大学医学本科生数据素养各维度水平情况
3.数据素养影响因素分析。根据调查结果,进一步分析性别、学院和年级对被调查者数据素养水平的影响。由于这几个特征下的数据素养得分均服从非正态分布,所以对于性别采用Mann-Whitney检验方法;对于学院和年级采用Kruskal-Wallis检验、中值检验以及Jonckheere-Terpstra检验方法。
性别的结果上P<0.05,说明数据素养在性别间的差异有统计学意义,为进一步分析男女在数据素养的哪个维度存在差异,采用以上的方法对各维度的结果进行进一步分析。结果显示:性别在数据意识、数据获取、数据组织管理、数据分析维度上P<0.05,存在统计学差异,而且均值得分上均表现出男生的得分略高于女生。
学院的结果上P>0.05,表现出各学院的被调查者在数据素养能力上没有统计学差异;但在年级的结果中P<0.05,说明不同年级间的数据素养差异有统计学意义,进一步通过两两比较后发现四年级与一、二、三年级之间都存在统计学差异。
(二)现状分析。
从吉林大学医学本科生的调查结果看其数据素养现状如下。
1.医学本科生的数据素养水平总体属中等偏下,尤其在数据素养的核心内容“数据组织与管理”与“数据分析”维度上结果不佳,说明医学本科生对数据的组织管理以及数据分析中的流程、使用方法以及工具掌握方面还很弱。数据伦理维度得分较高,说明医学本科生具有较高的相关法律意识。
2.医学本科生的数据素养总体水平和各维度水平均呈现出个体差异,尤以数据分析维度最为严重。分析其原因是当前数据素养教育尚未系统展开,虽然医学本科生总体数据素养水平较低,但依然有学生根据个人兴趣,有意识地培养自己的数据意识和学习相关的知识,因而会呈现出这样的差异。
3.性别与年级对医学本科生的数据素养水平有影响。性别上的影响表现在数据意识、数据获取、数据组织与管理、数据分析维度上,分析可能原因是性别本身的特性所致;年级上,数据素养水平随着年级的增加而增加,并且这种增加到四年级才有统计学差异。说明随着年级的升高,数据处理分析的需求在增加;另外,随着年级的升高,学生通过某些课程,如医学信息检索课和一些专题讲座的渗透也获得了一些与数据有关的知识。而不同学院的学生数据素养水平没有明显差别,说明数据素养可能在学科专业上的差别较小,也可能与未开设数据素养专业教育和有针对性的数据分析利用的课程有关。
面向当前医学生数据素养水平偏低,数据素养存在个体差异以及年级对数据素养的影响等现状,在目前阶段提升医学生数据素养,从高校的视角,需综合考虑学校和学生的实际情况。从学校层面,需要进行数据素养教育的基础条件建设,包括组建教师团队,构建课程群,建设实践平台;同时,从学生层面,需要考虑医学生的培养目标、学制、课程安排等特点。形成意识引导、教育实践和环境创造为主线的分阶段、分层次、多维提升策略。
在意识引导方面,虽然从调查结果看,目前的医学本科生均有一定的数据意识,但数据管理与分析能力的缺乏又表明其数据意识尚待深入。意识引导应从新生入学开始,持续渗透,树立数据素养理念。在教育实践方面,应确立培养目标,确定教学内容,组建多学科协作的教学团队,构建多层次、动态的、开放的课程体系;在环境创造方面:(1)加强校园数据素养文化建设,搭建流畅的数据素养交流平台;(2)要与企业机构联合,建设数据素养实践平台。
分阶段、分层次、多维提升策略综合考虑了医学本科生的培养阶段、教育目标分类和数据素养能力构成。分阶段是指医学本科生的培养大致分为通识教育、学科基础教育和学科专业教育三个阶段;分层次是指学生的认知过程包括记忆、理解、运用、分析、评价和创造六个层级;多维是指数据素养包括数据意识、数据获取、数据组织与管理、数据分析、数据共享与安全、数据伦理等能力指标。该提升策略在医学本科生通识教育阶段,通过专题讲座和文化渗透培养学生的数据意识,同时进行数据素养基本课程,如计算机科学的相关知识学习;在学科基础教育阶段,开展课程群的核心课程,如统计学和数据分析的学习,并按照学生认知层次,由浅入深设计课程内容和教学方式,旨在形成数据素养的核心能力;在学科专业教育阶段,结合实际的专业需求和认知层次,借助数据素养实践平台,着力培养学生围绕解决问题的数据分析的实际操作能力。
要将医学本科生数据素养教育落到实处,对现状进行调查分析,并提出可行的提升策略至关重要。本文在对数据素养相关概念进行界定的基础上,设计数据素养能力调查问卷,对笔者所在高校的医学本科生数据素养进行调查,对现状分析,并提出以意识引导、教育实践和环境创造为主线的分阶段、分层次、多维提升策略。旨在抛砖引玉,希望能引起关于医学本科生数据素养教育的广泛讨论,为其教育实践打下基础。