张亮亮 薛震 薛亚奎 雷英杰
关键词:大数据;数据素养;案例教学;数据分析;混合式教学
中图分类号:021 文献标识码:A
2012年5月,由联合国发布的“Big Data for Development:Challenges&OpportuIuties”报告指出,大数据时代已经到来,大数据将会对社会各个领域产生深刻的影响。作为信息技术领域新的产业方向,大数据和产业前沿紧密结合,大量的创新创业项目均和它有关;大数据具有天然的学科交叉的基因,对其他学科有强大渗透力。2015年8月,中共中央国务院印发的《促进大数据发展行动纲要》指出,数据已成为国家基础性战略资源,大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生产方式和国家治理能力产生重要影响。利用海量数据构建模型,可以挖掘事物的变化规律,准确预测其发展趋势,为决策提供参考,从而进行及时有效的干预。大数据时代下,数据素养的提升对研究生的创新能力培养起着至关重要的作用。大数据分析技术在军事领域发挥着日益重要的作用,作为培养高层次兵工类科研人员的兵工类高校,应该注重提升研究生的数据素养。因此,本文结合长期的教学科研与实践经验,探索在大数据时代下提升兵工类高校研究生数据素养的方法。
1研究生的数据素养现状
数据素养是2004年由Milo Schield提出,指对数据具有敏感性、批判性,能够合理并恰当地获取、处理、分析伦理上使用数据的能力。大数据时代下,科学研究与数据的结合愈发紧密,研究生作为科研的后备力量,日常学习中存在科研数据需求较低、数据收集难、数据获取成本高、数据利用率低、数据处理能力欠佳等问题,加强他们的数据素养教育势在必行。数据素养是研究生参与课题亟须具备的重要能力,良好的数据素养不仅有助于研究生快速高效地提供和使用数据,针对课题进行多层次分析,而且有助于提高科研产出和研究成果的含金量,有利于提高学校的竞争力,提升教师队伍的整体水平。
调查发现,目前研究生在学习过程中不同程度地存在着数据敏感度不足、数据意识淡薄、数据获取方法和手段较少、数据分析能力较弱等问题。因此,亟须提升研究生的数据素养,包括培养其数据素养意识、数据收集能力、数据分析能力和数据监护能力等。
2提升研究生数据素养的方法
基于研究生数据素养的现状分析,寻求突破点,拟从以下五个方面进行探索以提高其数据素养:
2.1加强研究生收集数据的能力
数据的收集方式包括亲自收集如实验获取、网络搜索(如文本挖掘和网络爬虫)、联系作者获取、借助各大图书馆馆藏资源及其购买的国内外开源数据库、利用统计部门官网(如国家统计局、联合国统计数据库、山西省统计局等)和行业网站、通过公开出版书籍和发表论文中所附带的数据源等,其中实验获取曾是采用的主要手段,但该方式通常存在成本高、易重复、利用率低的缺点。因此,若能使用R语言、Python或八爪鱼等软件爬取网站公开的数据资料或已有文献中的数据,并建立数据库将其存储起来,则不但可以节约成本,而且有助于提升科研结果的准确性。另外,在教学中,教师教学生收集数据时,应尊重知识产权和学术规范,在保护个人隐私的条件下进行数据共享以节约资源。
2.2參加数据分析大赛
鼓励研究生参与数据统计与分析大赛、全国研究生SAS数据分析大赛、全国研究生数学建模竞赛、全国研究生人工智能创新大赛等各种权威数据分析大赛以深入学习数据分析方法,锻炼数据分析能力,提升数据素养,提高应用实践水平,真正达到以赛促学、学以致用的目的。大数据时代下,获取的数据大多由非结构化或半结构化的巨型数据构成。因此需要使用包括数据可视化分析、机器学习在内的方法对海量数据进行清洗、识别和整理,并对有价值的数据加以判断、探索和应用,最后输出结论形成数据多维度的分析报告。对研究生数据分析能力的培养实现从“技能性训练”转向“创造性训练”,达到实践性、综合性和开放性兼具的效果。
2.3采用案例教学
教师结合学生的专业、案例的具体背景、数据分析大赛等选取典型案例,培养学生获取和分析数据的能力,让学生掌握对应的模型、数据分析思想和方法,并强调数据科学伦理对于科学研究的规范和指导作用。同时,大数据时代下的海量数据通过传统的手算或者电子计算器计算已不现实,必须借助软件实现。因此需要学生熟练掌握1~2种常用数据分析软件(如R语言、Python等),能够利用它们绘制专业统计图形(如点图、扇形图、小提琴图、热力地图、社交网络图等),将数据进行可视化分析,书写案例分析报告等。在教学中鼓励研究生结合自身专业,搜集相关数据,借助数据分析软件进行分析,并对所得结果给出合理解释,最后在课上进行分享交流。比如,对于测试计量技术及仪器专业,可以兵工融合数据分析案例为例,介绍相关数据收集与预处理的方法、数据挖掘的算法与实现等。
2.4采用项目驱动法
项目驱动法是通过让研究生参与科研项目以促进科研实践和知识学习的一种方法,导师主要负责指导,研究生参与项目的整个过程。对于数据分析类科研项目,研究生从撰写申报书、建模、调研、数据采集、数据清洗和加工,到数据分析和算法设计论证,直至最后撰写结题报告等全程参与。该方式具有很强的实践性、综合性和开放性,能够大大提高研究生的动手能力和创新水平,实现启发式的教学目标和应用型人才的培养目标。与传统的课堂学习不同的是,参与项目后,为了完成相应任务,学生会积极主动地查阅相关资料、学习相关理论知识、与同学和老师讨论交流等,其主观能动性明显增强,学习的兴趣得到有效激发。学生在项目实践中学习理论知识的同时,并进一步将理论知识用于实践,实现了科学研究和创新的良性循环。
2.5利用混合式教学
充分将线上线下教学资源相结合,构建系统、开放的课程体系。开设研究生公共选修课程“数据收集与可视化”,旨在使学生掌握运用数据可视化技术解决科研中的问题。国内外许多大学都开设了如“探索数据的奥秘”“数据科学技术与应用”“数据科学的统计基础”“统计、大数据与生活”等系列MOOC数据素养课程,推荐学生学习此类课程。基于MOOC、腾讯会议、钉钉、学习通等在线课堂,学生可根据自己的专业选择合适的内容进行学习。学习通等在线平台上提供有数据分析文献、数据可视化微课和视频、数据分析软件知识讲座、常用的一些权威数据集(如UCI数据集、阿里天池数据集、KEEL数据集等)和数据科学竞赛平台Kaggle的链接、数据分析微信公众号“数据迷”链接、大型数据分析比赛介绍和备战秘籍等资源。作为课堂教学的延伸,在线资源便于学生复习或自学,学生可以利用碎片化时间去学习,学习方式更加灵活,更有利于知识的巩固,提高了学习效果。
基于以上五方面,以提升研究生数据素养为核心的“加强数据收集能力+案例教学+数据分析大赛+项目驱动+混合式教学”的“一体五翼式”培养模式,如下图所示。
3教学改革效果
为检验教学改革的实施效果,在研究生基础理论课程“数理统计”的教学中进行了实践。对教改前后学生的课堂表现、数据分析能力、考试成绩等进行了对比分析。结果表明,教改后学生能够更积极主动地参与到教学过程中,课堂上能积极回答问题,并提出问题;课后与教师沟通探讨问题的次数较多,一些学生能踊跃站到讲台上就某个问题进行分析讲解,活跃了课堂气氛,增强了师生间的互动交流,提高了教学效果。学生的学习兴趣和数据分析兴趣得到有效激发,软件使用熟练程度、数据分析能力以及科研能力均有了明显提高,申请研究生创新项目的成功率提高了一倍,学生的平时和期末考试成绩平均分也比教改前有显著提升。
为深入了解学生对于教改的反馈和认同度,结课后向学生发放了调查问卷,93.91%的学生认为提升了数据素养;89.93%的学生认为提高了创新意识和科研能力;98.53%的学生认为这种教学改革方式很有意义,对其帮助很大,值得深入推广和持续下去。
4结论与探讨
大数据时代背景下,数据素养成为研究生亟须具备的核心素养。本文探索了提升兵工类高校研究生数据素养的五种方法,包括加强研究生数据收集能力、鼓励研究生参加数据分析大赛、采用案例教学和项目驱动法、混合式教学等,并在研究生课程“数理统计”中进行了教改实践。结果表明这些方法有效激发了学生的数据分析兴趣,提升了学生的数据分析能力和科研水平,受到同学们的广泛好评。今后要将这些方法推广应用到更多的研究生数据分析类课程中,更大程度地提升研究生的数据素养和应用创新水平。
*通讯作者:张亮亮(1978— ),女,汉族,山西运城人,博士,讲师,研究方向:矩阵分析与数据降维。