茹慧英 李超 闫海琴
摘 要:随着人工智能的不断发展,加强了对数据分析的需求,对信息与应用统计学专业人才培养也提出了更高的要求,数据分析课程教学理念与方法亟待改革与创新。在总结数据分析经典课程教学经验的基础上,结合大数据时代背景特点以及当代学生的学习特征,提出了增加学生参与度的“理论讲授+编程实践+工程实践”的教学实践模式。近两年的教学实践探索研究证明,该教学模式具有创新性和有效性,能够培养学生的学习主动性和积极性,提高学生大数据分析能力和数据挖掘能力,为数据分析课程的教学提供了新思路和新方法。
关键词:数据分析;大数据;教学实践;机器学习;人工智能;数据挖掘
1 概述
近年来,随着人工智能及大数据的发展,各行各业都充斥着大量的数据,这些数据一般会呈现数据量大、数据维数大、数据变化快、隐藏价值高等特点,数据结构也从起初的结构化数据转变为半结构化、非结构化数据,海量的数据中所蕴含的潜在价值成为人们关注的焦点,许多传统的数据分析与统计方法已无法处理当下信息丰富的数据,因此各行各业都急需一些具有较强数据分析能力的人才,这也是对信息和应用统计学专业的学生提出的新要求。对于信息与应用统计学专业学生来说,数据分析课程的学习及应用显得尤为重要。因此,基于信息和应用统计学专业数据分析课程的教学理念与实践方法[1]进行探索改革,以期让学生在深度掌握数据分析理论基础的前提下,能够更好的将数据分析知识应用于生产实践,为我国的数据分析与人工智能领域增砖添瓦,也为今后数据分析课程的教学方式和教学理念提供参考。
当前,国内外高校教师对数据数据分析课程的教与学进行了不同的探索与实践。孔莉群[2]将统计与概率、数学建模,函数等数学知识融合在一起,探讨通过现象教学提升数据分析核心素养。王婧娟等[3]为提升该课程教学水平,探讨了数据获取、数据分析、数据可视化的能力培养,研究如何将信息技术数据分析课程的设计和教学中。徐小茹[4]在阐述数字媒体课程思政教学要素与现状的基础上,提出基于数据分析课程的教改策略,包括强化教师思政能力和意识,构建信息化教学平台,深化思政教育内容等,以期为各大院校数字媒体课程思政教改提供借鉴。现阶段数据分析课程仍以传统的教师传授为主,教学方法与手段落后,教学内容陈旧[5,6]。另外还存在:课程讲授内容充斥枯燥理论,数据分析技术难度相对较高,学习过程中学生的实际参与程度不高,且由此导致的学习积极性比较低落等问题。作为一门实践性很强的课程,在理论教学完成后,最大的问题是针对所教授学生缺少系统、科学、合理的数据分析实战环节[7],导致课程理论与实践严重脱节。针对上述问题,本研究将从理论教学方法,编程实战,工程应用三个方面对数据分析课程的教学理念和方法进行改革探索,结合大数据时代的数据特点[8],围绕信息和应用统计学专业人才培养方案、本科人才培养模式、社会人才需求等,充分利用该专业学生具有的深厚数学基础及当下流行的网络爬虫、人工智能算法、Python数据分析、可视化分析等技术,深度挖掘数据分析技术在不同研究领域的应用前景及应用价值,使学生深刻认识到数据分析在生活中的重要性,体会数据分析技术在人工智能领域中的重要价值,并锻炼和提升所教授学生的数据分析能力和实践能力,从而使学生掌握数据分析方面的一技之长,以更好的适应社会的需求,为祖国的人工智能领域做出应有的贡献。
2主体教学改革框架
本教学改革研究所针对课程为数据分析及其相关方向课程,在大数据和人工智能背景下,根据课程教学内容,基于不同地区、不同行业领域实体数据,进行教学改革研究,以期形成具有差异性和层次性的教学模式,为学生搭建基础的数据分析框架,在实践的教学中学生充分掌握数据分析方法,为后期的机器学习等课程的学习打下坚实的理论与实践基础。
各模块详细说明与分析:
前期调研及分析。根据前期各年级学生的数据分析课程的成绩,分析学生的成绩分布,针对具有典型性、代表性的学生采用“德尔菲”问卷调查法,以获取学生对课程学习体会和对课程的期望教学方式,挖掘影响成绩分布的主客观原因,从而为该课程的改革提供思路。
数据准备。针对数据分析课程的某一方法或算法的不同应用,选取某一研究领域,利用Python爬取或者通过Skleam库直接导入相关数据,根据数据特点对数据进行预处理,主要包括数据清洗,数据标准化,去除重复值,空值处理,异常值处理,连续数据离散化处理,非结构化数据结构化处理等,对数据进行初步的可视化分析和描述性统计。
数据挖掘与分析。针对工程实践中的具体数据,采用相应的数据分析方法,进行知识挖掘和分析。可采用的具体方法包括主成分分析法、层次分析法、上下文相关性分析法、特征提取与训练法、聚类与分类法等传统与前沿技术相结合方法等。
决策分析与总结。利用Python中的可视化模块或可视化工具,对数据挖掘和分析的结果进行可视化展示,针对不同领域数据进行实际分析,在数据形态分析结果的基础上制订出相应的决策方案,在实施的过程中同时进行方案适用性、可行性等比较评价。
3 教学研究改革思路与创新
本次教学研究改革的目的和任务在于根据数据处理分析、实体大数据知识挖掘技术及应用等[9],激发学生的主观能动性,让学生积极参与课堂教学,让学生在学习过程中从被动接受转为主动学习,在掌握基本数据分析与处理技术的基础上,培养学生科学的数据思维能力,能够将所学知识应用于具体研究领域,掌握解决实际问题的能力。教学研究改革的总体思路围绕“理论”“编程”“实践”三方面进行,紧扣大数据和人工智能时代数据分析研究热点。
3.1 理论教学方式改革
教学方式的改革是教学改革的重中之重,每章节课程在不同的应用场景的教学当中,根据学生个性、学习能力、创新能力等方面的差异,在保证总体教学质量的条件下,采取因材施教的方式,设置学生教学环节,让学生充当课堂主体,让学生在讲授知识的过程中深刻理解知识,做到学以致用,促使学生能够主动地思考问题,同时培养学生解决实际问题能力和创新能力。
3.2 理论教学与编程实践相融合
通过将理论教学与编程实践相融合的方式,提升学生对数据分析的重要技术——编程的认知和热爱程度,每个数据分析方法都设置相应的编程练习,使学生在编程的过程中充分理解并掌握数据分析方法的正在内涵,培养学生的逻辑思维和发散思维,通过大量接近生活且有趣的实验,在增强学生代码编写能力的同时,增强学生的数据分析能力,从而可以更好的适应社会市场的需求。
3.3 理论讲解与工程实践相结合
抛弃传统的枯燥理论讲解,将理论讲解与工程实践相结合,最终目的是提高学生解决实际问题的能力,培养学生科学的数据思维能力。整个课程围绕数据分析课程的理论知识在现实生活中的应用,课程包括5次上机实验(学生独立完成)和一周的课程设计(分组完成)。
实验目的:围绕大数据时代特色及要求,让学生理解并掌握数据分析基本流程和方法,包括数据爬取,数据预处理,数据特征提取,数据描述性统计,数据可视化分析,数据分析模型建立、训练、预测等大数据思维模式。充分结合产学研一体化教学模式布置实验环节[10],培养学生科学的数据思维能力,为学生在大数据领域的发展奠定坚实的实战基础。
课程的核心知识:Python数据爬取。通过Python数据爬取包爬取研究领域需要的数据集,并进行相关的数据清洗,数据存储等工作。数据预处理知识。利用Python实现数据的空缺值处理,无效数据处理,重复值删除,标准化处理等。
数据挖掘知识:涉及有PCA主成分分析,判别分析,聚类分析,回归分析,LDA主题分析、方差分析、参数检验等。
3.4 工程实战和编程能力的相互促进
通过工程实战和编程实战相结合的模式,促进学生独立应用数据分析技术解决实际问题的能力。
整个课程实验部分包括5次上机实验和1周课程设计。其中,课程设计要求各小组同学应用Python数据分析工具,自行选择某一问题进行数据分析,搭建合适模型,训练模型,对目标结果进行预测并给出相应的决策方案。具体过程为“问题需要分析——相关数据网络爬取——所收集数据预处理(正则化、规范化)——特征数据挖掘——大数据分析与处理——典型数据处理实验结果对比和经验总结”等。在完成数据分析技术性环节后并未结束,而是要求学生进行PPT分享报告并撰写形成完善的课程论文。
结语
在大数据时代,数据已成为日常生活必不可少的宝贵财富,数据分析成为快速发现数据内部潜在的价值实现人工智能的重要手段。其中重要的教学研究改革方式方法是大胆缩减传统数据分析课程中枯燥的理论推导环节,因其已经不再能够满足大数据时代数据分析课程的教学目标要求,亟需进行相应改革。与其他计算机课程相比,数据分析课程具有很强的实用性,且贯穿到生活的各行各业,因此数据分析课程以成为信息和应用统计学专业的核心课程。本文在大数据和人工智能时代背景下,针对数据分析及相关课程在现阶段存在的问题进行了教学改革研究,具体是对教学内容和教学方式进行了改革,建立了“理论——编程——工程实战”三位一体的教学模式,并探索了采用多元化教学方式的融合机制,以期能够让学生积极主动接受数据分析课程的新知识、新技术、新方法,掌握大数据时代数据分析的前沿理论,如数据挖掘、大数据处理、人工智能编程技术等,并完成相关实验设计,以提高学生的实践能力和创新精神,培养科学思维,进而提高该课程的教学效果。
本文在课程的实验教学改革方面紧扣了大数据和人工智能的时代特点,使学生理解和掌握了当今时代数据分析的基本技术与方法流程。针对具体行业领域的大数据分析需求,本文应用了“相关软件+大数据挖掘+大数据分析处理+可视化实现”的实验技术流程,让学生学会挖掘行业数据的潜在价值,完成搭建具体产业数据分析的学习桥梁。通过这种“产—学—研”相结合的数据分析实战实验训练,能够提高学生的数据分析与实践挖掘能力,为学生奠定未来从事相关大数据行业岗位的从业技术基础,实现了一种创新的数据分析思维培养模式。
由于课程教学改革的实验部分以青年教师为主,存在教学经验不足等问题,期望今后能够在教学经验丰富的教师指导下得以改进,以丰富充实教学改革研究能力。
参考文献:
[1] 席耀一,王博,李勇,等.大数据分析课程“四位一体”混合式教学探索与实践[J].大学教育,2022(12):7-10.
[2] 孔莉群.通过“现象教学”提升“数据分析”素养实践——以“新冠疫情”话题为例[J].中国信息技术教育,2023(07):65-68.
[3] 王婧娟,那丽春,方玉玲.数据分析与可视化课程教学研究与实践[J].电脑知识与技术,2023,19(07):148-150.
[4] 徐小茹.基于大数据分析的数字媒体课程思政教学改革及实践[J].湖北开放职业学院学报,2023,36(01):101-102+105.
[5] 方志军,杨孜茁,高永彬.数据科学与分析课程混合教学实践[J].计算机教育,2023(01):35-38.
[6] 李文平,张波.基于数据分析的精准教学实践探索[J].中小学信息技术教育,2022(S1):13-15.
[7] 蔡赛华.数据分析与挖掘课程教学改革研究[J].电脑知识与技术,2022,18(31):178-180.
[8] 李忠霖.大数据背景下用户行为数据分析课程教学改革研究[J].电脑与电信,2022(10):27-30.
[9] 何少芳,周丽,李绪孟,等.统计学专业“大数据分析综合实践”教学探究[J].科技与创新,2022(17):30-33.
[10] 王尧,刘婷婷,马宇姝,等.基于数据采集与分析的线上教学效果评价实践研究——以钉钉网课平台为例[J].高教学刊,2022,8(15):107-110.
基金项目:2021年河北省高等教育学会高等教育科学研究“十四五”规划课题“大数据背景下《数据分析》课程教学理念与方法探索研究”(GJXH2021-105)
作者简介:茹慧英(1987— ),女,汉族,河北张家口人,硕士,讲师,研究方向:数据挖掘;闫海琴(1991— ),女,汉族,河北张家口人,硕士研究生,中级会计师,研究方向:政府会计,会计信息化。
*通讯作者:李超(1984— ),男,汉族,辽宁阜新人,博士,副教授,硕士生导师,研究方向:人工智能。