财经院校《Java数据科学》课程的思政研究

2020-01-26 05:49张晓黎
电脑知识与技术 2020年34期
关键词:课程思政

张晓黎

摘要:很多学生认为《Java数据科学》课程是纯技术课程,上课时动手实践能力弱,遇到技术问题时分析解决能力欠缺,也无法结合实证理解数据分析结论。针对这一现状,提出财经类院校《Java数据科学》课程思政的教学内容设计和教学实践模式探索。教学内容以实事求是和通过实践检验理论为教学主旨,以Java语言和第三方工具包为教学主线,介绍社会、经济管理领域的大数据建模与可视化分析。教学模式采取课堂教学+网络教学平台反转教学+课程论文演示。

关键词:Java数据科学;课程思政;经济管理建模;大数据建模与可视化

中图分类号:G642        文献标识码:A

文章编号:1009-3044(2020)34-0180-03

1 《Java数据科学》课程思政研究的必要性

在理工科院校,《Java程序设计》课程是计算机专业和部分理工科专业的必修课程之一。开设该课程的主要目的是熟练掌握主流程序设计语言,面向企业软件系统开发需求。课程内容是以Java程序设计语言语法为基础,介绍其进行系统开发和设计时的逻辑分解、组织及实现。财经院校该以何种形式引入《Java数据科学》课程呢?技术类课程进行思政研究的必要性和途径是什么?

现代企业进行大数据分析时,需要具有经管知识、数学建模和编程能力的复合型人才。如果以后计划硕士或博士学习,也需要掌握1到2门可开发软件进行算法设计和定量分析。Java语言是开源程序设计语言,其语法对初学者相对较难,但其具备较强大的科学计算模块,数据分析模块,可视化与绘图模块。因此适合财经类院校的统计、人工智能、信息管理与电子商务等专业的拓展教学。在财经院校开设《Java数据科学》课程的教学目的、教学内容和组织形式应区别于理工类院校的。不能单纯讲解程序设计语法,而应紧扣社会经济管理新问题,进行数学统计建模、算法设计与分析及编程实现的能力培养。

教育部印发《高等学校课程思政建设指导纲要》,全面推进高校课程思政建设。“对于理学、工学类专业课程,要在课程教学中把马克思主义立场观点方法的教育与科学精神的培养结合起来,提高学生正确认识问题、分析问题和解决问题的能力。理学类专业课程,要注重科学思维方法的训练和科学伦理的教育,培养学生探索未知、追求真理、勇攀科学高峰的责任感和使命感。工学类专业课程,要注重强化学生工程伦理教育,培养学生精益求精的大国工匠精神,激发学生科技报国的家国情怀和使命担当。对于经济学、管理学、法学类专业课程。要在课程教学中坚持以马克思主义为指导,加快构建中国特色哲学社会科学学科体系、学术体系、话语体系。要帮助学生了解相关专业和行业领域的国家战略、法律法规和相关政策,引导学生深入社会实践、关注现实问题,培育学生经世济民、诚信服务、德法兼修的职业素养。”[1]《Java数据科学》课程是以理工类技术为基础,但研究的问题又是与经济管理类课程相关的专业课程。因此在进行课程思政建设时应谨遵实事求是马克思主义根本观点,引导学生关注国内外时政和现实问题,培养学生正确认识问题、分析问题和解决问题的能力。教学主要内容涉及社会经济管理热点问题的大数据分析、数学及统计学建模及算法设计、程序实现与结果可视化输出分析。

习主席指出:“实事求是,是马克思主义的根本观点,是中国共产党人认识世界、改造世界的根本要求”。“实事”就是客观存在着的一切事物,“是”就是客观事物的内部联系,即规律性,“求”就是我们去研究。坚持实事求是,就要做到:一是坚持一切从实际出发来研究和解决问题。研究问题、做出决策,都必须从不断变化的客观实际出发[2]。因此,在设计《Java数据科学》课程的教学内容和课程实践题目时,数据分析类题目紧扣国家经济时政,算法类题目紧扣最新技术热点。二是坚持理论联系实际来制定和形成指导实践发展的路线方针政策。理论只有与实际紧密联系,才能发挥对实践的指导作用,才能实现自身的价值和意义。三是坚持在实践中检验真理和发展真理。理论是从实践中产生的,实践是认识的源泉,是真理的检验标准,理论是否正确要接受实践检验并要在实践中不断丰富和发展。因此,在设计《Java数据科学》课程的教学内容时不单纯灌输,而是让学生通过课堂实践、课后实践和课程论文实践去总结技术上的理论,验证经济管理的理论知识。

2 《Java数据科学》课程的思政教学内容和模式探索

财经院校引入《Java数据科学》课程,进行课程思政的主旨是培养学生实事求是,理论联系实际,通过实验实践检验真理的精神,加强利用Java语言进行问题分析、大数据建模分析和算法实现的能力。遵循在财经院校引入《Java数据科学》课程的主旨,笔者在教学内容方面进行以下创新:

以Java语言和第三方工具包为教学主线,但并不局限在语法和工具包介绍,而是结合技术相关实际案例和社会经济管理实证数据,引导学生关注国内外技术创新新动向和比较优势,国内外社会经济贸易基础问题,进行大数据可视化和建模分析。课堂教学与实验实践,均从技术实现难点、实际问题解决和分析等方面设计实现。在教学模式方面也进行了以下有益的探索,创建课程QQ群,搜集学生建模和编程实践出现的问题。利用BlackBoard教学平台发布教学内容文档、教学视频。课堂上,针对学生在QQ群里提出的典型性问题,编程上的语法错误和逻辑错误,引导学生根据实验错误提示倒推查找導致错误的原因。利用Zoom视频会议软件进行综合案例问题的讨论和交流,鼓励学生进行大数据建模研究时多关注国内外社会经济的时政问题,遵循实事求是、不信口开河的科学研究精神。针对同一个问题,不同学生解决问题的思路往往不同。通过交流演示开拓学生通过实验实践进行问题研究的视野,提升编程经验。主要教学内容参见表1。

下面,以信用卡欺诈检测问题及其应用,机器学习典型算法及其应用来介绍该教学模式。

信用卡支付为日常生活中常见的一种支付方式。交易中可能会存在着欺诈行为。如果可以利用机器学习完成对欺诈情况的预测,有助于发卡机构实现反欺诈,保护持卡人的财产安全。本文利用了creditcard.arff信用卡交易文件,该文件记录了2013年9月欧洲信用卡持有者所发生的交易记录。该数据集的V1变量到V28变量是通过PCA主成分变换得到的数值型属性。Amount变量是交易金额,数值型属性。Class为标称型属性,取值yes表示欺诈,取值no表示不欺诈。在65569条交易记录中仅包含3000多条欺诈记录,即Class属性上取值为yes个案仅有3000多条记录。显然,该数据集是不平衡的,欺诈这个类别(Class属性上取值为yes的个案)仅仅占了很少比例,约0.5%。但该问题重点关注的却恰恰是这些少数欺诈个案。因此,本文选择J48、RandomForest、NaiveBayes、AdaBoostM1、Logistic五个分类模型对同一数据集进行机器学习建模,比较训练结果,选择最优模型。让三组学生分别采取以下三种方法进行机器学习建模,并从数据集大小和特点、验证方法、运行速度和运行结果等四个方面比较三种方法的差异。让学生分小组汇报自己方法的特点、编程实现和实验结论,自己总结实验后的结论。结合本问题建模思路,探讨其在课程论文《利用大数据对新冠肺炎患者检出问题》的应用方式。

方法1,随机挑选10%的数据做训练集,对上述模型进行十折交叉验证。随机抽样10%数据后,运行速度较快。但因为是随机抽样,仍然是Class属性上取值为yes的个案很少,抽样后的数据集仍旧分布不均衡,欺诈检出效率并没有得到有效提高。方法2,使用全样本数据,随机抽取70%做训练集,剩余30%做测试集,用测试集进行分类评估。该方法对原始数据集没有抽样,而是利用了全部数据集训练分类器。因此运行速度很慢,但是欺诈检出效率得到一定程度提升。方法3,通过抽样方法生成相对平衡数据集,即将所有Class属性值为yes的个案进入新数据集,再在Class为no的个案中随机抽取与yes个案数量一致的个案进入新数据集。新数据集个案数是原有数据集的10%,并且Class属性上取值分布均匀,即Class属性取值为yes的个案数量与取值为no的个案数量相当。对该模型进行十折交叉验证。该种方法抽样得到了平衡数据集,由于数据量只是原数据集的10%,运行速度得到有效提高,同时由于数据分布均衡因此欺诈检出效果得到了较大程度提高。但是该种方法采用十折交叉验证,且对Class为yes的个案重复抽取,因此存在过采样风险。

在实现时间序列相似度距离测量算法时,分小组实现。一组同学实现王钊的《基于涨落模式的时间序列相似性度量研究》涉及的算法,用结构化程序设计思想实现算法,并完成从数据采集及可视化、算法实现和鲁棒性分析等工作。一组同学实现李敏的《基于LSH的时间序列DTW相似性查询》涉及的算法,用面向对象的程序设计思想实现算法,并完成从数据采集及可视化、算法实现与比较分析等工作。这两篇文献在处理时间序列相似性度量时基本思路一致,均采用最长公共子序列算法。但是在对时间序列进行整数编码和算法应用时却有不同,时间序列的涨落模式对数据进行了较大平滑,基于LSH的时间序列编码则对原始序列波动形态做了较好保留。因此在算法的鲁棒性和效率方面有比较明显区别。同学们在进行汇报演示时提到自己算法实现时遇到的问题,老师可以引导学生对这两篇文献的算法进行比较。这使学生比较直观体会了不同程序设计方式的差异和执行效率。学生在进行聚类分析时,不太注意数据类型、数据属性数量和对距离方法的选择,盲目选择不太合适的聚类方法进行聚类分析。结合时间序列相似性度量算法实现,可以引导学生在进行聚类分析时,如果遇到类似大批量时间序列或特征序列聚类问题时,应该如何进行机器学习算法设计。学生发现可以把每条序列当作个案,序列的取值当作属性值。序列相似性度量可以测量任意两条不同长度的序列距离,这个距离的测量可以为后续进行序列聚类分析打下基础。在进行课堂演示和讨论时,引导学生探讨时间序列相似度测量在基因序列相似度测量方面的应用。

3 《Java数据科学》课程网络直播教学实验实践模式探索

今年由于受新冠肺炎疫情影响,大学都实施了全面的网络授课模式。老师通过直播平台,如ZOOM、畅课等平台进行直播教学,师生之间可以通过提问和回答形式一定程度进行教学互动。学生通过非直播形式网络教学平台获取教学课件、教学视频和学习软件。这种教学方式对于实验实践型课程存在一个很大的问题,就是学生的实验实践环节无法很好监控,老师无法通过屏幕获知学生在网络另一端是否在认真实验实践。因此必须在课程实践模式方面进行创新,一是对学生的课堂实践环节进行有效监控,二是激发学生课后利用Java建模相应专业领域问题的兴趣。因此,结合上海市创新创业项目、上海对外经贸大学万企大调查项目、当前社会经济管理领域的热点问题及本科毕业论文基本要求,设计《Java数据科学》课程的综合实验实践题目。让学生按自身能力和兴趣进行独立或者分组综合实验、撰写报告和直播答辩。学生利用课堂时间,组队完成综合实验报告中与当堂教学内容相关的实验部分,并及时利用课堂时间进行交流汇报和演示。老师可通过直播平台,控制学生机器,对学生的实验问题进行直接和及时的解答。课后,学生可以充分利用QQ群讨论和交流,分享数学建模和算法开发经验,对综合实验已经实现部分进行组装和测试,并及时调整后续实验设计方向。课程结束,可以将课程综合实验报告精彩的演示汇报上传教学平台,供学生二次学习和讨论。综合实验报告涉及社会经济管理问题陈述,相关问题的数学或统计模型构建,算法设计和程序代码实现,输出结果、测试和分析等。针对以上海市创新创业项目和上海对外经贸大学万企大调查项目为题的小组,要求给出项目资金使用明细。这样,学生通过课程综合实验,将数学建模、算法设计和社会经济管理问题相结,不仅提高了Java编程能力,还可以一定程度掌握项目管理和财务表格制作。

参考文献:

[1] 张盖伦.7大专业课程都有明确目标教育部全面推进课程思政建设[N].科技日报, 2020-06-12.

[2] 孙经国.坚持实事求是[N].解放军报,2019-07-31.

[3] 徐艳艳,陈广贵.关于如何激发学生学习数学分析课兴趣的几点思考[J].高等教育研究,2014,31(1):18-20.

[4] 郝以雪,李君,谢合明.论慕课对财务管理专业教学的影响[J].高等教育研究,2015.32(1):34-36.

[5] 王文奇,刘保县,田荣燕等.利用多媒体和即时通信软件提高教学效果[J].高等教育研究,2014,31(4):35-37.

[6] 唐明伟.信息网络化条件下教师角色的转变与教学方法的改进[J].高等教育研究,2014,31(4):38-41.

[7] 张向华,李军.新建地方本科院校培养本科技术技能型人才的思考[J].高等教育研究,2015,36(1):62-64.

[8] 張晓黎.财经院校《计算机应用基础》教学改革探讨[J].河南职业技术师范学院学报,2009(1):122-124.

[9] 王钊,汤子健.基于涨落模式的时间序列相似性度量研究[J].计算机应用研究,2017,34(3):697-701.

[10] 李敏,于长永,张峰,马海涛,赵宇海.基于LSH的时间序列DTW相似性查询[J].小型微型计算机系统,2019,40(10):2155-2159.

【通联编辑:王力】

猜你喜欢
课程思政
高校思政课程的现状与改革措施研究
课程思政理念下英汉口译教学改革