辜 姣
(江南大学 理学院, 江苏 无锡 214122)
基于案例教学的大数据课程教学实践探索
辜 姣
(江南大学 理学院, 江苏 无锡 214122)
近年来,随着大数据技术的蓬勃发展,企业、学校和社会都对大数据人才培养保持高度关注。为了更好地开展大数据课程的教学工作,本文结合大数据的真实案例,分析出大数据具有多维度和自洽性的特点;根据在教学过程中遇到的问题,提出引导学生学习机器智商、使用案例教学,采取多元融合教学模式的解决方案;对大数据课程的开展进行了一些教学尝试和探索,为大数据课程的建设提供了一定的思路。
大数据; 案例教学; 机器智商; 多元融合
当今社会是一个科技高速发展、信息高速增长的社会,大数据是这个高科技时代的产物。近年来,随着大数据的蓬勃发展,企业和社会都迫切需要大数据相关人才。随着国务院《大数据发展行动纲要》发行,高校进行大数据课程建设势在必行。根据中国商业联合会数据分析专业委员会人才统计报告,大数据人才缺口在五年内将会达到1 300万人左右。为了弥补大数据人才的巨大缺口,从学生中培养相关数据人才正是大势所趋。目前,大数据方面的研究与教育在美国等发达国家已经上升为国家战略,然而在我国许多高校并未开展大数据的相关课程和专业,社会亟需具有大数据视野的综合性人才。为了更好地开展大数据相关课程教学,根据实际课堂讲学,我们发现大数据具有多维度、自洽性的特点。此外,针对大数据课程教师教学和学生学习现状,我们探索出学习机器智商、使用案例教学与传统教学相结合、对学生进行多元教学和评价的三条解决方案,希望对这门课程的建设提供一些思路。
1.1 大数据定义
大数据(Big Data)即多数据或海量数据[1-3]。
1.2 大数据特征
业界通常用4个V来概括大数据的特征,具体而言:Volume,即数据体量巨大;Variety,即数据类型多样;Value,即处理速度快;Velocity,即价值密度低。根据实际课堂讲解以及相关案例分析,我们发现大数据还具有其他特征,即在复杂性(Complexity)层面上具有多纬度(Multi-dimension)和自洽性(Self-consistency)的特点。
1.2.1 Multi-dimension 即数据由多维度构成。当人类进行某项活动时,产生的海量数据存在于多个维度,并且互相呼应。以人类出行为例,人们可以使用公共汽车、地铁、火车、飞机、私家车等交通工具外出。首先,由于实名制,由飞机和火车承载的个体出行轨迹可以根据出行记录绘出。由地铁、公汽、私家车承载的出行轨迹可以通过城市监控录像等找出。因此,人们出行这项活动可以通过交通维度上的数据进行记录。其次,智能手机已经成为人们生活工作中不可缺少的工具,只要出行人携带手机,通过各地的基站和手机连接的数据即可描绘出行轨迹。这些数据从地理定位这个维度记录出行活动。此外,在个人出行中不可避免会进行吃饭、住宿、游玩、购物等项目。随着互联网支付的普及,在相应的网络支付运营商以及酒店运营商的商业记录里也会体现出与此次出行相关的数据。由于某项活动的数据往往同时在多个维度上产生,因此我们说大数据具有多维度的特点。
1.2.2 Self-consistency 即不同维度上的数据可以互相呼应,互相验证。仍以个体出行为例,如果个体的交通数据反映出个体在某特定时间段内在城市A和城市B活动,那么因为吃住产生的支付维度上的数据以及基站对手机地理定位维度上的数据应该仅限于城市A、城市B以及途经城市。这也意味着随着大数据技术的提高,人们对过去觉得只有“自己知道”的事情进行掩饰的难度将会越来越大。
由于大数据课程是新开课程,教学方法尚不成熟,在学习和教学过程中普遍存在以下特点:
2.1 学生学习热情高涨
社会对大数据专业人才的需求随着互联网技术的进步、全球信息产业的崛起而日益增大。加之媒体对大数据等互联网新名词的频繁使用,导致学生普遍对大数据的相关知识有着迫切的学习热情。大学生作为年轻人,对新生事物保持着较高的关注度。此外,随着一批互联网经纪公司的快速发展,也出现了大量与大数据相关的岗位招聘。因此,越来越多的学生急切地希望从学校环境中学习大数据的相关课程,掌握大数据的相关理论知识和数据处理技术。
2.2 教材相对滞后
大数据是近些年互联网的新兴事物,目前已经出版多本由互联网领域里领军人物所编著的相关书籍。如《大数据时代》[4]、《爆发:大数据时代预见未来的新思维》[5]等。这些书籍通过生动有趣的实例讲解大数据的历史与相关概念,更适合作为读物,很难作为教材,让学生集中学习相关理论、掌握相关算法以及相关数据处理技术。
2.3 大数据应用范围广泛,知识迭代较快,教学难以深入
大数据这个领域本身也在蓬勃发展,知识迭代迅速。为了让学生学习科技前沿,课程应与实际社会现象相关。而兼顾理论知识讲解和数据处理技术的展现则成为一个难点。此外,由于大数据本身也是一门正迅速发展和变化的新兴事物,许多知识形成体系呈现在课本上已经“过时”,因此教学上难以深入讲解。
3.1 引导学生学习机器智商
大数据进行数据处理的主要媒介是计算机,而计算机解决问题的思路与人类大脑擅长使用的归纳总结往往背道而驰。计算机的优势在于高速的运算速度,以及大容量的数据存储。因此,教师应该引导学生在设计算法时更多地从计算机的思考模式出发,即提高机器智商。以识别图片中的狗这一任务为例,人类通过归纳总结出狗的外貌特征,能轻松识别出图片中的狗。而计算机识别图片中狗的能力需要建立在与大量现有狗的图片数据对比上。在程序设计时,很难通过总结归纳并变成可执行的语句。如果要通过算法让计算机识别狗,往往需要进行大量的数据比对,如果相近,则认为狗在图片中,反之图片中没有狗。因此,按此思路设计算法比归纳总结出狗的特征并让计算机明白这个思路去设计算法要更加合适。在大数据课程学习中,我们发现部分学生仍然追寻归纳总结的思路,而不考虑看似繁复,却能充分利用计算机快速计算和大存储容量特点的算法。因此在教学中,我们应该让学生进行机器智商的学习,只有这样,才能使用计算机更好地对大量数据进行处理。
3.2 使用案例教学法
在现代教学过程中,案例教学法是一种常见的教学方法[6]。我们采用案例教学法与传统教学相结合,让学生扮演系统设计人员,分析用户的需求,根据所学的理论,对实际问题进行分析和讨论,并设计解决方案,完成从理论知识学习到实践和应用的过程。例如,Facebook从2010年陆续公开相关数据以来,如今有超过1 000万个应用使用其相关数据于社交网络上。我们可以使用Facebook的部分数据,设计开放性问题,如通过社交数据分析,提出有价值的市场建议。学生可以寻找小范围的Facebook数据进行分析,通过在线活跃用户量的分析找到集中社交上网的时间,对企业选择电视广告播出时间提出建议;也可以从多个热点话题分析出人们最关心的领域,为投资公司对项目的选择提出建议等。此外,虽然是开放性问题,但均建立在使用一定计算工具上。学生可以使用R、Matlab、C等不同程序语言,从而深入体会出各程序语言作为数据分析工具时的优势。使用案例教学法与传统教学相结合,不仅可以提高学生的兴趣,也能使学生提高解决现实问题的能力。
3.3 使用多元融合的教学手段和评价体系
为了提高学生的学生兴趣,大数据课程应该采取多元教学手段。不仅应该体现在知识学习上,还应该体现在教学手段和教学评价上[7]。在知识学习上,理论概念的讲解仍以传统教学为主要模式,而算法的应用则应以案例为主线组织教学,两者相结合才能更好地满足不同阶段的学习需求。在教学手段上,充分利用多媒体技术,便于学生对于知识的理解。特别是在算法的讲解中,使用动画展示算法执行过程,使学生更容易理解数据处理过程。在教学评价上,考核方式应该多元化,上课表现、案例的分析与解决、小组表现、期末考试等多元考试方式综合运用。同时理论成绩和实际成绩相结合,以小组形式,共同完成综合大作业,通过自评、互评、教师评价加权的方式进行效果评价。
随着互联网技术的快速发展,大数据分析已成为现代高端人才应当具备的基本技能之一,大数据课程的建设与开展势在必行。本文先简要介绍了大数据的特点,提出除了“4V”,大数据还具有多维度、自洽性的特点。然后,对现有大数据课程现状进行分析。针对教学中出现的问题,我们认为有下列三种途径可以使大数据课程更好地进行。首先,引导学生学习机器智商,使学生能更好地驾驭计算机这个数据处理工具。其次,使用案例教学法与传统教学相结合,在不同阶段采取不同的教学组织形式更能适应课程需要。最后,采用多元融合的教学手段和评价体系更适合大数据这门课程的开展。我们将继续进行探索和研究,希望在同行的共同努力下,为该课程的建设和发展做出贡献。
[1] 涂新莉,刘波,林伟伟.大数据研究综述[J].计算机应用研究,2014,31(6):1612-1616.
[2] 刘智慧,张泉灵.大数据技术研究综述[J].浙江大学学报(工学版),2014,48(6):957-972.
[3] 蒋亦樟,钱鹏江,谢振平.“物云大智”在现代教育中的应用与思考[J].无锡职业技术学院学报,2016,15(4):1-6.
[4] Mayer-Schönberger V. 大数据时代 [M].盛扬燕, 周涛,译.杭州:浙江大学出版社,2013:27-94.
[5] Barabási A L. 爆发:大数据时代预见未来的新思维 [M].马慧,译.北京:中国人民大学出版社,2012:245-307.
[6] 陈玉荣. 试论案例教学法[J]. 中国职业技术教育, 2004(31):19-21.
[7] 张善新. 基于多元融合的数据结构课程教学方法初探[J]. 无锡职业技术学院学报,2016,15(6):39-42.
责任编辑 俞 林
Exploration on the “Big Data” Teaching Practice Based on the Teaching Case
GUJiao
(School of Science, Jiangnan University, Wuxi 214122, China)
With the rapid development of big data technology in recent years, companies, universities and the whole society begin to pay close attention to education of talents in the field of Big Data. In order to carry out the course of Big Data well, this paper analyzes some real cases and finds that Big Data has its own characteristics of multi-dimension and self-consistency. According to the problems encountered in the teaching process, three suggestions are provided: guiding students to learn the machine intelligence quotient, employing the case teaching, and adopting the teaching mode of multi-integration. This paper discusses the attempts and explorations of the Big Data course, which provides some ideas for the construction of the Big Data course.
Big Data; case teaching; machine intelligence quotient (MIQ); multi-integration
2017-03-14
中央高校基本科研基金项目“复杂网络的归一化拉普拉斯谱性质研究及其应用”(JUSRP115A16);江南大学教改项目“大数据背景下信息与计算科学专业创新人才培养模式研究与实践”(JG2015063)
辜姣(1983— ),女,湖北黄石人,讲师,博士,研究方向:数据挖掘。
10.13750/j.cnki.issn.1671-7880.2017.03.007
G 40-012; G 712
A
1671-7880(2017)03-0023-03