曾万聃,周敏奇,王志敏,于万均,肖立中
(1.上海应用技术大学 计算机科学与信息工程学院,上海 201418;2.华东师范大学 计算机科学与软件工程学院,上海 200062)
关于“大数据课堂”建设的思考
曾万聃1,周敏奇2,王志敏1,于万均1,肖立中1
(1.上海应用技术大学 计算机科学与信息工程学院,上海 201418;2.华东师范大学 计算机科学与软件工程学院,上海 200062)
随着大数据应用的深化,大数据已经融入到与计算机相关的各级课程教学中,成为一项具有挑战性的任务。文章提出了“大数据课堂”的概念,指出要结合课程专业领域的需求和数据特点,对原有教学内容和方式进行积极创新和改革。同时剖析了大数据课堂的特点,提出了大数据课堂的建设方案,指出了大数据课堂的内涵和发展趋势。大数据课堂有利于提高课程的国际化程度,提高课程内涵和专业知识的应用程度,对于课堂教学的改革具有与时俱进的应用和研究意义。
课程改革;大数据;大数据课堂
周敏奇,江苏苏州人,华东师范大学计算机科学与软件工程学院副教授,博士,主要从事大数据研究。
王志敏,湖南天门人,上海应用技术大学计算机科学与信息工程学院讲师,硕士,主要从事软件项目管理研究。
于万均,吉林德惠人,上海应用技术大学计算机科学与信息工程学院教授,博士,主要从事人工智能的研究。
肖立中,上海市人,上海应用技术大学计算机科学与信息工程学院副教授,博士,主要从事软件工程研究。
随着大数据应用的兴起,近年来对于传统数据处理的方法、理论、技术以及相关人员的教育培训都提出了新的内容和挑战。大数据存在于生产、生活各个领域,包括传统行业数据的整合、个人用户的信息汇总、在线电子商务、搜索引擎,以及军事、科学研究、教育、银行等。大数据以其大量(high volume)、高速(high velocity)和多样化(high variety)的特点,已经不再仅停留于概念或抽象的范畴,而是深刻地融入到教学、科研和产业等各个方面,并将对生产、生活产生巨大的影响力。通过近五年高校毕业生就业及薪酬统计数据发现,大数据是最具发展潜力和应用价值的就业领域之一。盖特纳咨询公司统计:大数据将带来440百万个IT岗位以及上千万个非IT新岗位[1]。可见在目前人才过剩、就业不景气的大环境下,大数据就业领域仍然存在供不应求的现象。大数据人才的培养已经超越了应用领域的局限,亟需从人才培养这个环节抓起,从课堂建设的教学内容和方式方法上,进行大数据课堂的改革。[2][3]
大数据课堂在国内外已经引起了众多研究机构和高等院校的重视,他们在各自相关领域的研究基础之上开展了大数据的研究,或者在跨领域的大数据应用、教育和研究中,展开了积极的工作。美国卡内基梅隆大学较早针对大数据应用和工具的研究开设了专门的课程, 侧重于对大数据专业技术和工具进行教学。华盛顿大学在计算机领域各分支的基础之上系统深入地对大数据展开了研究,在大数据基础上研发了专门的系统并实现了示范性的应用。澳洲昆士兰大学对大数据的行业领域应用研究取得了很大进展,例如在时空数据、车辆轨迹和Web数据等领域的应用。加拿大Simon Foster大学韩家炜教授带领的课题组,最早展开了大数据领域的研究,在数据处理方面取得了丰硕的有代表性的成果,是大数据领域的先驱者之一,他们的《数据仓库与数据挖掘》教材是全球数据领域公认的经典教材。[4]随着大数据研究和应用的深化,大数据出现了跨领域纵深发展的趋势。大数据的方法理论体系,已经远远超越了最初的计算机领域的限囿,成为了各领域、各行业竞相研究和发掘的新领域和增长点之一。在成熟的计算技术、网络技术和体系结构技术的基础之上,大数据以迅猛的势头发展到了行业应用中,也将很快深入到高校乃至小学、初中学校的课堂教学当中。
大数据不再拘囿于计算机领域的研究课题,已经成为能够解决各行业实际问题的利器。[5]例如,在医疗诊断行业利用大数据进行远程诊疗,对病历数据进行统计分析,能够对疾病诊断和预测起到更加有效的作用;在心理学领域,利用大数据分析,可对大样本的统计群体开展调研,进一步利用计算工具对样本数据作以分析,能够取得比人工和单纯的计算机系统的方式高得多的效率和精确度,以及更加丰富的统计结果; 在大气环境和气候监测方面,大数据分析能够对大气质量提出更细粒度的和实时的监控结果;大数据还可以应用在海关监控、禽类饲养、物业管理等广泛的领域中。
大数据的研究和应用具备深远的、强大的发展潜力和巨大的经济效益,然而目前不论是国内还是从海外大数据人才市场现状来看,都存在巨大的缺口,大数据人力资源亟需从高校人才培养中重视起来。现状是,大数据人才、教育和行业需求存在脱节的状况,大数据课堂教学作为一个全新的概念还处在起步和萌芽阶段,但是随着国内外大数据应用的巨大推动,学校大数据课堂也将很快成为一个飞速发展和极具竞争性的新鲜领域。
1.大数据课堂的概念
大数据课堂是指在各级学校,尤其是高校课堂教学中,以大数据应用为导向,以大数据问题为驱动,针对课程的内容,结合课程应用领域的需求和发展,积极创新高校课堂建设的内容、方式以及方法的提升和改进。大数据课堂不仅是一个概念,还是顺应目前全球大数据应用如火如荼的发展势头的前提下,顺应行业发展需求和人才培养需要而提出的一种课堂教学理念。这和我国倡导的高等教育和人才培养的“人文科学和社会科学相融合”的理念是一致的[6],大数据课堂也是以此为本的。人才培养的知识和技能是可以逐步培养的,但是知识的理念和素质是在长期的人才培养和资源积累的过程中,逐渐形成的。因此,大数据课堂不仅可以在高校本科生课程教学中实现,甚至大数据的思想理念可以推广到专科、高中甚至中小学生的课程教学中。
大数据课堂与传统课堂的不同在于,大数据课堂是融入了实用领域思想和大数据问题驱动的一种课堂教学,是对传统课堂内容、方式和方法的提升。传统的课堂教学主要体现在教材内容和实践等环节,但是对于实际案例、专业知识与实际问题的结合程度不够,尤其对于应用大数据问题的解决,是一个全新的教学内容。
2.大数据课堂的内涵
大数据技术是以计算机、统计和Web等知识为基础的应用技术,包含了从技术积累、应用问题凝练到课堂教学的递进实现。大数据课堂以传统课堂教学为基础,在内容上能够体现出大数据问题,在体系上注重大数据在各个环节的有机统一,在形式上能够突出大数据应用的需求和特点。[7]大数据课堂是在传统课堂教学基础上对大数据问题的抽象和凝练,是从书本知识到实际运用的深化,是现阶段高校课堂改革面临的新机遇。
(1)课程内容体现大数据
大数据是“从实践到理论再到实践”的一个循环实现,在传统的课堂内容中需要体现大数据体系的各个步骤,及其与课堂内容的有效结合。大数据课堂是大数据在课堂教学中的成果体现,它的实现需要从课程内容的各个环节入手,增加体现大数据思想的内容。原有的课堂教学基本以教材为依据,教材内容体现了课程内容的循序渐进、由浅入深。相应地,大数据课堂内容应该紧密结合教材内容,包含元数据的建模、数据算法、数据分析、系统结构、大数据原子问题和大数据的应用问题等循序渐进的步骤。
(2)课程组织体现大数据
大数据课堂组织以大数据的目标为导向,本着覆盖全面、体现重点的原则,在课程中重点建设具有代表性的大数据教材内容范例。由于大数据问题涵盖内容广,因而在原有课程内容的各个章节全面体现大数据的思想(尤其是与计算机和应用相关的课程,例如数据库、管理信息系统、统筹学等)是一个长期的建设过程。目前首先应该做到:在课程中全面体现大数据思想的同时,选择重点章节进行大数据案例的实现,构建大数据样例课程。这是大数据课程建设的第一步。
(3)课程教学方法体现大数据
之所以提出大数据课堂教学,是因为它包含了内容和表现形式两者的结合,是大数据和课程内容整合,并通过课堂表现的一种形式。在传统课堂教学中体现大数据,需要相关的专业培训,以在教学方式方法中利用大数据的思想和工具实现新的突破。例如,美国某阅读培训机构通过大数据工具的使用,随机地在海量的Web数据中选取样本,然后进行读者阅读测试,对测试结果进行评价。利用大数据工具,首先在样本上,样本数据量更大,样本的内容更加多样化;在评价方式上,可以通过大数据分析,得出阅读能力评测、对不同类型和不同难度的素材掌握的程度,以及重点分析某些词或者句子的掌握能力。通过大数据分析能够实现考察内容和考察对象的双向考察、分析和统计。
1.内容创新
传统的数据既需要处理相关的教学内容和方法,也需要面对新的形势、新的需求做相应的更改,适应新的发展需求、社会需求和人才需求。[8]以高校为例,目前已有的跟数据处理相关的课程包括数据结构、算法、数据库等。针对目前海量数据处理的性能、速度和数据量等特性,结合传统的基础教学内容,进行新的教学内容和课程体系的改进,是一项正在进行的工作。针对目前的大数据的技术特点和行业设定教学内容,合理安排教学的进度和梯度,是目前数据教学中需要考虑的问题。
2.大数据驱动
根据课程大纲要求,在保证课程大纲内容完成的基础上,大数据课堂能够结合本课程相关的专业领域需求,进一步深化书本知识,设计和实现基于问题驱动的大数据课堂。大数据课堂侧重需求和实例分析,案例要分层次,讲解详尽细致。大数据课堂的关键在于人才的大数据意识的培养,因而教师在进行案例分析的时候,要本着以点盖面、层层深入的原则,使学生深入理解和掌握大数据的基本思想和方法。
3.教师培训和师资
由于大数据涉及的专业知识性较强,因而大数据教学既要从课堂人才培养抓起,也要从教师师资抓起,做到双管齐下。同时,大数据课堂既需要培养专门的课程任课教师在大数据方面的专业素质,也应该积极培养专门的大数据人才。
学校应该保持专业课程体系、教师和工业产业结合的人才培养模式,积极组织学生进入公司实习、实训,因而建立专门的大数据人才培养合作单位和平台也是当前必要的工作之一。
一辆丰田普锐斯汽车电池含有9千克之多的稀土元素镧;大型风力发电组的磁铁需要227千克甚至更多的钕;军队更需要稀土用于制作夜视镜、巡航导弹和其他武器。利用稀土材料,我国成功地实现了高速飞行器的整体测温和神舟飞船的减重……目前只有中美两国掌握了“高速飞行器的整体测温”这一技术,稀土材料起了大作用。
大数据课堂建设需要以大数据为理论基础的教材结构的支持,以及相应的教学对象的参与和反馈;需要构建完整的以数据为核心的数据采集、数据分析和数据呈现体系,及其在此基础之上的大数据课堂的认知和教学的学科结构。学科结构是学科知识内容的载体,它既引领了课堂教学内容的知识结构,又决定了学生对于知识的认知层次和水平。[9]合理的层次结构有利于教师对知识的系统性梳理、把握和提高,同时又有利于学生认知的客观性、启发性和能动性。大数据课堂的构建,尤其针对于大数据相关的基础学科的知识构建,有着决定性的作用,例如计算机应用专业、软件工程专业和计算机科学与技术专业等,这些信息类的基础学科尤其需要重视面向大数据的学科知识体系的构建,以及与大数据配套的知识运用和实践平台。好的专业知识结构既能够提供基础专业知识的覆盖和框架,又能够保持内容组织的客观性和启发性。换句话说就是既能够体现知识的客观性和系统性,同时又能够保持一定的思维空间和创造空间。
大数据课堂知识体系的建设既要能够激发教师的思想活力和创造力,同时又保持学生对于知识的好奇和激情。这是构建一个良性健康的知识体系的目标,也是必要条件之一。
对于知识结构不假思考和长期延用,只知遵循守旧僵化、教条的知识体系以及由此衍生的专业相关教材体系、配套的教学方法和由此产生的教学成果,也只能是缺乏活力和创新空间的本本主义。人民生活水平的不断提高和物质生活的极大丰富,都为新一代的成长和学习提供了优越的环境和更加新颖多样的知识获取渠道,因此学生和教师都迎来了富媒体时代的新型知识结构。
大数据知识结构意味着在涵盖了传统的数据处理的专业课程的前提下,开设了大数据处理方法、工具和应用案例课程的知识系统。大数据知识结构相比传统课程的知识结构,有以下特点:实时性、密集型、多维性。随着对于大型的数据操作、数据维护和数据安全等方面不断的应用,数据呈现出线性级别乃至指数级别的数据实时特性;随着大数据应用边界逐渐模糊,大数据呈现出数据的融合特性以及基于融合数据的分析和决策等功能;大数据中心、各类应用的数据融合、同行应用的从顶到下的数据融合,大数据逐渐趋于密集的态势,使得对于大数据的分析、分类和分析决策等成为一项重要的任务,新型大数据分析工具和运行环境也应运而生。
知识结构的表述影响了知识传授和接受的效果,对于学科专业的发展和知识本身的创新影响深远;知识结构包含了内层知识结构和外层知识结构,大数据知识结构的内层包括大数据学科建设、大数据基础课程、大数据课程实践以及大数据的研究和改进;在大数据内层结构的构建基础上,积极建设大数据的外层结构,包括大数据工具的开发、大数据技术开发、大数据行业领域的应用、大数据的公共平台,乃至大数据的领域融合的实践。大数据知识结构的发展是内层结构的延展和内外层结构的互相促进和发展的结果。在大数据知识结构构建之初,能够理性、客观地分析大数据的课程特点,在结合原有知识体系的基础上,构建合理、有效的大数据知识结构是具有重要的实际意义和影响深远的一项任务。大数据知识结构是针对大数据的环境和应用以及数据本身的特点而设计,所以要充分考虑大数据应用的特性,构建一个系统性的、开放性的、循序渐进的知识结构。大数据课堂的知识结构在内容上涵盖了大数据的基础课程,在结构上体现知识的层次性和系统性,同时又有一定的知识空间,能够客观、理性地看待变化中的大数据及其应用和技术。大数据知识体系尤其需要对知识的来龙去脉、知识结构给予客观和充分的阐述,同时又需要保留一定的空间,使得知识的表述不是既定的条条框框,不是填鸭式的被动接受,而是赋予启发性和思想性。
图1 大数据知识结构构建图
大数据问题来源于实际应用的问题,以金融领域的大数据分析问题为例:从2008年起中国建设银行发卡量达到500万张,到了2010年增加了一倍,金融业务线性膨胀,数据存储和维护等均面临巨大的挑战,这时利用大数据分析技术和工具,对银行数据进行整合和分析,能够实现弹性的实时的业务分析。
在进行案例分析时,分成以下几个步骤,各步骤具体内容如下:首先分析业务流程,然后按阶段分析业务流程数据;其次,根据原始业务逻辑,进行数据建模、元数据语义提取,然后对数据过滤和存储;第三,按照系统化分析方法,根据系统和流程将业务流程进行划分,选择各阶段的数据分析方法和工具;第四,进行大数据的采集、汇聚和分析等。从以上例子的特殊性来看,金融业务存在安全隐私性、金融业务的实时性这两个基本和重要的非功能性需求,那么在进行大数据实现的时候,就需要充分考虑到应用业务的特定需求,制定相应的大数据系统。
大数据应用的划分门类复杂,不同行业中的大数据呈现出特定的领域特性,因而进行大数据分析和应用的同时,需要以应用需求为导向,根据数据的特点进行纵向的数据粒度的划分以及横向的数据类型的聚类,这些都对大数据分析有积极的意义。大数据研究的新型需求,包括对于大数据的响应时间的要求、分析数据的规模要求、性能要求以及大数据的更加丰富的语义要求,都可以在原有的数据分析平台功能的基础上,进行升级、改进和功能模块的添加等。如何在现有的传统的数据分析平台基础上,有效地利用现有资源,并及时地采用新型工具和平台,对原有业务功能进行整合和改进,也是一项重要的任务。
由于课堂的局限性,大型的业务不可能在课堂上得到完整的呈现,这就需要教师针对学生的兴趣爱好以及课程的重点,对业务进行细粒度的划分,抽取适合于课堂讲解和利于学生理解的实例;并且对于同样的例子,不同的课程选择的大数据教学也不相同。例如,假设存在两个课堂:一是数据库课堂,二是软件工程课堂,对于上述例子,它们的大数据策略重点也都不尽相同。以非功能性需求为例,上述系统中的安全性问题,在数据库课堂可以选择在元数据操作上的约束,来限制数据访问的操作;对于软件工程课,可以重点讲解系统层次对于安全问题的实现等。
大数据课堂不仅是高校课程建设的重要一环,在不远的未来还将成为高校教师尤其是工科教师的必修课程。高等教育的职能,即培养专门人才、服务社会和科学研究[10],充分把握大数据的机遇、挖掘大数据的资源和掌握大数据的基本技能,应该以高校的课堂建设作为起点。目前我国大数据的主力军是在工业领域和学术研究领域,高校培养的人才还不能满足大数据所需,大数据课堂建设需要高校在课程建设、人才培养和师资上配套用功。关于大数据课堂建设的关键问题,可以从以下几个方面着手,以打破大数据课堂的瓶颈,使高校大数据课堂积极稳步发展。
1.大数据的意识
大数据课堂的建设是课程建设、人才建设的延续,是在原有课程建设水平基础上的提高,是顺应我国大数据经济潮流的高校课程建设的必需,是高校课程国际化建设[3]的必游之旅。目前,我国高校课程建设中的大数据教学还处在起步阶段,大数据意识还比较薄弱。高校课程建设可以积极开展形式丰富的大数据实践培训,和行业发展的领军人物建立更多更稳定的校企合作平台,使大数据平台能够有长期发展规划和阶段性的目标。
2.大数据课堂的考核
大数据课堂建设需要量化的考核目标,可以建立校内、课程小组等多种形式的考核或组织竞赛,让更多学生、教师通过多样化的大数据考核形式,深化对于大数据的认识,熟悉大数据的基本技术。大数据课堂的考核,可以通过建立可度量的量化衡量指标和奖励的形式,来鼓励任课教师的大数据课堂建设。
3.大数据课堂的运用
大数据课堂建设蕴含了丰富的建设内容,例如包括教材的改革、教学PPT的改进、课程光盘、案例库等。大数据课堂由于增加了相应的大数据教学内容,因而需要配套的教学进度和课时的调整等,这些也都是需要考虑的问题。大数据课堂可以通过多媒体、远程课堂、实训教学等多种形式开展。
大数据课堂建设是课堂建设、教材建设和人才建设的延续,是我国大数据经济潮流下的人才培养的亟需任务之一。大数据课堂建设能够提高人才培养质量,激活现有课堂内在潜力,使人才建设朝着校企互动和全球发展的大数据潮流稳步前进。
大数据课堂建设需要大数据知识体系的支撑、大数据教学环境的支撑和大数据实践平台的支持,鉴于此,构建一个行之有效的大数据课堂是一项创新性的、综合性的任务。大数据课堂建设蕴含了多种建设形式和建设内容,这是当前阶段课堂建设的新目标、新任务。
[1] Remain Scarce. Highlight for Survey Analysis: Big Data Investment Grows but Deployments Remain Scarce in 2014[R]. http://www.gartner.com/it-glossary/big-data/.2014.
[2] 孙曙辉,刘邦奇,李新义. 大数据时代智慧课堂的构建与应用[J]. 中国信息技术教育,2015,(1).
[3] 梁文鑫. 大数据时代——课堂教学将迎来真正的变革[J]. 北京教育学院学报,2013,(1).
[4] Jia Wei Han, Micheline K, Jian Pei. Data Mining: Concepts and Techniques[M]. 北京:机械工业出版社,2012.[5] 艾伯特—拉斯洛·巴拉巴西. 爆发:大数据时代预见未来的新思维[M]. 北京:中国人民大学出版社,2012:23.
[6] 陈雅芳.追赶国际趋势改革高校课程体系[J]. 中国高等教育,2002,(Z1):27.
[7] 张韫. 大数据课堂的雏形[J]. 上海教育,2013,(12).
[8] 王文平. 论大数据时代的教育特点与课堂教学[J]. 长江师范学院学报,2016,(1).
[9] 布鲁纳. 教育过程[M]. 邵瑞珍,译. 北京:文化教育出版社, 1982:32.
[10] 杨德广. 高等教育学[M]. 北京:高等教育出版社,2009:578.
Ideas about the “Big Data Class” Construction
ZENG Wandan1, ZHOU Minqi2, WANG Zhimin1, YU Wanjun1, XIAO Lizhong1
(1.School of Computing Science and Information Engineering,Shanghai Institute of Technology, Shanghai 201418; 2.School of Computer Science and Software Engineering, East China Normal University,Shanghai 200062)
With the deep development of the big data application big data has merged into each level of computer related educations and become a challenging task. The paper proposed the concept of the big data class and indicated to make positive creation and evolution for the original teaching methods and contents according to the requirement of characteristics of the big data. The paper explained the properties of the big data class and gave the construction plan of it. Further the paper explained the inner sense and developing trend of the big data class. The big data class is benefit for the international degree of the class and it is also helpful for the enhancement of the value of the class. The big data class construction has very important impact for the application and the research of the class reformation.
class reformation, big data, big data class
本文系上海自然科学基金面上资助项目 (13ZR1413200);吉林省教育厅“十二五”科研基金资助项目;上海应用技术大学科研启动资助(YJ2016-27)项目;国家重点研发计划资助(2016YFC1201605)项目。
曾万聃,吉林长春人,上海应用技术大学计算机科学与信息工程学院副教授,博士,主要从事大数据和分布式计算研究。