李方东
(安徽农业大学 理学院,合肥 230036)
(1)大数据技术涵盖了众多学科的理论和知识,包括计算机、数学、统计、物理、信息和云计算等。大数据技术融合多学科理论和多专业技术知识,应用范围广泛,交叉学科能力非常强。其中云计算作为一个非常成熟的大数据分析平台,动态调度各个计算资源、存储资源和网络资源,同时具有很多以前分析平台所不具备的能力,云计算具备冗余配置可靠性,可以整合不同性能的硬件,性价比高,可以按需求分配,合理利用计算存储资源,有效避免资源的闲置和浪费。
(2)数据科学与大数据专业教学中,理论教学学习各种基础计算机、数学统计知识、数据科学的模型[1],专业教学学习大数据概念、形式、方法,在当前,大数据的各类平台层出不穷,计算模型更是多种多样,为了应对数据的爆炸式增长,算法方法更新升级也越来越快。现在各高校普遍在大数据专业教学上无经验可循[2],大部分都在探索阶段,这在一定程度上就要求理论学习和专业实验实习实践教学要及时地根据新形势新方法进行设定。实验实践教学能紧跟时代步伐,就要建设好教学的平台和实验实践内容。校外各种大数据相关的培训机构良莠不齐,其中不乏有高质量的学习经验,可以考虑从中学习合适的实验教学经验。
(1)大数据是一个数据集合的术语,只指一种数据集合,它的大小超出了当前常用的软件工具在可接受的运行时间内进行管理和处理。数据量的庞大、种类繁多、来源丰富、价值低是大数据的特点,其中大数据的价值主要体现在对大数据集合的处理的效率上[3]。大数据的相关技术从当前的基本平台架设逐渐过渡到侧重大数据分析、云计算、云数据库、各种数据安全管理等。越来越多的人着眼于研究大数据分析、数据挖掘、深度学习、机器学习和人工智能等利用大数据来更好地服务人类中。所以,一个完善合理的可以培养人才的实验实践教学平台,对本科大数据专业的教学至关重要。
(2)当前大数据的教学平台多种多样,但他们的一个核心内容就是,提供虚拟化、模块化和可视化的界面,大部分基于B/S(Browser/Server)体系结构设计开发[4],是架设在云平台上的一个教学平台,最终展示给学生和老师的界面就如同在操作一个网页,而且可以集成多个可以利用计算机解决的实验课程,充分给予学生自主学习的机会,锻炼学生自主学习的能力,利用模块化的操作,把平台架设难以理解的部分变为可以“看的见、摸得到”更易操作的过程。
(3)云平台整合现有资源,通过虚拟化技术,向老师和学生提供符合需求的服务器计算资源、存储资源和网络资源,再利用分布式计算和存储的特点,保证了数据安全的同时也合理高效地利用了软硬件资源。在云平台的支撑下,学生通过申请多台虚拟机,可以自行选择安装系统、安装软件、配置参数、架设各种平台、模拟各种数据分析,甚至可以去开发相关软件,更好地去完成实验实践的要求,而这些都是可以在计算机上完成。虚拟化的云平台可以根据当前大数据各种分析软件的更新和换代,制作新的虚拟化的运行环境,引导学生可以跟上知识发展的步伐,更好学习。
(4)大数据的实验实践教学平台建设上,需要满足架设容易,维护方便,有高容错性和稳定性。现在很多平台就基于免费开源的Hadoop工具,Hadoop提供了较高的存储可靠性,也能很好地利用现有的计算存储资源,并且具备后期系统可扩展性,有利于升级系统和平台内容的更新[5]。Hadoop使用HDFS分布式存储架构,可以基于此开发一些云存储的实验实践设计内容。Hive、MapReduce以及Spark都是可以假设在Hadoop平台上。利用MapReduce的优势,可以去设计数据挖掘和多种算法库供学生学习和使用。Hive作为大数据的数据库,把元数据存储在mysql上,很多sql语句与mysql数据库相同,方便学生学习和实验。
(1)从硕士研究生扩招,尤其是专硕比例的增加,可以看出当前各个高校都在从重理论轻实践的教学中转向实践同理论一样重要。大数据实验课程的设置上,一方面要结合数学和计算机的相关课程,也要有自己专业性的课程,比如Hadoop的理论和实践操作,如何在虚拟机上配置Hadoop大数据平台。在进行大数据编程MapReduce的操作时,首先要了解Hadoop平台的运行和配置,这样才能更好地去理解程序运行的过程,了解了运行过程和特点,才能去优化自己编写的程序,合理利用资源。
(2)在多门课程的设置上, 遵循循序渐进的原则。比如在Linux系统环境下搭建Hadoop平台,首先要学会Linux系统的基本操作配置,了解Linux系统运行的基本原理,可以更具理论课内容开设Linux操作系统实验课程,课程中可以学习如何安装实体Linux操作系统或者是创建Linux操作系统的虚拟机。在Hadoop平台搭建后可以同时尝试搭建Hbase和Hive平台,了解这些平台之间的相互依存关系,在实验中有一点需要注意的就是要学会看软件的启动日志和报错日志,这样可以更准确地找到报错的原因和正确的处理方法。
(3)基本的Hadoop平台搭建成功后,接下来学生要学习实验的是大数据的存储和数据分析,常见的基本数据分析包括MapReduce编程和Hive-sql,一个是对存储在HDFS里的文件进行处理,一个是对数据库进行操作。而学习MapReduce编程,前提是要对JAVA有所了解,所以JAVA的实验课要开在大数据课程之间,和Linux操作系统一样是基础课程。Hive-sql很多是从mysql而来,所以mysql的学习也是必备条件。MapReduce编程学习可以结合很多经典案例数据,再延伸到Spark编程学习,了解Spark比MapReduce快的原理,有利于学生更好地去开发速度更快、性能更高的语言算法。平台上可以不断地重复测试编程脚本,管理端可以很好地统计出程序运行的性能,有助于学生在学习时找到自己编程方面的不足,去优化和提高自己的编程能力。
(1)如何去贯彻践行习近平总书记对高校思想政治教育的要求是当前教学模式探索中需要解决的首要问题,对学生的思想政治教育不仅仅依赖思想政治课程中对学生的教育,而是在各类课程中包括理论、实习、实践等教学过程中融入“课程思政”内容。“课程思政”是在课程教学中融入思政课程的内容,但是不能简单地从思政课程内容里生搬硬套地拿来就用,而是要实现在课程教学过程中合理巧妙地引导学生树立正确的“三观”的教育目标,可以是全面地了解各类课程包括思想政治课和其他公共课的思想政治教育方法、方式、形式,结合不同课程教授方式的特点,来提升思想政治教育引导在课程教授过程中的重要性,将马克思主义基本理论观点和方法、习近平新时代中国特色社会主义思想、共产主义理想信念、社会主义核心价值观、中国传统文化以及学校办学理念、校园文化、大学精神等内容有效融入到各类课程教学之中,尤其是实验实习实践类的课程,让学生感受到边学边体会,边学边进步,形成思政育人的协同效应。
(2)现有实验实习实践课程强调学生的实操能力,大部分的工科甚至理科类的专业都开设了一定比例的实习实践课程,这个比例还有逐渐增大的趋势,当前课程思政大多数都穿插在理论课中,主要都在课堂教室中教授,而实习实践多数都是在校外进行,针对实习实践课程如何融入课程思政也是当前教学环节中需要解决的问题。相比理论课程的课堂授课模式,实验实习实践类的课程讲授往往存在多种形式,区别较大,在课程思政的形式上也各有特点。首先,实习实践类的课程对学生和老师的专业知识综合能力的要求要高于理论课程。实验实习实践课程尤其的是专业课下属的课程考察学生全面的理解实践能力,强调学生对实操能力的训练和提升,提倡学生进入企业,融入社会,提升自己对整个社会行业、企业的全面了解。其次,从实习实践的开始到结束均有体现思政内容。实习实践类课程可以穿插着各类的“思政元素”,行为标准、道德法制意识、团队合作、个人和社会的责任、个人道德的规范等,在实践教学过程中融入多种多样多元化的“思政”形式,这样往往比生搬硬套更容易被学生接受,让学生自发地从内心感受和认识到各种正确的观念,但是这类思政的形式内容通常不是某个具体实验内容或某个知识点,而是在学生整个实践课程的过程中一点点地被学生感知,最后“豁然开朗”,想要完整凝练出具有较大的难度。再次,实验实习实践课的开设方式多种多样。教师在实习实践类课程讲授的过程中,经常扮演的角色是陪练,学生个人或多人团队的实际操作应占据更大的课程内容比例,这使得思政元素不再像是课堂上那种面对面或是一对一地“说出来”,而主要在多媒体课堂或计算机实验室开展的计算机类实验实习实践课程也越来越倾向于去实习实践基地、企业现场等校外实习实践场所完成。实际的实践授课教师、教师的教学形式、对教师和学生的考核和评价方式等均与教室里的理论课程有不同之处。这种教学形式和学习形式的区别直接使理论课程中课程思政教育总结出的经验方法放在实践类课程中不再很好地适用。因此,如何在实践教学中做好课程思政模式下的实习实践教学方案的设置,如何巧妙地融入课程思政的教育引导,如何能使知识的学习、能力的训练、技能的培养与思政教育相辅相成,探索新形式下符合新的要求的教学形式,促使知识传授与思想政治教育浑然一体,对于扎实推进课程思政教育具有重要意义。
数据科学与大数据专业是大数据的一个方向,为应对当前社会对大数据人才的需求,合理地设置实验实践课程变得非常重要,校企结合的实践是一个很好的合作方式,明确企业岗位需求的情况下,开设对应的技能课程,同时学生还可以去企业进行实践,锻炼培养学生的学习动手能力,确保学生步入社会后具备大数据应用能力。明确人才培养的方向,数据科学与大数据专业在培养方案上要保证经过4年的学习实践,学生具有较强的大数据平台上的软件开发能力和数据处理能力,对大数据的基本平台框架理论了然于心,对平台的维护和优化也有足够的训练经验,能完成从架设平台到维护优化再到开发的过程。在确定了理论课程后,可以和企业结合开设校企结合实训平台、实训室,实训室可以配置完善的计算机和网络设备,给予学生充分的实践机会,模拟接近真实的大数据平台管理。培养出的专业人才经过多重实践锻炼,在毕业后能够快速地进入工作岗位、适应岗位要求。