朱 涛,夏玲玲,袁 明
(江苏警官学院 计算机信息与网络安全系,南京 210031)
随着国家大数据战略在社会经济各行各业的全面实施,信息基础设施云化的持续推进,行业内部统一的大数据平台逐步落地,大数据应用已经走入日常生产生活,大数据建设带来的“数据效益”强力地推动了各个领域的发展与改革。大数据作为一种新颖的思维方式和解决问题的方法论[1],已经成为各个学科专业必须学习和认识,并探索如何在本学科中应用的一项重要技术。构建不同学科背景下人才的大数据理念和知识结构,掌握在各个学科中运用数据的基本素质能力,是摆在大学本科通识教育面前的一项重要任务。
近年来,为顺应大数据发展应用的要求,各学科专业针对如何开展大数据技术通识类课程进行了初步探索。基于大数据技术与物理学的紧密关系,分析了在物理学专业中开展数据科学与大数据技术类通识课程的重要性,设计了具体的课程设置方案[2]。基于混合教学模式进行了大数据概论课程的教学改革和课程设计[3]。针对培养具有数据素养的人才所需要的大数据知识,融入丰富案例的大数据通识教材[4]也开始出现。然而,大数据知识作为通识课程来讲授还处在初级阶段,其教学内容也需要进一步研究,具有十分重要的现实意义。
智能时代来临,高素质人才知识结构中必然有大数据知识素质的一席之地,这是这一时代本科通识教育的应有之义,也是助推学科专业进步发展的新动力。
虽然人才的价值体现在其针对特定领域的专业性,但专业性是在其完整知识架构基础上,通过触类旁通的通用智慧,灵活的多学科交叉引用能力实现的单点突破。在智能时代,一切都被记录为数据。看待数据的观念,认识数据的能力,适应数据变化的思维方式,都是将大数据素质融入到专业领域,获取新知识,进而实现创新的关键要素。正确地认识了大数据,掌握了运用大数据的基本技术,学会让数据说话,进而指导实践,也就形成了大数据观念和思维,这些都有利于培养各专业人才的健全素质。另一方面,大数据本身就代表了智能时代的人文精神,必将成为智能时代人才的核心素质。数据共享的开放思想,客观数据驱动的理性思考,跨学科数据带来的广阔视野,数据偶然性和关联规律必然性形成的思辨精神,都将与人类哲学思想遥相呼应,使人类文明在每个人身上更加熠熠生辉。
具备大数据素质的复合型人才是各个专业领域在大数据时代的高端人才。这类人才熟悉所在领域知识,对信息化、智能化和大数据基础设施认识深刻,掌握各类大数据应用的功能特点,善于使用数据挖掘工具、方法从海量数据资源和周边信息中发现内在价值和规律,能够采用相应的数学模型来理性地描述问题、处理数据、解释规律和预测趋势,对挖掘结果中隐含的价值趋势、风险隐患、现象规律等有直觉敏锐感知。尽管此类人才的培养不可能经过本科院校四年学习就能够一蹴而就地“精品产出”,而进一步需要在领导决策、信息技术等多种类型岗位上,长期打磨历练,不断刻苦学习,经过对知识经验和思维技能的反复检验,才能最终培养成功。但是,大学本科教育可以在“以本为本”的根本思路上,通过大数据通识课程提出对大数据素质的学习要求,聚焦大数据核心能力培养,注重构建大数据知识框架,为复合型人才的最终养成奠定广博厚实、博学多能的基础。
当前,各个学科科研数据海量性趋势已成为智能时代科研的重要特点。大数据技术为科研工作中的数据分析、模型化描述和可视化展现,提供了强大的处理工具。同时,数学理论和方法通过大数据技术得以更加广泛地扩展到社会人文学科,推动各个学科的交叉融合发展。而且,大数据体现规律关联性的特点,也可推动学科研究的思维方式从线性因果型向网状关联型发展转变。另外,作为大数据技术的重要来源,系统科学的观念和方法已经深入应用到社会科学和自然科学研究的各个方面,而复杂性科学[5]作为系统科学的新阶段,为多个学科的发展提供了思维方式和方法论引导。大数据代表了数据密集型研究的科研新范式,强调学科交叉和系统关联,这是对复杂性科学的重要发展,为各个学科的研究发展提供了新的思路和途径。
大数据通识教育旨在健全智能时代人才的大数据人文素养,使学生能够掌握大数据基础知识,养成大数据思维,通过潜移默化的思政教育,形成大数据价值观和职业素质,帮助其在大数据领域的发展。
具备大数据人文素养的重要特征是了解大数据技术的来龙去脉,掌握其历史发展过程。这一内容不仅能提高对大数据技术的认识,还对我国大数据的未来发展有重要的借鉴意义。在阐明大数据技术的源起之后,还应当从法制变革、技术发展、国家治理与商业应用等四个方面来说明大数据对国家社会的重要意义。首先,关于公共信息的公开自由和开放透明的法制变革是大数据技术兴起的社会环境因素。我国要注重使用法律制度来保证公民个人信息的做法,实现与公众信息的有效切分,同时注意研究实施依法公布公共治理信息的途径。其次,世界各国大数据信息技术的发展路径可以成为我国社会经济各领域大数据战略实施的有益借鉴。大数据发展的关键过程,是智能时代各国社会发展都会经历的,相互参考可提供丰富的借鉴。第三,用数据来决策、管理和创新的制度过程,将使国家社会的大数据治理获益,将推动智能时代完成从生产生活数据到社会规律知识的跨越。
大数据技术盛行的背后,实际上是各类数据法则的建立、相关利益之间的博弈,阐明这些过程,对我国大数据建设有重要意义。大数据应用本质上是数据的采集、处理、使用和管理的过程。教学内容可以通过介绍现代智能社会这一庞大数据来源的数据运作和管理过程,说明数据收集的合法性,收集方式的科学性,尽量减少数据收集导致的负担加重问题。同时,在数据使用过程中,要说明注意隐私保护,即使是用于公共安全,隐私保护也是必要和必须遵循相关法律的。在数据发布时,则要关注如何在尽量免费的基础上,同时为民众提供更多的增值服务,避免产生算法歧视和压迫问题。最后,则是要认识数据质量问题,这将对社会治理的可信性和权威产生重大意义。对于我国大数据建设来说,需要借鉴先进国家社会在大数据全生命周期管理中得到的经验和教训,建立数据就是公平、数据就是隐私、数据就是权威的意识。另外,还要在大数据通识教学内容中加入针对大数据价值观的思政引导,树立大数据从业人员纯洁的思想信念,铸牢“智能和数据都为人类服务”的观念,坚决避免大数据带来的“无政府主义”“技术为上主义”等具有危害性的思想。
预见大数据技术发展的办法,就是去建设大数据。大数据技术及其应用既是国家社会发展的大趋势,也向国家社会的各个方面提出了各种各样的挑战。社会经济各领域的大数据建设,同样必须在认清这种趋势的同时,应对类似的挑战。大数据应用的深入,国家社会的资源配置将更加精细和优化,运行消耗得到有效的控制,同时还可开发出更多创造社会价值的机会,使国家和社会都受益,成为一种先发优势。在教学内容中,要重点关注数据的开放问题,相关的范围、标准,构建的平台等,都必须有相关的政策法规来支撑和保障。同时,互联网的智能大数据属性也向国家社会各个领域提出了挑战。“得数据者得天下”,如何规范数据的获取、管理和开放,将会影响到各个领域发展的多个方面;国家经济之间的竞争,都将体现在数据的收集、分析和付诸实施的行动上;如何应对收集数据、使用数据、开放数据等方面的大数据挑战。这些都是值得研究的教学内容。
大学通识教育在关注思政人文素养的同时,还必须强调以学生学习为中心的科技实践。特别是对于理工科专业,大数据通识教育可以建立起沟通基础课与专业课的桥梁,发挥融合贯通的作用。
尽管数学是大学大多数学科专业的基础通识课,但许多学生在学完数学科目后,要么在后续课程中很少使用,要么就认为数学只是用来计算的,特别是理工科专业,后续的专业课当中直接就进入了对数学的艰深运用。这说明在数学基础课与专业课之间缺乏对数学逻辑框架的构建和对应用的初步探索,尽管数学建模这一课程可以填补这一空白,但对非理工科专业,数学建模课程还是太偏数学理论了,掌握起来有难度。大数据通识课恰好可以担当这一角色使命,可以通过一些简单的大数据算法就能展现数学各门课程的逻辑框架。例如,通过对线性回归的讲解,就能清楚地说明概率统计理论是发现规律方法,线性代数是处理数据的工具,而微积分则提供了得到最优解的功能。理解数学运用中的逻辑结构后,将这些算法再通过实例应用到解决具体的问题当中去,就可实现对数学的应用落地。
作为智能时代人才,信息技术能力已经是基本素质。特别是程序设计能力,现在已经在少儿阶段就开始着重培养。但是,在大学的非理工科专业中,信息技术作为一门通识课完成,解决了基本的应用软件使用后,后续就几乎没有对信息技术能力的进一步培养了。而对非信息类的理工科专业,程序设计、数据处理等信息能力大多是通过自学完成的。因此,大数据通识课当中可以加入培养基本编程能力、数据分析工具使用等内容的实践实验课,在丰富课程内容的同时,调和理论讲解太过枯燥,实例分析又不能动手等问题,为各个学科专业课程中大数据应用打下良好的技术能力基础。
一般的通识课程,注重知识点传授的知识导向型学习,关注以教为中心的知识点传授,用知识点掌握的多少来衡量学生的学习成效。而大数据通识教育却不是这样,其本身就涵盖以学生自我学习和实践为中心的要求,通过大量问题的提出,引导学生去依据思考点和实践点来搜集资料、思考问题和完成实践,这其实就是一种研究导向型的学习过程。大数据通识教育中可以通过引入大量的示例引导学生使用大数据工具进行研究,逐步过渡到自我学习,以研究点引导学习的各个阶段。
大数据通识教育主要是培养数据挖掘和分析的基本能力,通过对数据特征、基础挖掘算法、应用实践等方面的教学,培育在大数据理论和实践应用上的职业素养。
大数据的价值源于数据本身,算法只是去拟合并逼近数据决定的性能上限,因此,大数据技术的实践应用必须对数据本身的特性有充分认识,数据特征工程是认识数据的有效工具,也是在数据挖掘的准备阶段必须完成的任务。首先,教学内容要说明针对不同种类数据如何进行特征的提取和构造。文本、图像、语音及关联型数据等各种不同类型数据的特征表现都有不同,必须能够应用专业领域知识、直觉和数学手段设计不同的特征提取方法,尽量使特征能够反映预测目标,并体现不同特征的不同重要程度。其次,教学内容要讲清特征的转换,达到满足应用要求的条件下,尽量提高模型算法的预测性能。数据的无量纲化处理、离散化、缺失值处理、异常值处理,及后续的特征组合,都是关键的数据预处理方法。随后,还要认识在尽量减少数据信息丢失的前提下,将高维多元数据映射为低维数据的降维方法,减少高维数据容易引起的过拟合问题,去除特征间的相关性,综合提取特征数据中的有效信息,达到降低模型复杂度,减少训练时间,便于进行数据可视化展现的目的。最后,教学内容还要说明特征的选择方法,以利于构造更好的模型,提高模型性能,更好地理解和解释数据规律。
数据挖掘算法是大数据技术的核心,大数据通识教育必须培养能够运用算法的基础能力。这主要有两个层次的教育进程。一是在掌握大数据结构特点的基础上,理解数据挖掘算法的基本原理、算法过程。这可以通过编程实现算法基本过程的训练方式,将算法基本原理融入到编程实现中去理解算法的基本流程,同时检验前期各类编程语言学习成效的同时,提高动手实践的水平。二是掌握算法的具体功能、性能和适用条件。这可以通过依托相关的大数据实训平台,以小任务的方式将对算法功能和性能的理解融入到解决实践问题当中,在问题场景中认识哪些算法能够适用,哪些算法能够达到应用要求,在完成任务的过程中,加强团队研讨式的训练,提高协同工作能力。
解决实际工作中的大数据应用问题是大数据通识教育能否引起学生学习兴趣的关键。教学内容可以安排在实践环节中解决大数据问题进行着重培养学生兴趣。具体来说,教师可以利用培养方案中要求的实践环节,提前安排学生在书籍、案例和文献中去寻找问题,带着问题去参加实践,在实践过程中将遇到的问题与自己带过去的问题进行类比,并尝试使用大数据技术和方法去分析和解决问题,让学生能够带着答案回到学校。
大数据通识素质是智能时代人才核心能力的基本要素,成为大学本科培养必须构建和固化的核心竞争能力。而大数据通识教育的内容则成为大数据理念和方法通识化、大数据思维泛在化的关键。通过大数据通识教育的开展,可以奠定各专业领域的大数据人文基础,让各个业务领域在大数据方面形成一致的概念理解和能力认识,构建出以各专业能力为核心,大数据素质加持的人才能力素质结构。经过多个岗位的综合性锻炼后,就可以培养出一批既懂专业领域业务,又懂大数据技术的专业人才。寄望将来,本科院校及其教师团队应该积极探索通过通识教育培养学生大数据素质能力的途径和方法,培养出更多基础扎实、综合素质强的复合型人才。