于文磊 南京航空航天大学
大数据是一个较为抽象的概念,其融合了统计学、数据分析学以及数据整理等多个学科知识与技术,可以全面的对事物做出较为准确的分析与判断,近年来,大数据技术已经进入了各行各业之中,尤其是与物联网、云计算技术等结合应用,共同推动了社会的发展。大数据技术可以高速捕获、发现和分析大量多样化的数据中的价值。传统的大学管理主要是以经验为主的主观管理模式,在管理过程中依赖于决策层自身的能力,虽然也有调研、交流、学习等方式提升管理过程中的科学性,但是整体上效率偏低,尤其是管理效果难以及时评估,需要较长时间之后才能看出效果,这对于大学管理较为不利。
数据分析的理念与概念出现的较高,通过数据分析结果,做出决策是一种科学理想的决策思维。但是传统的数据收集、处理、分析技术效率地下,需要大量的人力与物力,依然难以做到面面俱到。而随着人类社会的发展,数据的增量已然极为恐怖。大数据技术是基于这样的背景下诞生的高校的数据收集、处理、分析技术。
作为最高等级的教育场所,以数据为依据进行决策是其科学性的重要体现。这一点在每个的大学院校中体现的极为突出,美国院校基本都设有数据分析与研究机构,其主要职能就是通过数据分析为院校决策提供依据,进行科学的大学管理。通过数据分析与研究,可以建立有效的数字模型,决策者可以通过模型直观的看出管理中的问题,当大学管理出现问题时,首先就是对数据分析结果进行回溯,然后以此为依据进行决策,实现以数据分析为基础的科学管理。
大数据的大不单单指的是数据量大,还包括了数据类型大、数据来源大以及数据复杂性大。一般情况下,我们可以简单的将数据分为结构化数据与非结构化数据,结构化数据是指不同数据之间的存在着较为明显的联系性,结构化数据分析的作用很多,但是全面性不足,传统的数据分析技术由于分析能力有限,主要是对结构化数据进行分析。非结构数据分析极大的提升了数据分析的全面性,在大学管理中应用,可以提供更为全面科学的决策依据。比如在对学生进行评价时,不单单是分数、技能、学术活动、在校经历等指标性的评价,学生的价值观、道德观、人生态度等非指标性的评价也非常重要。指标性评价的数据统计分析非常简单,通过历次考试与活动的记录即可以清晰评价,但非指标性的评价要想保持客观性较为困难,因此在传统评价中多以主观为主。而大数据可以解决这一问题,其通过对学生在校期间产生的所有数据,如社交平台数据等,进行分析处理,可以全面的揭示学生行为与心理发展过程,进而进行全面科学的评价。
有因就有果,这是我们常说的一句话。因果关系是我们探索世界的基本思维模式,大数据技术就是探寻数据因果关系的一种技术。数据相关性是数据研究的基础,随着大学教育信息管理系统的完善,院校数据库越来越丰富,其内蕴含的财富也越来越巨大,院校决策者与研究人员从中寻找因果关系,发现新问题成为提升大学管理的重要途径。比如,我们常认为按时吃早餐可以有效提高学习效率,但是复旦大学宓詠老师通过挖掘学生早餐消费次数与成绩绩点(GPA)的关系发现,早餐次数较多的学生成绩绩点不会太低,但早餐消费次数较少的学生中成绩绩点高的也大有人在。说明,早餐与成绩并无直接关系,这打破了我们原有的惯性思维认知带来的偏差。
现阶段我们正位于大数据蓬勃发展的时代,大数据在我国高校中的应用效果也初见端倪,但是需要承认的是,在整体上我国的院校研究还落后于先进国家,尤其是美国,而相比于我国的电子商务等行业,大数据技术在院校研究中的应用也有所不足。突出表现在软件、算法、工具等方面,要想改变这一现状,需要做好以下几点内容:
大数据及时的核心是数据,因此数据文化的营造非常重要,只有营造好数据文化,切实意识到数据的重要性,提高数据的质量才能更好的发挥大数据技术的特点与优势。首先要认识到数据是客观存在的,是理性思维,科学决策的基础,避免经验主义,主观决策的思想;其次要保证数据收集的真实性与一致性,提高数据质量,高质量的数据才可以提供高质量的决策依据,尤其是在数据爆炸的当下,不实数据与垃圾数据横向,要缺少提高数据的甄选能力。
数据系统的建设是大数据技术有效实施的基础,在大数据时代的院校研究中要切实加快数据系统的建设,尽快将不同院校纳入到数据系统之中,实现数据信息的公开、共享与应用。比如学术数据系统,知网空间就是一个较为成功的范例。要做到以下几点:
(1)完善以国家为主导建设的教育信息管理系统,推动其逐渐向社会与高校开发,通过设置不同权限保证其安全性的同时,提高其共享性,发挥社会功能。
(2)建立高效减的数据系统联盟,实现高校间的数据共享。在推动过程中,要注意设置不同高校间的界限,严格区分可共享数据与不可共享数据,促进学术交流的同时,保护院校师生的个人信息安全。
(3)制定统一的院校数据标准,开发一套共同话语和标准界定以及科学的操作流程,有效整合院校研究数据和资源,实现行业整合发展。
数据系统的建设是基础,数据挖掘分析是手段,而数据的应用是目的。做好数据系统的基础后,要切实提高数据的挖掘分析能力。数据挖掘技术是针对计算机的数据库进行全方面的分析与判断,从而寻找出有效信息的一种技术。在我们的日常生活中会产生大量的数据,这些数据可能是有用的,也可能是无效的,数据挖掘就是对所有的信息进行深入的发掘,寻找有用的信息。分析不同信息之间的关联,进行聚类与分类。通过数据挖掘之后,原本纷乱繁杂的信息并的井井有条,可以为相关的数据分析与数据决策提供基础。数据挖掘的应用场景不同,其应用目的与相关算法也有所区别,要根据实际应用需求选择与数据特征相关的算法。数据系统建成之后,数据挖掘技术是实现大数据技术进行院校研究的基本手段。
总之,对当前中国院校研究而言,知识和智慧是最有价值的,但是数据库建设和运用数据的技术是最为紧迫和关键的。数据也是现代大学管理的一个新的战略制高点,我们必须通过有效的院校研究,用数据改进大学管理、用数据推动中国大学创新。