文/本刊记者 王左利
校园大数据规划先行
数据只有在流转中才能体现其价值,有价值的数据才能引起使用者的关注,使数据权威生产者变被动为主动地去维护数据,以保证数据有效性。
文/本刊记者 王左利
从全国来看,对校园大数据最感冒的就是上海市的高校了。从2012年开始,包括复旦大学、华东师范大学、上海财经大学等在内的一批大学不约而同开展了对大数据的探索。虽然这种探索还是不成熟的,浅层次的,但在全国来说仍然是一种先行者的角色。
复旦大学信息办主任宓詠认为,校园信息化过程中产生的数据来自于不同的层次和分类,既有人事、财务、资产、科研等常规管理型业务产生的结构化数据,又有多媒体教学资源等非结构化数据;既有用户使用网络产生的行为数据,又有物联网、移动互联网感知到的位置数据等。这些数据围绕着面对教师或学生的服务与管理而产生,存在碎片化、持续性等特点。
“碎片化”指无论是业务数据、教学资源数据或网络行为数据,都从某个侧面反映了“人”的一个属性。例如,从图书馆获得的论文数据、科研管理部门拿到的项目数据,都直接或间接反映了教师的科研能力的一个方面,只有将不同来源的数据进行有效整合,并建立量化分析模型,才能清晰准确地判断教师个人的科研能力。“持续性”则体现了校园科研、教学和管理业务的规律,例如一卡通消费、上网时长、每个学期选修课程、获得学分以及重修重考等数据能够反映一个学生的生活习惯与学习进步的相关关系,但这必须基于长期、持续的数据进行统计分析,仅靠短期数据分析获得的结论对指导教育教学改革无益。信息化过程产生的这些校园数据,整体上满足数量大、种类多、产生快、真实可信和具备分析价值等特点,完全符合大数据的特征。
如此多的数据被赋予了美好的期待。各种商业公司早已对大数据进行了各种的分析与利用,这些对大数据的分析与应用也为提升用户美誉度做了不少贡献。但这还仅是开始,最关键的是,对大数据的分析与利用最终将让企业做出合理、超前的战略决策。
在校园中,学校管理、教学、科研每时每刻都在产生各种结构化以及非结构化数据。专家表示,对大数据的有效分析将是现代化大学中的一个必不可少的组成。比如在科研方面,由于涉及学科领域广泛,高校在开展大数据的研发和应用方面通常会较其他科研机构和企业更有优势。一方面,高校本身与大数据相关的学科优势会为大数据技术的研发提供扎实的技术支持;另一方面,大数据技术又会通过“学科交叉”战略,为相关学科向更高层次的发展提供历史性机遇。在大数据方面,高校应根据学校自身特点推行切合实际的研发与应用计划。
那么,在信息化部门,目前的大数据可以在哪些方面做出支持?专家表示,与现阶段大数据在科研、商业等领域的应用相比,教育行业的大数据应用有着明显的特色。在科研方面,以气象科学研究为例,大数据往往被用于统计、分析气候信息并用于天气预测,而商业领域的大数据常见于广告投放预测分析。在教育行业,大数据除了可用于学校在管理、科研、教学改革等业务层面进行宏观的挖掘、预测以外,还能用于评估和判断在微观方面单个用户的服务需求,以便学校能更早地发现问题并及时应对。例如,有些学校通过一卡通消费数据来分析判断学生的经济情况,通过学习成绩变化和门禁记录数据来筛选需要心理干预的学生群体等。上海财经大学信息办主任陈云则表示,进行大数据的采集、处理和分析可以做出教育资源是否合理配置与均衡发展、学生行为特征、招生与就业情况、教育质量以及舆情的分析等。
从国外来看,大数据分析在一些国家已经被应用到公共教育中,成为教学改革的重要力量。比如,为了顺应并推动这一趋势,美国联邦政府教育部2012年参与了一项耗资2亿美元的公共教育中的大数据计划。这一计划旨在通过运用大数据分析来改善教育。联邦教育部从财政预算中支出2500万美元,用于理解学生在个性化层面是怎样学习的。这些“学习分析系统”旨在向教育工作者提供了解学生到底是在“怎样”学习的更多、更好、更精确的信息。
大数据可应用于对学生和教师群体或者个人的分析中,从而帮助学生或者教师改进自己的学习与教学以及科研工作。不过,校园大数据分析面临的挑战也多,华东师范大学信息化办公室主任沈富可分析说,大数据分析面临几个挑战。第一,综合多维度性。评价一个人的能力,本身就是一个非常复杂的课题,能否在已有研究成果基础上,尽可能将关于人的评价的多维度数据进行长期的收集,如何做到长期有序的收集是挑战之一;第二,复杂性。客观地讲,影响一个人的事件太多,有时一句话、一件细微的小事就可能影响人的一生,如何将这些事件进行有机梳理、收集、权重关系厘清非常不容易;第三,长期渗透性。教育的规律有时很难厘清,成功的个体也未必能够简单复制,评价教育本身的指标都有一定程度的缺陷;第四,交互性。教育说到底是一个交互的过程,交互的内容收集一定程度上与隐私等是矛盾的。
此外,必须意识到:容易被忽略的问题是最终用户与信息库之间存在着信息获取、信息处理和信息提供方面的巨大矛盾,师生用户始终游离于数据产生和交换的信息化过程之外。
那么,高校如何实施大数据?
华东师范大学信息办沈富可认为,对大数据的分析与应用要有“谨慎”的态度:“从立意高度上要以教育或管理创新的目标,从态度上要更加慎重,既不能影响学校正常的教学和管理业务,又要达到教育创新的目的,这就是一个牵扯到管理、教学各个层面的系统工程了,需要系统设计,谨慎操作。”
有一点非常重要,那就是数据的规划。早期信息化工作人员朦胧意识到:所有的数据都是有用的,但是具体怎么用,那时候并没有明确的路线。所以在数据的规划与管理中无法预料到以后的大数据分析与应用。但现在随着各种技术的发展以及对大数据的相关需求时机已到,高校必须有大数据规划的思想。哪些数据需要长期保存,哪些可以短期保存,哪些数据要重点挖掘,哪些数据必须高质量等。所以,拥有一个数据的长期规划是非常必要的。
在此基础之上,建立良好的数据管理机制,包括:加强数据标准建设、重视历史数据积累、健全数据管理队伍、以需求主导服务方向,建立互助互利的数据交流模式。
学者表示,数据只有在流转中才能体现其价值,有价值的数据才能引起使用者的关注,使数据权威生产者变被动为主动地去维护数据,以保证数据有效性。信息化部门应主动出击、抛砖引玉,为学校业务部门等不同层次的用户提供定制的主题数据分析。这有赖于与各学科业务部门的充分沟通。
因此,在本刊的采访中,不少受访高校都提出一个非常关键的问题:谁需要大数据?他们需要什么样的大数据?业务部门与信息化部门的视角不同,但信息化部门的数据分析需要被业务部门所认可和使用,所以,要做大数据,除了需要信息化部门的热情与努力之外,沟通极其必要。从而建立良好的数据分析产生与消费的通道。IT部门通过对数据的收集和整理,反过来为学校和业务部门反馈数据的统计和分析结果,相互推动工作的发展,建立“个人—院系—学校”自下而上的数据监督与管理机制,形成内需拉动的信息化发展良性循环机制。
大数据将给各行各业的发展模式和决策带来前所未有的革新与挑战。教育行业同样不可避免。当学生、教师的活动行为以及学校的管理、教学、科研数据都能够转化成为高校的决策依据的时候,就是大数据真正显示其魅力的时候,在当前情况来看,尚有一段距离,这需要长期的努力。