汪涛
学科建设是高校事业发展的龙头,综合体现着高校改革发展的质量与水平。学科建设涉及高校工作的各个领域,需要海量的数据为决策管理提供支撑,在信息化时代背景下,高校学科建设管理工作从基于经验判断的决策模式逐步发展转型为基于客观数据研判的决策模式,学科大数据挖潜正在成为支撑学科建设科学化、专业化、精细化发展的有效手段。本文提出了囊括“数据综合治理、数据模型分析与学科建设策略优化”等在内的学科建设数据治理的范式,构建了学科大数据分析模型,剖析了学科建设成效评价与学科大数据指标的内在关联关系,探讨了学科建设的优化策略。
学科是对知识进行划分的相对独立的知识体系,[1]作为高校开展人才培养、科学研究、社会服务等工作的基本单位,在高校履行职能过程中发挥着重要作用。学科建设是学科主体从学科发展的自身实际出发,结合经济社会发展需求和学科发展客观规律,开展一定的建设任务,达成一定的建设目标,进而提升学科综合实力的一种实践,[2]具体工作包含学科方向布局调整、平台建设、团队建设、制度建设等诸多内容。
在教育数字化发展的时代背景下,数据成为高等教育领域乃至全社会一种不可或缺的战略资源,学科建设汇聚了高校事业发展各个领域的数据,其管理模式开始从基于经验主义和主观判断的顶层创新决策模式,逐步过渡发展到基于数据研判的数据支撑决策模式,学科建设工作者要学会“用数据说话”,借助数据分析查摆问题、制定改进策略。
学科大数据挖潜的内涵与逻辑架构
“大数据挖潜”(Big Data Digging)是指從大量的、不完全的、有噪声的数据中提取不可预估但却有潜在价值的信息和知识的过程,[3-5]其内涵包含两个维度,其一是突出了价值导向,数据挖潜关注的不是数据本身,而是数据所蕴藏的潜在价值,其二是需要技术手段支持,对于大数据不能采取“拿来主义”,需要借助先进的技术手段在浩如烟海且杂乱无章的数据中抽丝剥茧,寻找有价值、有意义的信息。高校的学科数据具有规模巨大(Volume)、类型多样(Variety)、更新快速(Velocity)、价值密度较低(Value)的“4V”特征,[6]是一种典型的大数据。学科大数据的挖潜旨在通过对学科大数据治理,进行深层次针对性的数据分析,厘清数据背后反映的逻辑关系,进而指导学科建设工作实践的过程。
1989年,Gartner Group提出商业智能(Business Intelligence,BI)的概念,借助商业智能技术帮助商业机构完成分析、做出决策,被广泛应用于金融、通信、制造与零售等行业领域。由于在商业领域的成功应用,高等教育学界逐步将商业智能的理念、方法及相关技术引入院校管理的实践当中,并衍生出更加适应高等教育需求的学术分析技术(Academic Analytics)、学习分析技术(Learning Analytics),这些技术可以帮助高校管理者对数据进行统计、分析、解释,进而建立预测模型,为教学工作提供帮助。北美高校较早地便将信息化技术应用于院校管理的循证决策之中,[7]伊利诺伊大学建立学校决策支持数据仓库,亚利桑那州立大学为支持科学决策建设了数据仪表盘。[8]在此方面,我国高校虽然起步较晚,但也在快速发展当中,复旦大学实现了在校师生管理信息化的全覆盖,中国人民大学开发出综合数据填报、数据存储、数据管理和数据展示等功能的校园大数据平台,浙江大学初步构建了数据中心、流程平台等平台体系,形成了各业务部门开放协同的数据场景。[9]
学科建设管理工作涉及海量的教学、科研、人才等数据资源,并且大多都是结构化数据或者结构化程度比较高的数据,因此进行学科大数据挖潜具有重要的现实意义,同时也具有很高的可行性与操作性。从学科大数据挖潜的逻辑架构来看,其包含了数据综合治理、多维数据分析与实践策略优化等三个部分,其中数据治理是基础、数据分析是手段、策略优化是目的,三者有机统一且紧密衔接,构成了学科大数据治理挖潜的全周期模型。
学科大数据的综合治理
学科大数据的综合治理是将无序的学科大数据有序化的过程,其治理范式覆盖了数据“收集、清洗、存储、共享”的全生命周期。
(一)规范数据字段定义
数据字段的规范化定义包含界定数据内涵与统一填报格式。界定数据内涵是对数据属性的规范和限定,一条完整的数据由多个不同的数据属性共同构成,通过规范表头字段的描述、形式等,对数据填入进行条件、规则限制,明确数据需求,统一数据统计口径,从源头建立起数据标准。统一填报格式是对数据的表达形式的规定,数据无论以汉字、英文、数字何种形式表达展示,在管理工作者视角下并不会影响信息传递,但对于机器语言而言,非标准的数据统计会降低数据可信度,影响数据在信息化系统中的存储流转,进而出现数据报错、丢失等问题,因而必须限定数据的统一填报格式,使其更便于用机器语言读写翻译。
(二)系统清洗底层数据
系统性清洗学科大数据,重构学科大数据的底层逻辑,是学科大数据综合治理过程中不可或缺的关键步骤。数据清洗是对数据进行处理和加工,使其适合进行分析和建模的一种技术方法,主要包含去除数据重复记录、填补数据缺失值、检测和处理数据异常值、转换数据格式、验证数据准确性和完整性。由于学科大数据体量庞大且类型多样,学科大数据清洗需要借助计算机技术进行批量处理,同时也需要通过人工方式对部分数据归属进行认领,对数据之间的逻辑关系进行确认。数据清洗对学科大数据的完整性、真实性、规范性进行了系统地校准与纠错,同时也对数据字段之间、数据之间的底层逻辑进行了梳理与确认,最大程度地消除了数据错误和噪声,提高了建模和分析的精度。
(三)建立数据仓储市场
建立数据仓储市场的核心是搭建科学合理的数据指标体系。学科大数据可以按照不同维度进行分类,每个维度再按照细分领域划分设置一级指标、二级指标,从而建立起多维分层的指标体系。随着高校学科建设越来越强调内涵式发展,高校在反映数量增长的规模型指标的基础上,更加关注反映质量提升的内涵型指标,例如学科方向、人才团队、学术平台与产出标志性成果的匹配度,高层次人才承担重大重点项目的比例等。这些内涵型指标通常不是可以直接获取的基础指标数据,而是需要通过多个基础指标数据统计计算或者整合分析得到的高阶数据。因而学科建设数据指标体系的构建不仅会随着国家政策导向、高校战略重心调整、学科布局优化以及重点任务改变等因素动态发生变化,数据指标需要像“搭积木”一般根据实际工作需要而构建。
(四)贯通数据流转通路
学科建设管理部门是学科大数据的“使用者”,但不是学科大数据的“制造者”,学科大数据产生于各领域业务工作,分散于各业务部门。在日常的业务工作当中,因为各部门业务类型、关注领域、数据结构和体量不同,以及对于数据的管理、分析、存储平台搭建情况不同,形成了高校内部数据的天然壁垒。贯通学科大数据的流转通路,不仅要打通各类数据向学科建设主管部门汇聚的“来路”,还需要打通数据共治共享的“回路”。建立统一数据仓储市场既需要预留各部门上传审核与更新维护数据的通道,同时还要确保将市场当中的数据使用流转起来,各业务部门要能够从市场快速、准确的获取权威数据。
学科大数据解析模型研究
借助学科大数据进行量化评价是直观体现学科建设发展成效的有力手段。考察学科建设发展成效既可以从时间维度的纵向上观察学科指标的变化情况,可将其总结为体现成长增量及发展质量的达成度,也可以横向地对比自身与对标学科之间的差距,可将其总结为体现发展差距的对标度。剖析学科建设发展的达成度与对标度都需要以学科大数据作为支撑,构建适当的数学模型多元多维解析研判学科建设发展的成效。
(一)多元维度模型
学科建设涉及人才培养、队伍建设、科学研究、国际化建设等诸多领域,综合不同领域的评价结果(Pi),能够反映出学科建设发展的总体成效(E)。同样各领域评价结果也是綜合领域内不同量化指标而得出的,因而可将反映学科建设成效与学科建设指标的关联关系归纳总结为如下公式(公式①)。
E=∑Pi=Pi1+Pi2+…+Pin①
达成度重点关注的是学科自身建设发展的提升情况,考察的是一定时间内学科建设指标的差异(公式②)。对标度重点关注的是自身与对标对象之间的差距,考察的是在同一建设周期内二者相同学科建设指标之间的差距(公式③)。无论是哪种维度,其本质都是相对值的概念,抑或是相对差距的概念,内在逻辑是将学科建设的发展情况通过数据具象地显现出来。
(二)权重系数校正
综合所有的学科大数据能够客观掌握学科建设发展的进展成效,但在“破五唯”的背景下,学科建设工作更加强调内涵发展和建设质量,准确运用学科大数据既要把握数据的客观性,也要把握数据的辩证性。因而在实际学科大数据分析过程当中,要避免国家政策导向调整导致的数据波动、偶发事件导致的数据变化、哲学社会科学等部分学科特性导致的成效产出长期性以及数据噪音干扰等诸多不利因素对数据分析的影响,有策略性针对性地选择数据指标。
E=∑Pixi=Pi1xi1+Pi2xi2+…+Pinxin④
在学科建设的成效评价体系当中,由于不同领域、不同业务对学科水平提升的贡献度不同,因而不同指标在评价体系中的权重也不尽相同,在学科大数据分析时需要引入权重系数对评价体系进行校正(公式④)。学科建设评价体系指标之间的相对孰轻孰重容易区分,但其重要性的量化赋值则较为困难,权重系数的划分既要兼顾数据的客观性,也要兼顾发展的主观性,最终要实现数据分析与经验判断的相互兼容。权重系数的制定是“初始设定-代入验证-校正反馈”的闭环过程,“双一流”建设成效评价与学科评估的指标体系经过实践检验,对我国高校学科评价具有较高的普适性,可以作为权重初始设定的重要参考,权重系数的验证主要基于经验判断,以达成度、对标度为切入点,对既往发展成效进行计算分析,组织论证对计算结果进行合理性研判,而后再结合研判结果对初始设定进行校正,最终经过多次迭代验证确定权重划分。
(三)数据模型分析
构建学科建设评价体系是为了厘清学科建设发展成效与学科指标内在的相关性与因果性。而进行更加具体的定量分析则需要对分领域评价结果进行判断,找准差异化指标,若仅是单一指标差异,则说明在当前条件下造成学科建设成效差异与该指标具有因果关系,该指标较大程度上影响了分领域评价结果;若多项指标同时出现差异,则说明在当前条件下造成学科建设成效差异与若干指标具有相关关系,不同指标可能共同造成了分领域评价结果的差异,也可能相关指标存在内部关联,某一指标差异导致另一指标变化,二者共同影响了分领域评价结果。找准差异化指标后还需要结合实际工作举措、相关政策调整等内外部因素,判断造成差异化的原因,进而为学科建设决策提供辅助支撑。
学科建设的优化策略
数据的价值在于应用,学科大数据综合治理的最终目的是指导学科建设的实际工作,找准当前发展的成效与不足,运用学科大数据的分析结果找准制约学科建设发展的关键因素,能够为管理决策提供有力的数据支撑。
(一)科学分析学科数据,研判学科发展态势
找准自身发展定位、研判当前建设发展差距是进行学科建设管理策略优化的基础。达成度是发展增量的体现,达成度越大说明在建设周期内该领域发展成效越显著,对标度是发展差距的体现,对标度越来越接近1,说明与对标高校的差距越小,若超过1,说明已经完成超越。二者分别是学科建设发展成效评价的纵向维度与横向维度,构成了学科建设成效评价的经纬,综合分析两个评价因素,能够掌握自身发展提升水平如何,是否实现了追赶超越,从而为学科建设发展的实效构建出清楚的画像。但要清楚地认识到,学科大数据分析将学科建设中的内在逻辑条理化,将模糊的问题具象化,为学科建设管理工作提供了巨大助力,同时也隐藏着一定的风险,学科大数据即使经过综合治理,也难以避免地夹杂着“数据噪音”和人为因素等,影响学科大数据的分析。因而学科建设发展的研判要以达成度、对标度的客观数据为基础,并同时兼顾发展环境变化、相关政策调整等其他因素,进行综合地考量。
(二)准确把握内在联系,优化学科政策杠杆
通过政策牵引推动学科建设提质增效,是学科建设管理工作者的理想预期,而学科建设工作面临的问题是多元的、复杂的,需要聚焦重点领域和关键环节予以突破,如何找准问题、理清短板则尤为重要。建设成效的评价结果与数据指标存在相关性或者因果性关联,通过分析二者之间的关联关系,能够准确定位影响评价结果的数据指标,找准制约当前发展的短板问题。数据指标产生于业务工作,指标的差异表明该领域的业务工作可能存在差异,但造成差异的缘由需要进行严谨审慎、科学规范的分析评判,分析其是由调整相关工作举措而产生,还是数据偶然性误差所导致,抑或是资金、政策等不确定因素所导致。通过学科大数据挖潜优化调整学科建设策略,是通过统计分析、归纳总结过往的经验来进行预测,建立在“历史会重演”的逻辑基础之上,[10]经过查摆指标差异,分析差异原因,找准成效评价与数据指标的关联关系,而后精准施策,对相关政策、机制、投入进行调整,达到以评促进的目的。
(三)构建动态反馈机制,完善闭环管理模式
学科建设是一项系统工程,其策略实施类似于“黑箱模型”,可将学科建设的策略调整视为自变量,将学科建设的成效评价结果视为因变量,学科建设管理者根据判断调整发展战略或者任务举措,经过一定建设周期观察建设成效的变化情况,并结合相关影响因素进行研判分析,梳理策略调整这一自变量的变化对建设成效评价这一因变量的影响,构建形成二者的关联关系。这种关联关系是一种弱关联关系,对其认识和判断是基于主观判断的,是模糊的,学科建设管理者期望产生符合逻辑规律的结果,但事实上的建设成效并不一定与期望的结果一致。因而学科建设管理工作者应当不断增强自身综合素质,提升发展形势的研判能力、成效评价的分析能力、战略决策的纠错能力,建立起“决策调整-跟踪检测-反馈优化”的反馈调整机制,避免产生决策偏差。
参考文献
[1]刘献君:《论高校学科建设》,载《高等教育研究》,2000(05):16-20页。
[2]罗云:《论大学学科建设》,载《高等教育研究》,2005(07):45-50页。
[3]钟晓、马少平、张钹、俞瑞钊:《数据挖掘综述》,载《模式识别与人工智能》,2001(01):48-55页。
[4]王光宏、蒋平:《数据挖掘综述》,载《同济大学学报》,2004(02):246-252页。
[5]张静、刘危、杨兵、单文波:《试析大数据分析在学科建设中的应用》,载《高教学刊》,2019(05):1-5页。
[6]孟小峰、慈祥:《大数据管理:概念、技术与挑战》,载《计算机研究与发展》,2013(01):146-169页。
[7]陆晓静:《商业智能在我国高校决策中的应用探析——基于循证决策的视角》,载《重庆高教研究》,2019(02):66-76页。
[8]舒忠梅、屈琼斐、郭清顺:《基于商业智能构建高校教育管理平台的实践探讨》,载《高教探索》,2014(02):36-40页。
[9]朱石磊:《商业智能在高校教学管理中的应用》,硕士学位论文,西南交通大学,2016。
[10]周炜:《大数据视域下高校数据治理优化路径研究》,载《教育发展研究》,2021(09):78-84页。
作者简介
汪 濤 西北大学发展规划与学科建设处处长、博士、副研究员,研究方向为高校学科发展与“双一流”建设研究
◎陕西省高等教育学会2021年高等教育科学研究重点招标项目“陕西高等教育‘双一流建设成效评价体系研究”(项目编号:XGH21003)
◎陕西省教育科学“十四五”规划2021年度课题“陕西省高等教育‘双一流建设成效评价办法研究”(项目编号:SGH21Z23)