曹 隽 杨 槐 尚尔辉 富春凯 彭先玉
(黑龙江生态工程职业学院,黑龙江 哈尔滨 150025)
大数据背景下的高职院校教科研成果分析
曹 隽 杨 槐 尚尔辉 富春凯 彭先玉
(黑龙江生态工程职业学院,黑龙江 哈尔滨 150025)
通过黑龙江省教育科学“十二五”规划2015年度课题牵引,以学院为例探索如何树立大数据意识,加强学术规范管理,搭建多元化的教科研平台,开展教科研成果评价创新研究,提升科研管理水平。
大数据;数字校园;教科研;评价
近年来,职业院校依法治校意识日益增强,管理制度不断完善,管理工作得到普遍重视。但是,与加快推进依法治教和治理能力现代化的新要求相比,职业院校在管理理念、能力和信息化水平等方面仍有差距。教育部《职业院校管理水平提升行动计划(2015—2018年)》(以下简称“行动计划”)指出,提升管理水平是促进职业院校内涵发展的现实要求,是提高人才培养质量的重要保障[1]。要求“职业院校要以落实《职业院校数字校园建设规范》为重点,加快信息化技术系统建设,建立健全信息化管理机制,增强信息化管理素养和能力,促进信息技术与教育教学的深度融合”。树立大数据意识,重视各类数据的记录、更新、采集和分析,学校教育、教学、科研、办公、生活服务等领域信息技术应用广泛。因此,开展大数据背景下高职院校教科研成果评价创新研究,根据学院自身特点去寻求、科学采集和创新应用学院教科研大数据,建立基于大数据的教科研学术成果平台,形成有价值的学术评价报告,为学院科学管理与决策提供依据,这既是申报课题立项的初衷,也是科研工作为学院内涵发展服务、加快提升学院管理水平的目标。
大数据是一个较为抽象的概念,著名咨询公司IDC将大数据定义为:大数据一般会涉及2种或2种以上数据形式。它要收集超过100TB 的数据,并且是高速、实时数据流;或者是从小数据开始,但数据每年会增长60%以上[2]。这个定义给出了量化标准,但只强调数据量大、种类多、增长快等数据本身的特征。当前,较为统一的认识是IBM总结的大数据四个基本特征——4V特征,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。这些特征使得大数据区别于传统的数据概念。从宏观角度来讲,大数据是融合物理世界、信息空间和人类社会三元世界的纽带。
数据(Data)、信息(Information)和知识(Knowledge)是广义数据表现的不同形式。实效、准确、全面、精确、直观是数据信息收集的“五要素”。从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术[3]。其实质是从数据中提取隐含的、未知的和潜在有用信息的过程,被公认为是数据库研究中的一个极富应用前景的新领域。大数据技术让数据产生知识,将数据管理工作提升为分析预测。掌握这一技术已经成为一种新的竞争优势。对高校而言,大数据为高校绩效管理、科研评估、研发资源分配等提供了有效的决策支撑。目前,基于Google三大核心技术GFS、MapReduce、BigTable的Hadoop和NoSQL数据库技术成为主流。
大数据对高校的科研成果统计工作产生着无形的影响,同时促进了科研统计工作中的思维变革、数据创新和信息管理三个方面的变革。高职院校科研工作由其办学定位及学术层次所决定,一般在开展的各类项目、各级课题研究中,应用型的多是以发表的期刊论文形式结题。2015—2016年黑龙江生态工程职业学院完成了2项黑龙江省森工总局科技计划项目,这些科技项目虽然能够做出产品的“样品”或“模型”,并且获得了2项发明专利,但是由于缺少与科技企业孵化器的对接,成果的后期应用推广或技术转化难度较大。教改型的在专业教育和课程教学中产生的“教科研”成果较多,但也是以一定级别和数量期刊论文形式结题,这些成果都在全国普通高校科技统计年报范围内。
高校科研数据的提供则主要依靠统计来实现。2006年以来按照学院《科研管理办法》及《实施细则》的规定,学院科研处每年要花费大量时间和精力对署名单位为“学院”的期刊论文、出版著作、完成课题、授权专利等学术成果进行成果征集、分类登记、统计汇总,经由学院学术委员会专家组对成果原件审核、评定,将遴选符合要求的成果填入教育部“全国普通高校科技统计年报表”。教育部全国普通高等学校科技统计年报分为科技(理工农医)、社科(人文社科)两个软件系统,是科研管理部门一项重要的年度工作,统计数据是高校科研综合实力的直接反映。科技统计工作政策性很强,数据统计范围、统计口径、统计方法均有严格要求,也是各级领导和教育主管部门科学决策的重要依据。
根据每年对教科研成果进行统计的分类情况,其中在数量上居多的主要是学术论文,这些成果很大程度上在中文三大全文数据库中均有所收录。中文三大全文数据库(中国知网、万方数据和重庆维普)收录文献类型包括期刊、博硕论文、会议论文、报纸等多种类型文献。这三大数据库基本覆盖了科学技术和社会科学的各个领域。其中维普期刊的收藏量占有绝对优势,几乎覆盖了中国出版的所有中文期刊,并且收录了大量内部发行期刊,收录的年限最长可回溯到1989年。其中收录自然科学和工程技术方面的期刊量比知网多出近50%,维普采用维普资讯和其他论文资源商的资源库,覆盖面广。因此,维普适合学院进行科技文献的回溯性检索。知网重点收录了国内公开出版的核心期刊与具有专业特色的中西文期刊,综合性上做得较好。而万方收录期刊数量为三者中最少,但核心期刊比率高,收录文献的质量最高。全文数据库具有大数据4V特征,此三大系统所收录的文献数量可谓大数据。
美国教育家斯塔费尔比姆认为:“评价最重要的意图不是为了证明,而是为了改进。”
3.1 学术评价
学术评价是对学术成果的科学性、有效性、可靠性及其价值的客观评定。在这个过程中,必须遵循严格的程序和采用科学的标准,以保证学术评价的公正性。学术的良性运行,须以学术贡献和学术荣誉的一致性为前提,这种一致性就靠学术评价系统来维持。例如,提供论文检测的机构主要来源于三大中文期刊全文数据库,即中国知网论文检测系统(CNKI)、万方论文相似性检测系统、维普通达论文检测系统(也称Gocheck论文检测专家)。CNKI旗下有多种版本的检测系统,比较常见的如TMLC(学位论文学术不端行为检测系统)、AMLC(科技期刊学术不端检测系统)、SMLC(社科期刊学术不端检测系统)、学术不端文献检测系统VIP、英文检测系统、中英文对照检测系统等。如何采用科学的分析方法和检测系统对学院教师的教育科研、教学改革、科技计划等各类项目研究(即“教科研”)中产生的各类期刊论文、技术专利以及研究报告等学术成果进行定性和量化评价是科研管理部门的重要任务,也是近年来高校科研评价改革的一个重要方向。
3.2 成果创新
为落实教育部“行动计划”和“高等职业教育创新发展行动计划”,促进学院专业建设和内涵发展服务,应进行教科研学术成果分析,科学评价每年学院完成的教科研成果的真实的层次水平、学术论文效应和对外影响范围,还可以开展与同类高职院校相关工作的比较研究。 近年来科研处在组织科研项目申报、学术成果鉴定和推荐优秀成果报奖中采用了学院自主研发的项目评审与成果管理系统,可为各部门申报各级科研项目、教研课题立项或结题评审应用,如确定采用三大中文期刊全文数据库何种系统,可以其为背景并寻找到可用的数据“接口”, 在其基础上与项目管理系统对接,可以将论文数据导入到项目管理系统成果管理模块,便于科研管理人员对已登记成果中的期刊论文自行筛选,大大缩短对学术论文的原件审核和成果等级的评定时间,这样不但可以达到“反对学术不端”的目的,也为专业技术职务评定提供科学的依据,而且还可以指导教师合理选择期刊发表论文,分析学校科研管理工作中存在的薄弱环节,查找不足,探索与同类高职院校相关工作的对比分析,从而使学院整体管理水平得到提升。
大数据技术可以综合内部、外部以及大数据合作商家WEB数据资料:从主管部门管理系统中获得研究项目的数量与类别,从内部数据库得到人员、经费、设备等信息,从合作商家WEB上获得学术论文的数量和质量,从项目成果报表得到获奖、成果转让情况,最终综合集成各类数据,借鉴和参考其他院校的相关经验和做法,创新学院学术成果评价方法,通过建立综合评价模型将各类指标进行整合,为科研评价专家的评议提供数据支持,最后得出评价结果。数据衍生知识的过程如图1所示,它首先是通过收集来自高校内部和外部的各种不同的数据源,提取有用的信息,经过数据清洗、转换、重构进入数据仓库,然后通过合适的查询和分析工具、数据挖掘工具、联机处理工具对数据进行加工处理,最终转化为知识。图中内部源数据包括校内项目、经费、人员、设备等数据库信息,外部源包括主管部门、各地省市自治区科研数据; WEB 数据源为各大公开的文献、专利、成果等数据库。
4.1 学术门户平台构建
由于三大全文数据库均有自建的期刊评价系统,在期刊评价指标中,影响因子反映了论文的平均被引率,是能反映期刊相对学术水平和学术影响力的重要指标,在对三大全文数据库的系统响应是否符合“五要素”要求以及性价比进行综合分析后,可选择一个性价比较好的系统建立一个学术门户平台,在此基础上建立科学合理的教科研成果评价体系,生成学术成果评价报告。学术成果分析及相关信息流程如图2所示。
2016年3月首先以科研统计中大量的学术论文为例,经过课题组成员对同类院校科研工作的相关调研,以及对三大全文数据库的性价比进行综合分析,从教师发表学术论文的专业方向、期刊层次、论文内容等方面检测,根据数据库商家对学院成立先后的教科研成果评价平台生成“学术评价分析报告”的用户需求响应程度,最后选择了维普资讯,历经6个月建立了学院学术门户平台(http://hljst.ap.cqvip.com)。学院学术门户平台如图3所示。
4.2 分析报告生成
目前校园网内用户在平台可查阅、下载期刊论文,并可根据需求自行选项,对教师个人、学院成立后历年来学术论文发展水平与科研状况生成学术成果产出分析报告(见图4)。
本文意在通过将大数据的概念以及技术引入到传统的科研管理中,开展教科研成果评价,一是为了更好地引导广大教师开展科学研究,并从中发现问题、找出不足,以不断完善和发展教育教学手段和提高科研水平;二是对学院历年积累的学术成果进行数据挖掘、重新利用,将现有的管理数据转化为可供使用的知识,为领导提供客观、科学、全面的决策参考,引导学院教科研工作健康发展,提升科研管理水平,同时促进学院管理水平的提升。
[1]教育部.职业院校管理水平提升行动计划(2015—2018年)[R].2015.
[2]Benjamin Woo World wide Big Data Technology and Services 2012—2015 Forecast, 2012.
[3]许哲军,付尧.大数据环境下的高校科研管理信息化探索[J].技术与创新管理,2014,(2):112—114.
责任编辑:李增华
10.3969/j.issn.1674-6341.2016.06.032
2016-11-02
黑龙江省教育科学“十二五”规划2015年度课题“‘大数据’背景下高职院校教科研成果评价的创新研究”(ZJC1215042)
曹隽(1962—),男,河北深泽人,教授。研究方向:计算机应用。
G647
A
1674-6341(2016)06-0077-03