张 宇
(西北工业大学航天学院,陕西 西安 710072)
近年来,大数据作为一个崭新的技术手段和思维方式引起了各界的高度关注。Nature 和Science 等国际顶级学术刊物相继出版专刊来探讨对大数据的研究。对于高校而言,科学研究是其提高综合水平、储备后续发展动力、提升国际影响力所不可或缺的一部分,而高校科研管理水平的高低极大地影响着高校科学研究工作能否顺利地开展。高校科研管理涉及面广,包括项目申请、立项论证、组织实施、检查评估、验收鉴定、成果申报、科技推广、档案入卷等诸多方面。自上个世纪末推行高校信息化以来,很多高校都建立并运行着多种数据管理系统,然而这些数据管理系统之间大多并不关联,由此产生了多个信息孤岛,不但导致了校内大量资源、资金的浪费,还给科研工作的顺利开展带来了困难。科研管理工作过程中记录的各种原始数据也没有得到有效挖掘,无法对科研评估及决策制定提供有效支持。随着大数据概念、技术的引入与发展以及对高校科研管理的影响越发深刻。高校有必要在科研管理过程中主动、积极地引入大数据技术,以此提高科研管理的水平和能力,进而促进高校科研工作的健康发展。
所谓大数据,就是用现有的一般技术难以管理的大量数据的集合。大数据的特征,通常用四个“V”开头的关键词来描述:Volume(容量),也就是数据体量大,已经从 TB 级别跃升至 PB/EB 级别;Variety(多样性),即数据类型繁多,数据来自多种数据源,数据的种类格式日渐丰富,囊括各种结构、半结构化数据;Velocity(速度),即数据产生与更新的频率,也是大数据的重要特征,全球数据量每18 个月翻一番;Value(价值),数据价值密度低,海量的数据可能包含极少量的有价值的信息,如何从原始、表层的数据中挖掘有价值的数据成为提高效率的关键。
从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。大数据技术是解决数据丰富但知识贫乏的有效途径,其本质是从繁杂的原始数据中清洗、分类、筛选、整合出隐含的、未知的和潜在有用信息的过程,被公认为是数据库研究中的一个极富应用前景的新领域。对高校而言,大数据技术可以为高校绩效管理、科研评估、科研资源合理分配等提供有效的决策支撑[1]。
由于高校科研管理工作会接收并产生大量的数据,所以在应用大数据技术方面有着先天的优势和必要性。随着高校科技活动的迅猛发展,各部门对科研管理工作准确性、专业性的要求也越来越高,而现行的科研管理手段及理念存在着很多不足之处,需要借助大数据技术进行补充、完善。
首先,当前高校科研管理过程中存在着收集的数据种类繁杂、信息共享渠道不通畅等问题。由于各部门运行着不同种类的管理系统,造成了数据种类、格式上的差异,导致了校、院以及科研人员之间难以对数据进行标准化处理及信息共享,无法在更高的层次上进行信息处理,从而影响科研管理的科学决策,造成科研管理的盲目性和片面性。科研管理工作中的信息共享渠道不通畅也加大了科研管理人员对科研信息收集、统计的工作量,大大降低了工作效率,不利于科研人员了解国内外相关研究领域的发展,影响了科研活动的顺利开展。
其次,在信息化高速发展、各类数据爆炸式增长的情况下,以往管理系统的统计、分析功能过于简单,彼此之间的关联度也比较低,科研管理人员常接触到的仅有项目数量、项目经费、成果录入、查询、报表等基本功能,所得到的信息只是原始的、表层上的,而隐藏在这些大量数据中的深度的、对今后决策发展起支持作用的高层次的信息则没有得到充分挖掘。
因此,通过将大数据技术及概念引入到传统的科研管理工作之中,利用大数据技术收集标准化数据、通畅信息共享渠道、对收集的原始数据进行加工,挖掘出可供利用的信息,以此提高科研管理水平和技术含量,为管理部门、科研人员进行决策提供更加客观、科学、高水平、高层次的支持就变得十分必要。
大数据技术是网络技术、人工智能、数据库技术等现代信息技术的有效结合,具有无可比拟的先进性。从科研管理的角度来看,大数据技术通过针对科研管理系统、财务系统、人事系统以及基于互联网的大型科技文献数据库、专利库等数据资源的关联分析,找出数据的相关性,提取有价值的信息,可以为传统的专家定性决策管理提供广泛的、深入的数据支持。同时,大数据技术是从大量数据中发现那些尚未发现的知识,是从科学技术活动大量原始数据中自动获得知识和重要信息的过程[1]。由于这些知识大多直接来源于数据库内部,因此它较少受外部资源的限制和影响,具有相对的独立性,对于科研决策的指导意义也较为重大。
大数据技术能够让数据产生知识,将以往的数据管理工作提升为分析预测。数据衍生知识的过程如图1 所示,图中的内部资源包括高校自身产生的项目、人员、经费、设备等数据信息;外部数据包括相关部门、各省市自治区科研数据;网络数据为各大公开的文献、专利、科研成果数据库。在收集来自高校内部、外部等不同类别的数据源之后,提取有效信息并进行数据清洗、转换、重构进入数据仓库,然后通过合适的查询手段和分析工具进行数据比较和数据挖掘工作,最终转化为可以为决策提供支持的知识。
如何建立科学、高效的科研管理模式,利用大数据技术为高校科研评估提供数据支持、提升项目立项决策的合理性、为科研人员提供深层次服务以及优化科研资源配置,保障高校科研事业健康、快速的发展,已经成为当前高校科研管理体制改革的一项重要内容,大数据技术在这一领域具有广泛的应用前景。
科研评估是现代科研管理的一种重要手段,科研资源的合理有效分配、利用和管理,以及科研项目和科研机构全面客观的评价等各个方面都对科学研究的绩效评估提出了新的要求。
在科研评估体系中,数据的处理起着关键作用,随着高校信息化的推进以及大型科技文献、专利、论文数据库系统等在科学研究领域的普及,全球范围内的科技数据信息量急剧增加。面对这些庞大、繁杂的原始数据,需要快捷、有效的技术手段进行筛选,并从中获得有价值的知识。在当前这种科研数据呈几何式增长的情况下,多数科研管理部门所使用的传统的数据分析和统计方法,由于受到人力,物力及财力的限制,原始数据背后隐藏的深层次知识无法得以有效采集、分析和使用,相反却带来了“数据灾难”和“数据荒废”。利用大数据技术则可以解决这一问题。
大数据技术可以综合内部、外部以及网络数据资料:从学校科研管理部门获得研究项目的类别和数量;从内部数据库得到人员、经费、设备等信息;从网络数据库中获得论文、专利的数量和质量信息;结合往年项目成果报表中获奖、专利成果转让情况,最终综合集成各类数据。通过建立综合数据评估模型将各类指标进行整合,为科研评估的专家提供数据支持,最终得出科学、合理的评估结果。
项目立项决策是在科技活动实施前对实施该项活动的必要性、可行性及其定位、目标、任务、投入、组织管理等所进行的评价,主要是为项目立项决策提供依据[1]。国内科研项目立项主要采取由科研人员申请,科技主管部门组织专家评审、论证、筛选,然后择优选择承研单位和负责人的管理模式。这样的科研项目立项过程涉及到大量的数据管理工作,包括掌握课题申请单位、申请人、课题、经费、评审专家等方面的信息数据。目前,虽然各级科研管理部门的数据管理系统涵盖了大部分日常工作需要的数据,但是当前将原始数据录入进管理系统或从管理系统中提取出原始数据的流程只是在传统管理模式上的一个信息化过程,基本没有任何的辅助决策功能。
如何利用已有的内部、外部原始数据进行数据分析和挖掘工作,减少科研项目立项工作中存在的一些重复性、经费安排不合理、项目依托人不称职等因素,以此指导科研项目立项,促进科技资源优化配置,提高科技经费的使用效益,促进公平竞争,这项工作本身是一项重大的研究课题。随着大数据概念的引入,从筛选项目角度讲,可以利用大数据技术,对项目的研究领域、预期成果,通过与外部文献库进行结合分析的方法检验课题的科学性、创新性,判断得出该项目立项的必要性;从筛选申请者角度讲,可以将申请者所涉及的各项因素进行多数据的联合查询和分析,发现并建立科学的指标体系和筛选方法,最终得到候选人名单,从而达到提升项目立项决策的科学性的目的。
大数据技术除了可以在宏观层面为学校领导进行决策提供较为详实的数据支持之外,通过利用大数据技术建立模型和文本报告等,还可以对广大教师开展科研工作发挥很强的指导作用。
以科研人员欲向某单位进行项目申请为例。以往,科研人员只能够通过自身了解或者往年申报情况对对方单位的需求进行分析,由于个人收集的信息不够全面、不够准确以及信息传递的滞后性等问题,容易出现研究目标偏离实际需求的问题,申报结果往往不够理想。而随着大数据技术的普及,通过对大型数据仓库进行有效的挖掘,可以对相关单位所关注的关键技术、重点领域和发展方向进行分析和预测。通过建立模型、数据可视化和生成文本报告等形式向科研人员提供可参考信息,了解各种影响之间的内在联系,指导科研人员开展研究工作,达到为科研人员提供深层次服务的目的。
一方面是科研资源短缺,另一方面则是科研资源未被有效地利用以及合理地分配,这两个问题几乎已经成为当前我国高校科研管理中存在的普遍问题。而这些问题极大地制约了学校整体科研活动的统筹发展,造成了严重的资源浪费和低水平重复利用,降低了科研工作的效率。
基本的大数据技术对于科研资源优化配置模式可分为三个步骤。首先,应对数据进行采集和筛选,建立不同种类的数据库,例如人员库、成果库、设备库等;其次,应建立适合于本校的科学发展的评判模型,包括各类科研资源、科研成果的计算参数和规则库;最后,应以定量化绩效考核为基础的资源配置工具和决策支持管理工具,以此通过大数据技术完成对学校科研资源的优化配置[1]。
通过前文介绍我们可以知道大数据技术对高校科研管理能力的提升有很大的帮助,如何更有效地利用大数据技术,保障高校科研事业能够良性、健康发展,已经成为当前高校科研管理体制改革的一项重要内容。为了保证高校能够良好地应用大数据技术,应当注意以下几点。
数据采集及分析的基础建设一直是高校信息化进程中的重中之重。一方面要能够采集内容丰富、种类明确而又有意义的数据,另一方面则要具备提供数据挖掘和数据分析的功能。因此,在大数据背景下,若想提升科研管理水平,完善的信息化是必须的。高校应当采用先进、稳定的技术确保数据的快速传输与储存,选择合适的综合布线技术和设备,未雨绸缪,为数据储存提供良好的基础设施。面向未来数据爆炸式的增长,可以考虑采用FTTO(即Fiber To The Office)模式,该模式的特点是带宽大、速度快、节省成本和能源、减少电磁干扰。数据存储中心的建设应考虑虚拟化和云平台,保证数据传递的速度与准确度[2]。
即使在大数据背景下,有了信息化设备及技术的帮助,科研管理的具体细节最终是由科研管理人员来操作的,加强科研管理团队建设是提高高校科研管理水平的根本。
为了更好地利用大数据技术,提升科研管理水平与效率,科研管理人员应当具备收集数据、分析数据和解析数据的能力。高校科研管理方面的相关数据种类多样且体量庞大,管理人员在平时就应当注意对这些数据的收集、整理工作,切忌临时抱佛脚式地收集数据,以免误漏。收集的数据可以方便管理人员及科研人员进行查询,但是广泛的原始数据往往来源多样、良莠不齐。科研管理人员应当对所获得数据的质量进行评价,评估数据来源是否可靠、数据的收集方法是否科学、数据是否具有时效性等等,然后对数据进行校核,除去冗杂的干扰性的数据,要注意清理或改正误差数据,最后将数据转化为可共享的标准化信息。在数据经过收集、挖掘后,科研管理人员还应对结果有一定的解读,对于数据的解读实质上是对数据中变量之间的关系的揭示。《大数据时代》的作者舍恩伯格认为,大数据时代对数据的解读,应当寻找变量之间的相关关系,而不是因果关系[3]。我们很容易通过数据得出“发生了什么”,却往往忽略了“为什么发生”以及“我们今后应当做什么”。科研管理人员应当利用大数据技术深度挖掘原始数据背后具有启示意义的信息,为管理层今后做出科学的、合理的决策提供依据。
从本质上来讲,管理就是服务,或者说服务是管理的重要内涵和职能。以往工作中,科研管理人员往往只是作为上情下达、下情上报的中间节点,在管理工作中也只是起到被动记录与整理数据的作用。由于高校的事业单位身份的特殊性以及科研管理身处行政部门,有些管理人员产生了等、靠、要、安于现状等懒惰思想,对内具有一定的机关官僚作风,管理思想陈旧,缺乏服务意识,并没能积极地发挥主观能动性。而作为其管理主体的科研工作本身却在这些年取得了飞速的发展,如果继续配以落后的管理理念,长期以往会严重阻碍高校科研管理工作上水平、出成绩。
在大数据时代下,各行业的服务意识必将加强,传统的科研管理理念无法保证高校科研事业的健康发展,这就需要我们有所改变。首先,在大数据趋势下,信息挖掘要前倾,要从数据中来分析社会、国家的需求,使得科研目标更有价值、更有针对性。其次,在大数据趋势下,服务要前移,不能像过去那样等着科研人员来要数据、要结果。而是应该充分利用数据并且对数据进行分析、挖掘,掌握科研人员可能需要哪些数据或者结论,把服务工作前移。
当前科学研究的一个重要特点是多学科交叉程度高,并且越来越依赖于数据。科学研究的本身就是科学数据的产生过程,一些科学数据就是极其重要的研究成果。科研数据资源既是研究的成果与积累,同时也是支持更为复杂的创新研究所不可或缺的资源存量。在大数据时代,科研数据量激增,科学研究越来越依赖于系统的、高可信度的基础科学数据分析。当前全球科技活动不断增强,一系列重大科学工程的兴起、复杂科学问题的提出、大型科学研究计划的产生,导致前所未有的国际合作局面的产生,也导致了全球范围内对科技资源交流、互通的客观需求[4]。因此,科研管理人员应针对大数据技术体量大、数据来源丰富、数据更新速度快等特点,积极推进科研数据高效、准确地共享、利用工作,以达到提升科研管理的水平。
高校科研管理工作是一项复杂的、有挑战性的工作,它极大地关系到高校科研工作能否顺利、有效地开展。自从计算机进入互联网时代,各类新兴技术不断地拓展并推动着我们对信息与数据的创造及应用。大数据时代随着互联网、云计算、云储存的发展而产生,必将极大地影响科研管理的发展。当我们确信人类可以通过这些大数据的交换、整合和分析来发现新的知识、实现新的管理、创造新的价值的时候,科研管理,作为信息化应用的前沿领域,应当且有可能依托大数据技术提升管理与决策的水平。
[1]许哲军, 付尧.大数据环境下的高校科研管理信息化探索[J].技术与创新管理,2014(2).
[2]于长虹,王运武.大数据背景下数字校园建设的目标、内容与策略[J].中国电化教育,2013(10).
[3]丛培民.从政策研究视角看大数据对科研管理与决策的影响[J].科研信息化技术与应用,2013(6).
[4]左建安, 陈雅.基于大数据环境的科学数据共享模式研究[J].情报杂志,2013(12).