刘在洲
(武汉纺织大学,湖北武汉 430073)
随着信息技术飞速发展,人类进入了大数据时代,大数据正带来一场伟大的技术变革,必将冲击人们的思维和评价模式。与此同时,科技创新已成为国家强盛的根基和民族进步的灵魂,高校作为科技创新大军中一支重要的生力军,其作用和地位日益凸显。然而,近些年来,面向以前瞻性基础研究、关键共性技术、前沿引领技术和颠覆性技术创新为主和着力人才培养、学科建设的高校,科研成果原创性不足、创新性不强、转化率低下,以及科研人才培养功能弱化、学科建设引领不够等问题日益突显,成为了我国高等教育领域的痛点。高校科研之所以面临诸多问题,原因是多方面的,但高校科研评价问题是主因之一,其中缺少大数据理论和技术支撑是关键。其局限与不足主要有:一是高校科研评价数据采集不全,挖掘不够,如数据来源单一、数据类型偏少,对半结构化和非结构化等数据没有充分利用;没能充分挖掘成果背后的隐性数据和潜在价值,特别是针对高校科研以基础研究为主和着力人才培养、学科建设的特征采集数据、建立评价体系、挖掘核心价值不够。二是指标集、指标权集的筛选和确定主要通过德尔菲法、层次分析法和因子分析法,没有充分运用大数据技术。三是评价结果可视化程度不高,因而导致评价结果科学性不够,精准度不高、可信度不强,效率太低。
高校科研水平的影响因素很多,且影响因素之间相互影响及耦合,基于传统统计模型所获取的评估数据准确度偏低[1]。大数据为这些问题的解决带来了契机,充分运用大数据和人工智能等手段,建立科学的高校科研评价体系已是当务之急。2018年,党中央在深化“三评”(项目评审、机构评估、人才评价)改革的意见中提出了构建科学、规范、高效、诚信的科技评价体系的任务。2019年,国家有关部委针对学科评估和规范SCI论文相关指标使用,提出了充分运用大数据和人工智能等手段获取公开数据、探索建立科学的评价体系等要求。为此,本研究就大数据对于高校科研评价的价值意蕴、大数据在高校科研评价关键环节的适用性作一些探析。
目前科研评价主要是采用同行评议法、文献计量法、经济计量法、多指标综合评价法等方法[2]。正因为如此,对高校科研评价的研究也主要是基于这些传统的视角,基于大数据的高校科研评价研究少见,但基于大数据的高校科研其他相关研究较多。其中,国外一些学者对大数据背景下的科研项目立项、科研成果水平、科研绩效、学术论文影响力等方面的评价进行了研究,提出了一些思路和方法[3-6],但对高校整体、系统的科研评价的研究尚未发现。国内学者如杨维荣[7]认为,大数据技术给高校科研管理工作带来了重要机遇,有利于实现高校科研选题科学化,推动高校科研成果转化,并指出当前学界对大数据问题的研究主要集中在商业推荐和经济预测、科学研究范式变革等领域,大数据技术在高校科研管理工作中的应用研究还较为少见;梁子裕[8]、朱凌玲[9]主张加快高校科研信息化建设,建立大数据资源共享信息系统,实现大数据的交流与互通;冯海燕[10]提出通过大数据对科研团队的创新环境、创新气氛、创新沟通进行分析,进而考核其绩效;王运红等[11]基于大数据信息构建了包括基本科学素养、科研产出影响力、科研管理能力、学术潜力和学术地位5 个维度在内的科技人才科研综合能力评价模型,以期较为全面地反映科技人才的综合实力;陈辉[12]认为,在大数据环境下同被引文献数在时间上的反应速度比引证文献数快(论文发表即可获取),且具有客观性、科学性和有效性等优势,具有很强的学术评价功能;张安淇等[13]提出了科学评价中应用大数据既有优势也有劣势,既存在机遇也存在挑战。已有研究对于探索大数据背景下的高校科研评价具有一定启发价值和借鉴意义,但研究显得较为零散,存在系统化程度不高、可操作性不强等问题。
在运用大数据技术采集、处理数据以及筛选指标等功能研究方面,国外一些学者对运用大数据技术搜索、采集、处理、挖掘数据以及建立数据模型评价进行了研究,但研究对象多在股票市场、公路交通、企业经营等领域[14-16],国内学者的研究主要有如下方面:如李振等[17]、孙曙辉等[18]提出关联规则挖掘、聚类分析、趋势预测、时序分析、回归分析、情感分析、语义分析、社交网络分析等是教学评价数据采集、挖掘的主要方法;马克[19]、王希予[20]研究了数据清洗对象、数据清洗的基本思路和流程,提出了异常值处理、缺失值处理、重复样本处理、错误类型数据清洗等方法;路云飞等[21]提出了粗糙集属性约简和灰色关联聚类相结合的指标筛选方法;龙浩等[22]基于大数据分析的视角,以学生的参与度、认可度和满意度为切入点,构建了包括课程微观评价指标体系、二级学院综合评价指标体系和学校宏观评价指标体系的三级教学评价指标体系;段红等[23]提出了基于S-Kohonen 神经网络的高校科研能力评估模型;田芸[1]针对高校科研水平深度学习网络训练评价中存在的评价特征同质化现象造成评估结果精度不高问题,提出了稀疏交叉熵粗糙集双向受限制深度玻尔兹曼机(DDRBMDNNS)高校科研能力评估方法;刘三女牙等[24]提出了一种基于地图的教育大数据可视分析方法;任磊等[25]探讨了面向大数据主流应用的信息可视化技术,如面向文本、网络(图)、时空、多维的可视化技术。上述研究为本研究打下了基础,但已有研究仅仅限于大数据某一技术在高校科研评价某一环节的运用研究,同样缺乏系统性、整体性,且研究教学评价的居多。
综上所述,已有基于大数据的高校科研方面的研究大多局限于科研管理、科研信息化建设与教师个人学术影响和绩效考核等方面,研究的广度和深度远远不够,基于大数据的高校科研评价方面的研究相对滞后,运用大数据技术采集、挖掘、处理高校科研大数据的研究成果不多,通过大数据技术构建高校科研评价指标集等方面的研究成果尚不多见。已有研究中存在的不足,正是本研究必须面对和突破的问题。
充分利用大数据的资源,科学运用大数据手段开展高校科研评价,对于促进高校科研评价更加系统全面、精准客观、高效便捷具有重要的作用,特别是在面向以基础研究为主和着眼人才培养、学科建设的高校科研评价方面具有明显优势,其价值意蕴体现在以下4 个方面。
大数据不仅量大,而且类型多,不仅有结构化数据,还有非结构化、半结构化数据,日益迅速增长的非结构化、半结构化数据是大数据时代到来的标志。有学者认为,非结构化、半结构化数据已占到所有采集到数据的85%以上,是重要的、有价值的数据[26]。对于高校科研评价而言,非结构化、半结构化数据是进行全面、系统、准确评价不可或缺的数据。传统的高校科研评价数据不仅来源单一,而且数量有限,主要是政府教育、科技行政主管部门的统计数据、学校公布的数据、SCI 和中国知网(CNKI)等几大检索系统和数据库的数据,其中结构化数据居多,非结构化、半结构化数据采集偏少,特别是关注科研对人才培养和学科建设的贡献不够。而高校科研有别于科研院所和企业的科研,一要出成果,二要出人才,三要促进学科生长,具有多重功能,因此对高校科研评价不仅要着眼科研本身,还要关注科研对人才培养和学科建设的贡献。传统的高校科研评价受评价技术限制,人才培养、学科建设方面的数据没有充分挖掘利用,导致无法全面系统评价高校的科研水平和社会贡献。大数据技术的引入使这一局面将得以改变:从数量维度来看,大量诸如高校科研成果隐藏性数据、企业转化数据、社会应用数据、网络分析数据、历史数据等数据被采集出来,基于小样本的评价变为基于大数据的评价,为高校科研评价提供了海量的数据,成为系统全面评价高校科研的重要基础。从类型角度来看,通过大数据技术,不仅可以采集到海量的结构化数据,也可以采集到大量非结构化数据如文本图形、图像、音视频等,同时还可以采集到半结构化数据如网页等数据,特别是能采集到科研对于人才培养和学科建设作用的滞后性数据和长效性数据,由于多种类型的海量数据被挖掘利用,从整体上提高了高校科研评价的完整性和系统性;此外,还有利于对科研评价对象进行多视角、全方位的评价,彼此验证和相互支撑,突破以往单一维度的思维模式,使高校科研评价的全面性、系统性将大为提升。
大数据具有应用价值大的显著特征。由于大数据具备强大的数据处理功能,所处理的数据不仅体量大,而且粒度小,从中获取的信息更加细致和清晰,有利于提高分析结果的精准度。首先是大数据技术不仅能处理结构化数据,而且还能对半结构化数据和非结构化数据进行处理,使对科研成果的科学价值与社会贡献的判断突破了单一的显性数据、当下数据的定量评价和主观性强、效率低下的同行评议传统模式,大大地提高了高校科研评价的精准度。其次,大数据的预测功能十分强大,大数据的核心就是预测[27],这一功能对于长效性的科研成果评价非常重要。在大数据的背景下,依托海量数据,加上云计算技术等强大的数据处理能力,对结构化、半结构化和非结构化的数据高效地分析归纳,让人们对于未来的准确预测变得越来越清晰,预测结果也变得越来越趋近事实[28]。在高校科研评价的实践中,运用预测功能评价科研及成果的长期功效是十分奏效的。其三,大数据的应用、数据之间的关系考量从线性关系转向非线性关系,方便对各项评价数据进行关联度分析,使评价结果更加可靠和精准,主要表现在人们对数据分析的思维方式打破了传统的、单一的因果分析格局,加入了关联度分析手段,突破高校科研评价传统刻板的“一根筋”式评价方式,为提高评价的精准度增添了有利条件和手段。
由于大数据还有处理速度快和获取与发送方式自由灵活的显著特征,一方面以云计算为代表的技术使得大量数据快速传输、运算和处理成为可能,大大提高了高校科研评价能力和效率,使科研评价更加及时,另一方面,更为重要的是对各种实时性数据的把握,使高校科研评价不再仅仅是科研及成果创新点的评价,而是创新链的评价,甚至是创新面的评价,便于实现对评价要素历史性、发展性乃至全生命周期的动态性判断。有学者认为,大数据时代的来临更是把数据功能推上了前所未有的高度,智能手机、可穿戴式电子设备等各种先进传感器等智能终端的推出和网络与社交媒体的出现,实现了数据全面、自动、实时地采集[29],为高校科研评价更加高效便捷提供了可能。
新的技术带来新的思想和理论、思维和方法,大数据的引入为高校科研评价方法论提供了全新理论基础和广阔的思维空间,让高校科研评价方法论更具有指导性。在大数据时代,传统科研评价方法的局限和短板越来越突显,在评价实践中的问题越来越多,也很难从传统的高校科研评价方法论中找到有效的思想观照。Hey 等[30]将这种数据密集型的技术方法视为科学研究的“第四范式”。李国杰等[26]认为,“第四范式”可能是唯一具有系统性的方法,它既是科研方式的转变,又是人们思维方式的大变化。大数据将为高校科研评价方法论的创新发展提供新的思维方式和范式,扩展了高校科研评价方法论的理论范畴,从而为高校科研评价方法提供了坚实的理论基础,为高校科研评价提供了新的途径。实践中,大数据技术为高校科研评价提供了全新的方法,基于数据采集、存贮、整理、挖掘、计算等科研评价方法可以弥补当下高校科研评价中种种不足,为高校科研评价提供更加科学的评价工具和操作系统,有效克服传统的同行评议和定量评价的种种弊端。
高校科研受“遗传与环境”的影响,形成了自身的鲜明特征,表现出科研功能的多重性、科研重心的基础性、科研成果价值的非显性以及科研评价的导向性等,大数据在高校科研评价这些关键环节中可发挥独特的作用。
如前所述,高校科研有别于科研院所和企业的科研,除了出成果外,还要出人才、促进学科生长、引领社会发展,其功能表现为多重性,具体体现为科研过程教育性、科研起点和落脚点的学科性以及科研推广的服务性,为此,高校科研评价对于培养人才、支撑学科建设、引领社会发展等方面的数据必须全面采集,纳入评价之中。而传统的评价方法运用的数据主要来源于政府、高校、企业、个人公开的数据和SCI、EI、SSCI、CSSCI 等检索系统及CNKI 等数据库的数据,还有多媒体与互联网上的数据,主要类型一是来自关系数据库和excel 等格式的结构化数据,如项目、成果、经费等量化数据,二是来自XML 和JSON 等格式的半结构化数据,如论文影响因子、他引量、ESI 值等数据,由于技术手段受限,对来自文本文件、图片和音视频等格式呈现的项目、成果、经费、队伍及产出效益等大量的非结构化数据采集不多。然而,高校科研在培养人才、支撑学科建设、引领社会发展等方面的贡献价值以非结构化数据居多,如科研对于培养学生的学术道德与科学精神、科研动力与动机、提升科技创新能力的贡献价值,对学科建设的基础作用价值,以及对引领社会发展的长效价值和滞后价值等,大都是一些文本、语音、视频等形式的非结构化数据,这些方面的数据过去往往被忽视,采集不够,影响了高校科研评价的全面性和真实性。在大数据技术时代,可通过搜索引擎、主题搜索引擎、手机APP 等手段在互联网、各种媒体、各类数据库、社交网站等渠道采集这些数据,特别是可以通过图像识别、自然语言处理、文本挖掘、文本分析等数据挖掘技术来采集和处理这些信息,以获取有价值的量化数据,判断其价值高低,从而扩大数据采集面,提高高校科研评价的完整性和综合性。
基础研究是高校科研的传统,也是高校科研的优势所在。尽管高校科研呈现出多样化的趋势,但对于大学尤其是研究型大学来说,其重点应该还是基础研究与理论研究[31]。2015 至2019年间,我国高校承担的国家自然科学基金项目占比较大,获得的资助资金在国家自然科学基金资助总额中的占比分别为80.83%、80.93%、82.01%、83.03% 和83.81%[32]。可见,我国高校承担着国家基础研究的重任,基础研究始终是高校科研的“重头戏”。高校科研重心的基础性是高校科研的一大特征,具体表现为科研项目的前沿性、科研成果的原创性、科技创新的颠覆性、科研作用的基础性等特点,采集和挖掘这些方面的数据,并对其科学价值进行准确判断是做好高校科研评价的基础。然而在现实中,基础研究成果一般都是通过发表论文和专利展现出来的,对论文质量和水平的评价过去主要看其被几大引文索引的数据库收录情况,但由于几大引文索引数据库的辐射面受限和收录机构的主观倾向以及论文作者影响力的马太效应等因素,这一评价方法在可信度方面饱受争议,如以被引频次反映论文的影响力而掩盖了引文动机和论文发表时间、被引作者单位和个人身份等,以SCI 影响因子反映期刊与论文等级而忽视了论文创新性、研究领域及数据来源等问题,以专利转让数量和金额反映高校科技创新能力而忽视了专利技术的科技孵化效应与长效作用等[33]。引入大数据技术,以论文为例,评价主体可以通过下载、引用、收藏实际数据和注释、标签、推荐、排名等客观情况,以及根据论文提出的理论和原理形成的技术和产品,建立起论文多层面、多视角、多维度的立体评价大数据资源库[34],为准确地评价学术论文的科学价值提供核心依据,特别是在通过论文引用评价论文的学术价值时,可运用大数据相关技术对引文上下文的位置、引文内容的语境、引文动机、情感及行为进行分析,有利于发现论文的学术价值及学术价值相互关联所在,也有利于对论文非结构化数据进行量化处理,聚焦科研论文的学术价值,从而实现对学术价值准确判断。这种深入论文内容层面的分析方法带来了传统评价理念的创新,使高校科研评价的理念内涵从过去注重论文刊发刊物影响因子与引文数量的思维模式向对引文质量的精细化识别与论文影响力精准化判断转变[35],完善和弥补传统引文分析表面化、单一性的评价模式,突破以往基于文献引证关系信息识别的单一层面的局限,从而挖掘引文的真实动机和引文的影响力,从多方位、多层面综合考察科研成果的隐性价值[36],及其滞后性、长效性、间接性作用,引导高校科研评价聚焦科研成果的科学价值、技术价值、经济价值、社会价值、文化价值(以下简称“五大价值”)展开[37]。可见,大数据技术对于以论文为标志的基础研究成果的科学价值判断具有很强的适用性,能洞察学术成果内容深层面的价值内涵,深度理解和解析学术成果的创新价值,使高校科研评价成果的科学价值和社会效益得以深入挖掘。
高校科研重心的基础性和科研功能的多重性特征带来了部分科研成果的非显性,这些研究成果的价值表现为隐藏性、滞后性、长效性、间接性等非显性特征。传统单一的、线性思维的因果关系评价理念和一般的定量、定性评价方法很难扫描到科学价值的核心层面和学术价值,对于非显性特征明显的科研成果的评价更是难以评判。大数据挖掘技术的引入和思维方式的转变给高校科研评价解决这一问题提供了方案和工具,通过大数据挖掘技术和相关关系分析,对高校科研数据背后的数据即隐藏性数据、滞后性数据、长效性数据等进行追踪,提取有价值的数据信息已不是难事。
首先,随着大数据挖掘技术的运用,可以挖掘到大量的隐藏在显性数据背后的数据和间接性数据。比如在评价高校基础研究成果方面,通过大数据技术可分析这些原创知识对技术创新的基础性作用,挖掘其产生的连锁效应和对经济社会的科技贡献率等数据,对于真实、客观地评价科研成果的创新价值和经济价值具有重要的意义;还可以从大量的、不完全的、有噪声的、模糊的、随机的实际数据中提取隐含的、内在的、人们事先所不知的但有潜在价值的信息和知识[38],将表象数据背后的科学价值挖掘出来,为深入评价科研成果的价值和社会贡献提供了重要的观察视角。具体而言,隐性数据挖掘可采用机器学习、模式识别、图谱构建与挖掘、事件分析法等技术,对基础研究中原创成果隐藏的科学价值进行挖掘,并预测其产生的连锁效应和对经济社会的科技贡献率等;还可采用语义分析法等方法对科研论文中隐藏的科学价值进行挖掘,洞察学术论文深层面的价值内涵。
其二,大数据时代人们的思维方式开始从单纯的因果关系向相关关系转变。相关关系分析方便人们通过关联物来分析现象而无需揭示其内部运作机制,在科研评价中具有独到的作用。在大数据背景下,通过关联性分析研判、回归分析和情感计算等技术,对于数据全程的动态跟踪,有利于揭示一些具有滞后性特征成果的科研价值。比如,科研过程中对研究生的培养和科研成果对高校硕士点、博士点以及一流学科的支撑价值等,这些科研价值往往是滞后或长效体现的,过去很难挖掘这些方面的数据;而引入大数据技术,可以对这些数据进行深度挖掘,使科研对人才培养和学科建设价值纳入到科研评价之中。还比如,专利的作用是长效的,传统对专利的评价是根据专利数量和专利转让金额作出判断,主要是结构化数据;而运用大数据技术,可对专利应用中的一些半结构化和非结构化的数据进行采集和分析,让专利滞后性的科技价值得以准确评价,并预测其可能产生的经济效益和社会贡献。
其三,对长效性数据挖掘可采用并行计算、关联规则等技术。比如在评价高校教育科研成果方面,仅凭论文和报告来评价是不够的,通过关联性分析,可跟踪到研究成果应用实施中的互动情况和实施后对学校发展战略、教育教学改革、人才培养质量和科学研究水平提升方面等数据,改变了传统的定量评价和经验主义判断,使得教育科研评价更加聚焦人才培养和科研价值的贡献度。
通过大数据技术分析数据的特征和核心价值、揭示各类指标间关系,提取有价值的代表性指标构建指标集和指标权集是关键,但构建指标集必须遵循国家科研评价的价值导向。高校科研评价的价值导向是构建评价体系的风向标,有什么样的导向就会有什么样的评价体系,高校科研评价体系的导向性至关重要,直接影响科技创新的质量和水平。高校科研评价,从评价的外延来讲,不仅要重视对科研成果本身的评价,还要重视高校科研支撑人才培养、促进学科建设的评价和科研对社会发展引领价值的评价,围绕高校科研功能的多重性特征展开;从评价内涵上而言,要贯彻落实习近平总书记重要讲话精神和中央政策精神。在2018年两院院士大会上习近平总书记强调:“要改革科技评价制度,建立以科技创新质量、贡献、绩效为导向的分类评价体系,正确评价科技创新成果的科学价值、技术价值、经济价值、社会价值、文化价值”[37];2018年中共中央办公厅、国务院办公厅印发了《关于深化项目评审、人才评价、机构评估改革的意见》,要求破除唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾(以下简称“破五唯”);2020年教育部、科技部印发《关于规范高等学校SCI 论文相关指标使用 树立正确评价导向的若干意见》。这些都是高校科研评价应遵循的价值取向。据此,高校科研评价的价值导向应为:以“破五唯”和引导SCI论文规范使用为手段,以提高“五大价值”为宗旨,以促进科研成果、人才培养和学科建设质量和水平全面提高为目标。为此,在高校科研评价过程中,要注重加大挖掘体现“五大价值”内涵的数据,重视提取人才培养、学科建设、引领社会发展方面指标,对前瞻性基础研究、关键性共性技术、前沿性引领技术和颠覆性技术创新项目加大评价的权重等。
然而,传统的科研评价手段在把握上述价值导向方面有很多的局限性,人工智能和机器学习等大数据技术为我们提供了思路。首先,运用大数据技术对所采集和挖掘到的数据进行清洗、融合、降维、表征,清洗掉异常值数据、缺失值数据、重复值数据、不一致数据、多来源数据、表达格式和计量单位不一致的数据等,得到归一化的有效数据。其次,建立科研评价指标体系构建模型,具体分两步。第一步,辅之以人工办法筛选评价大指标。由于大数据的智能处理与分析技术还无法真正完成全方位智能识别,仍需要人工假设与价值判断[39],运用德尔菲法围绕评价导向筛选评价大指标。第二步,依靠人工智能办法构建模型。S-Kohonen 神经网络方法是其中之一,运用S-Kohonen 神经网络方法模拟生物神经网络,通过复杂函数不断学习,以适应评价专家构建评价指标体系的导向要求建立科研评价指标模型。实践证明,运用基于S-Kohonen 神经网络的高校科研评估模型能公正、公开、公平地评价高校的综合科研能力[23]。其三,构建指标体系。将采集到的有效数据导入模型进行优化训练,淘汰与评价导向相关性不大的指标,提取出对目标变量或评价指标有重要影响的指标,得到高校科研符合导向的评价指标,从而构建指标体系。
大数据蕴含着巨大而重要的价值,大数据以及大数据技术在高校科研评价中虽然有许多优势,但究其根本,仍然是对数据量化的统计预测,处理不当或过度依赖容易沦为“数据万能”的陷阱,对高校科研评价的实践作用发挥依然有其局限性,而同行评价是弥补其局限的有效途径。
其一,追求大而全的数据样本,随之而来的就是数据质量、信度的问题。大数据的数据体量虽大,但价值密度低,数据并非就是客观事实。全球的数据总量是海量的且类型繁多,由于收集手段千差万别,有软件系统收集的和硬件传感器收集的;收集时间跨度之大,有历史的、现实的,还有预测未来的;收集空间范围之广,有物理空间和网络空间;数据来源类别之多,有政府和科研部门的,有企业和社会的等等。因此,数据并非都是可信的[40]。劣质的、信度不高的数据会成为高校科研评价的“短板”,在实践中一定要处理好数据质量和信度问题,不然大数据的优势就会变成劣势。然而,同行评价的信度和效用相对而言是可控的,与量化评价在理论逻辑层面具有一致性。可见,在大数据时代,同行评价仍然不能舍弃。
其二,大数据的本质仍是量化评价,这就无法解决定量评价直接或间接带来的一系列问题。大数据的扫描关联分析不排除会产生对既有事实及现象的推理预测分析,对数据进行挖掘和相关性分析时容易受经验主义和主观主义的影响而按人们头脑中预设路径挖掘和由“原因”推测“结果”的思维定势,更何况许多科研成果价值的隐藏性、滞后性致使成果的效用难测量,其评价更不能“泛大数据化”,不能单纯地量化评价其科学价值。而同行评议的方法应是重要补充。否则,定量评价势必遭到扭曲,将产生大量形式数据,而真正体现科学价值的数据将付之阙如。
其三,引入大数据技术,使科研评价的数据采集、处理、挖掘、运算等技术具备很多绝对优势,但若把这种优势充分展现在高校科研评价领域还必须解决两个问题,即对数据内涵的界定和对运算结果的解读[13]。解决这两个问题恐怕不单是通过改变方法思路和技术手段能解决的问题,而且由于科研成果涉及的学术性、专业性很强,仅通过量化评价会遇到很多障碍和盲点,这些学术性、专业性很强的问题只有通过同行专家来评价可能最合适。此外,对信息的解读和评价结果的分析也显然是同行专家学者最拿手的“好戏”。
本研究基于大数据理论和大数据技术在高校科研评价中的应用,通过文献研究等方法探讨大数据在高校科研评价中的价值意蕴和适用环节。研究表明,充分利用大数据的资源、科学运用大数据手段开展高校科研评价,对于促进高校科研评价更加系统全面、精准客观、高效便捷具有重要的作用,特别是面向以基础研究为主和着眼人才培养、学科建设的高校科研评价具有明显优势;对于采集非结构化和半结构化数据、挖掘隐性和滞后性科学价值、提高处理速度和实现可视化表达、促进科研评价方法和方法论创新发展等方面具有强大功能和应用价值,且在实现高校科研功能多重性的数据提取、科研重心基础性的学术价值判断、科研成果价值非显性的数据挖掘和围绕破除“SCI 至上”、聚焦“五大价值”的导向性指标体系构建等环节功能突显、适用性强。
值得指出的是,大数据技术虽然具有强大的功能,但也有其自身的缺陷,如何利用好大数据技术这把双刃剑,防止沦为“数据万能”的陷阱,避免“泛大数据化”倾向,是科研评价不得不思考的问题。只有坚持大数据技术评价与同行评价相结合原则,既发挥大数据技术做数据的优势,又发挥同行专家对数据意义界定和评价结果解读的作用,才能使高校科研评价实现高质量运行。