■丁福虎
大学学术评价,如何与时俱进
■丁福虎
一种先进的学术评价方法,只要随着时间的流逝,就不可避免地被一些趋利虫寻找出漏洞,并以极快的速度加以利用和传播,这就像夏天的米要出虫子一样,学术创新工作产生了功利化行为之后尤其如此。事实上,学术不端行为与学术评价之间的博弈,从来都没有停止过。关于学术成果之间数量与质量的关系,学术界与学术评价领域也是有定评的,比如同行评议、核心期刊、期刊影响因子、引文分析等评价方法都在一定的时期取得过积极的效果,但也被一些趋利虫多方利用,可谓有利有弊。2005年美国科学家赫希又提出了“高影响力论文”的概念,简称H指数。通俗讲,H指数就是一个学术人员发表了H篇被引用次数不少于H次的论文,这个H的数值就是该学术人员的H指数。例如赫希本人的H指数是49,这表示在他已发表的论文中,每篇被引用了49次以上的论文总共有49篇。赫希认为H指数能够比较准确地反映一个人的学术成就大小。之后,一些旨在评价学术人员绩效的新方法不断问世。由于这些评价方法能够兼顾学术论文的数量与质量,在应用上简单明了,而且对目前重“量”轻“质”、重“表”轻“里”的学术评价标准具有明显的超越性,因而在国内学术界引起了很大的轰动,并产生了一批比较可观的学术成果。
我们知道,赫希的H指数是49,这首先是他要发表49篇论文。事实上这只是他发表众多论文中的佼佼者。其次是这些论文要被有相当水准的科学工作者在研究工作中进行引用,并且引用之后能够发表并进入某些有一定质量的数据库源期刊上;引文条数达2401次以上,这相当于至少有2401人次的同行科学家对他的工作进行了公开的表决。您想,想摆平这么多人会有多么不容易,而且这些人的论文发表还要受到期刊编辑和审稿专家的严格审查。其三是被引用的时间要相对快速和集中,不能像孟德尔那样石沉大海,生前不为人知!所以说,能够钻H指数评价体系空子的人,要有相当的学术贡献和相当长的学术经历才可以。H指数的研究还表明,美国研究型大学晋升副教授H指数为10~12,晋升正教授的H指数为18,美国科学院院士一般在45以上。那么在国内呢?笔者曾经利用中国知网,调查了某省10多所本科院校中的法学和经济学学术人员,每个学科随机抽取14位任职多年的正教授,他们从事学术工作的时间通常都在20年以上;之后以论文的第一作者进行文献全库检索,统计数据显示这些正教授的H指数大约为4。那么,H指数4是一种什么样的学术概念呢?根据H指数的定义,可以得知H指数4就是一个学术人员发表了4篇被引证次数不少于4次的论文,理论上相当于有16人次以上的同行科学家对他的工作进行了公开的表决,按照通常的标准来判断,如果论文被引证4次,个人的自引一般会在一两次之间,这是个人课题深入研究的一项基本标志;而其他同行的引证仅有两三次。如果一篇论文在发表之后的引证次数达不到4次,这就表明该项研究很少能引起同行之间的关注,甚至个人也缺乏持续深入的研究,这必将导致学术创新的萎缩或低水平重复研究,百家争鸣从何谈起?H指数4与美国研究型大学晋升正教授的H指数18相比较,可谓极其悬殊!同时,笔者利用中国知网,调查了某地2009年晋升的20多名正教授,发现他们的平均H指数只有2.47,而人文社科类的平均H指数只有2.25。其中H指数达到4的仅占28.57%。H指数4,这个不算太高的学术指标,为何就这么难以逾越呢?
笔者从事学术管理工作二十多年,认为这种状况主要是由以下原因造成的。
首先是学术不端,有恃无恐。在今天,学术研究工作已经成为一种谋生的职业。学术工作者虽然具有较高的人文素质,但驱利的软肋人人皆有,一旦有合适的条件和机会,就不可避免地陷入其中。学术不端行为产生的直接原因,一是当代学术出版物和学术文献呈指数曲线增长,同一学科的专家都不能穷尽本学科的文献,因此作弊者极少能被发现。当学术不端行为被发现的概率接近或低于自然灾害发生的概率时,学术道德的免疫防线就会开始崩溃。作伪者就会认为搞不端行为的方式非常划算,如果有人被偶尔揭露出来,他们会认为是自己不够幸运,还认为这种不幸运在人类社会中普遍存在。二是学术研究高度专业化之后,许多领域的前沿工作很多都是资历较浅的学者在开展。但由于资历的局限,他们很少有参与评价的机会。而有资历参加评价的,大多又不是真正的同行,也很少在前沿领域继续活动,这就使得不端行为有了可乘之机。在这种投机心理的支配下,作伪者便会前赴后继,舍生忘死地去搞不端行为。这时再加上发现后惩治不力,这种示范效应会使学术不端行为像决堤的洪水一样泛滥成灾。中国传媒大学一项关于大学生网络道德现状的调查显示:超过53%的大学生承认自己抄袭论文,认为抄袭是一种学术败坏的占38%。看来,学术不端就是一块“臭豆腐”,虽然臭不可闻,但吃起来却很“香”!
其次是评价滞后,本末倒置。学术界中的意志不坚定者为了无偿占有知识创新的劳动价值,在与评价者进行博弈时可谓机关算尽:当评价者只是盯着纸质材料时,非法期刊、假书号、假证书便开始“一条龙”出现。当评价者学会了网络查询时,各种“枪手”在网络中满天飞,商业出版物比比皆是,甚至还诞生了验证假学历的假网站。由于造假者的成本低下,致使造假者捷足先登。而又由于晋升指标的限制,导致真正打硬仗的创新者被甩在造假者的身后,就像《红楼梦》里面一副对联形容的那样:“假作真时真亦假,无为有处有还无”。学术界有人强烈抨击论文的考核标准,说是“逼良为娼”,却不知搞不端行为的人压根就不讲学术规则。最为可怕的是评价的本末倒置,起点优势有时竟然会优于终点评价,站在起跑线上的成绩会比终点冲线时更加厉害。比如,论文数量会高于论文的质量,研究经费的数量会高于研究成果的质量,年轻时取得的学历优势会高于一个人取得的终身成就。
其三是狐狸洞口,由谁来堵?有一则民间故事讲,有一窝狐狸的洞穴有一前一后两个洞口,四处透风,小狐狸怕不安全想堵住其中的一个。老狐狸告诫小狐狸:“堵住了洞口,猎人来了往何处跑?”事实上,一些单位也知道现行评价机制的弊端和漏洞,但是大家都存在泡沫绩效,自己把泡沫挤得太干,如何参与社会大蛋糕的分配?都说职称贬值,但没有那么多的增量职称,如何来增加学术人员的工资?如何来实现大学的扩招?如果真的堵住了漏洞,管理者自身的利益调控幅度会更小。所以说学术评价一日不作为,学术不端行为便难以有大的改观。
那么如何改进现行的评价机制,逐渐提高学术人员的学风水平呢?
一是改革评价观念,“终点优于起点”。“终点优于起点”理论,可以在很大程度上修正学术评价的一些失误,减少学术评价的漏洞发生。在作物的生长阶段中,有发芽、生根、开花、结果等环节,根据“终点优于起点”的理论,开花优于发芽,结果又优于开花。在体育竞赛中,进入决赛的成绩一般要优于复赛,进入复赛的成绩一般又优于初赛。而在学术评价当中,研究项目一般可以分为课题中标、经费划拨、阶段成果、最终成果、成果应用等阶段,倘若有人将课题中标的评价高于成果应用阶段,则属于本末倒置;如果一项成果应用在国内取得了空前的成就,却不如一项国家级科研项目更实惠,也属于本末倒置。在学术论文的评价中,论文发表、论文被引、H指数是一个递进的发展过程,如果出现了论文发表数量的评价优于引文数量的评价,那是在浑水摸鱼,也应属于本末倒置。弄清楚了“终点优于起点”的理论,学术评价就不会迷失大方向,学术评价的创新就会日新月异。
二是区分不同对象,制定相应措施。笔者在中国知网上对几所高校新晋升的中级、副高级、正高级三类职称进行第一作者全文检索,发现新晋中级职称的文献收录平均为2.66篇,引证次数平均为0.8次;新晋副高级职称的全部文献累加收录平均为10.37篇,引证次数平均为9.12次,H指数1.88;而新晋正高级职称的全部文献累加收录平均为22篇,H指数2.47。所以,中级职称的评价看文献收录的数量,要比看容易造假的纸质期刊先进;副高级职称的评价看文献的引证次数,要比看文献的收录篇数先进,因为有引证的论文泡沫相对较少;正高级职称的评价看文献的H指数会更先进,因为H指数不便于搞“短、平、快”工程。但是这些评价必须在同一学科内进行。比如,成果鉴定本来是用于评价工程技术成果的,现在却用来评价人文社科成果。美国的《社会科学引文索引》在全球范围内收录了四千多种人文社科类期刊,却没有中国大陆的一份期刊。按此标准,中国的人文社科学术水平竟然排在菲律宾和土耳其之后!所以说,美国标准在意识形态较浓厚的领域就不适应。
三是利用电子资源,减少人为干扰。学术评价之所以出现那么多不尽人意的地方,就在于人们肆无忌惮地加入了许多学术之外的调和剂。有人不适合从事学术工作,但在学术之外却比较活跃。单位要把他们流动出去,既缺少相应的机制,又没有合适的职位和社会保障,因而这项工作大多是虎头蛇尾。几百种非法期刊能够顺利挤入职称评定的材料堆里,使“办刊者”成为暴发户,使造假者顺利晋升,许多情况下并不是审查者不知情,而是他们不敢讲出来。即使是有人敢于举报,处理时大多数都是轻描淡写。近年来,江苏、福建、吉林、广西、山东等省市开展职称网络评审,要求进行电子文献检索验证,就是试图在减少这些人为因素的干扰。如果各个部门建立了完善的电子档案,利用权威的电子文献,以及中国知网等部门研制的“学术不端行为监测系统”进行评价,可以在一定程度上提高评价的公信力。
四是公示评价材料,受理网络举报。学术不端行为的大面积沦陷,仅靠少数管理者是无能为力的。一方面是管理者在很多情况下不熟悉专业前沿;另一方面是管理者在明处,极易受到打击报复。2010年8月,方舟子遇到袭击,就是一个典型案例。如果将各种评价材料长时间公示在网络上,吸引众多的专业人员参与进来,由他们提供可靠的线索和准确的事实,然后由管理者去验证,则会有效地打击各种学术不端行为。尤其是将与被评价者有着切身利益冲突的群体调动起来,则可以明显遏制学术不端行为发生的概率。
五是应用先进方法,提高博弈能力。任何学术评价方法都是特定时期的产物。在提高学术评价的博弈能力方面,我们可以向其他领域学习,比如体育界中的反兴奋剂做法,治安领域的禁毒做法,以及政府查获伪钞的做法等,那是下了血本才有所收效的。假如我们的学术评价手段一直停留在纸质文献时代,而面对千变万化的网络时代熟视无睹、无暇顾及、善恶混淆,一边评价一边心安理得装“红包”,心慈手软、敷衍了事、你好我好大家都好,则学术评价也就失去了最基本的意义,我们的知识创新体系就会鱼龙混杂,就会产生可怕的“劣币趋良”和“鸠占鹊巢”现象,直到一个民族失去自己的基本思维能力。事实上,学术评价的前沿领域,都时刻不停地诞生着各种新理论和新方法。评价者只要虚心学习,勇于探索,无私无畏,不断改进,就一定能够有所超越。
(作者单位:河南科技学院)