(浙江工业大学 全球智库研究中心,浙江 杭州 310023)
2013年4月,习近平总书记首次提出建设“中国特色新型智库”的目标,这为中国特色新型智库建设指明了根本方向。2015年1月,中共中央办公厅、国务院办公厅印发了《关于加强中国特色新型智库建设的意见》[1],指出要建设定位明晰、特色鲜明、规模适度、布局合理的中国特色新型智库体系,中国大学智库建设开始呈现出百花齐放的态势,这既是政府和管理部门全力推进的结果,也是大学智库机构自身建设的必然要求。为了适应新形势对大学智库的新要求,建立新的发展导向,引导大学智库肩负起新的责任和使命,必须要重视现阶段中国大学智库建设的评价方法,构建大学智库评价的指标体系,这不仅具有理论价值,更具有现实意义。
大学智库是中国特色新型智库的重要组成部分。大学智库依托大学的学科、学术、人才及身份优势(独立性、公正性、严谨性),既有一般智库的共性,又有其独特的个性,尤其在评价方法、评价逻辑和评价指标等方面具有独特性。研究大学智库评价方法和评价指标体系,能够引导、规范中国大学智库建设健康有序地发展。为此,以梅新林教授领衔的全球智库研究中心提出了具有中国特色的大学智库评价“三维模型”[2],即通过“契合度—活跃度—贡献度”三个维度来整体评价中国大学智库机构的发展状态和建设水平。
契合度(Fitness)是评价大学智库基本标准与任务要求满足程度的重要维度和指标。中国大学智库多为学术研究机构转型或学科综合而成,契合度评价能有效引导大学智库逐步向实体性、专业化、规范化的中国特色新型智库方向发展。活跃度(Activity)代表大学智库机构和首席专家在国内外公开场合发表理论观点、提供政策建议的传播能力和频率,进而转化成社会、公众和政府影响力[3]。目前,全球最大的中文搜索引擎百度(Nasdaq:BIDU)的搜索频度可表征特定对象的活跃度和影响力,为“互联网+量化评价”提供了重要基础和实现可能。贡献度(contribution)代表大学智库对社会产生的效益和影响,评价大学智库贡献度主要是关注其在治国理政、战略规划、决策咨询、公共政策、公共外交等领域,在资政建言采纳、理论成果研究、智库人才培养方面所呈现的重要贡献。
自2006年开始,由詹姆斯·麦甘(James McGann)担任主任的美国宾夕法尼亚大学“智库与公民社会项目”(TTCSP)每年都会发布一份全球智库排名报告,从“资源—效用—成果—影响力”指标等四个维度对智库进行评价,其报告具有一定影响力[4]。2017年,詹姆斯·麦甘研究团队依据全球4 750名政策制定者、新闻记者、公共(私人)捐助人以及各类区域专家的意见和建议,对全球175家顶级智库进行排名[5],这种完全主观定性的研究方法受到学界的质疑。正如梅新林教授所说的,“其评价标准、评价方法尤其是智库排名主要还是基于西方的导向性评价理念与标准。所以特别需要通过建构新型智库研究的理论模型,打造更符合中国国情和大学特征的‘中国标准’,然后通过对大学智库、中国智库、世界智库的评价与排名,将承载中国特色话语体系的‘中国标准’推向世界”[6]。
基于“三维评价模型”的大学智库指标体系构建,体现了“中国特色”和“中国标准”。 因为中国大学智库建设正处在探索期、转型期和过渡期,为了适应新形势对大学智库的新要求,建立新的发展导向,引导大学智库肩负起新的责任和使命,体现国家目标要求和政策导向的目标需要,大学智库评价的“三维模型”需要具体的指标体系来学理性和逻辑性地表达,通过分级指标和权重界定进行具体量化评价,并由微观评价和观测要点来落脚和加权,从而体现“三维模型”的评价指标体系的导向性、应用性、可操作性的价值。
大学智库评价方法和指标体系要求各指标之间要有一定的逻辑关系,它们不但要从不同的侧面反映出大学智库建设和发展的主要特征、状态和内在联系[7],而且每一个子系统,即一级、二级指标和微观测量点,均由一组指标构成,各指标之间相互独立又彼此联系,共同构成一个有机统一体。指标体系的构建具有层次性,自上而下,从宏观到微观层层深入,形成一个不可分割的评价指标体系。因此,体现“中国标准”的大学智库评价指标体系应包括以下指标:(1)契合度的二级指标:(A)组织机构;(B)研究队伍;(C)资金来源,以及三级观测点指标11个。(2)活跃度的二级指标:(A)学术交流活跃度;(B)网络媒体活跃度;(C)资政建言活跃度,以及三级观测点指标13个。(3)贡献度的二级指标:(A)决策咨询;(B)学术研究;(C)人才培养,以及三级观测点指标12个。以上指标共同构成一个可测度、可比较、可操作的量化指标体系。
从理论上讲,构建评价模型、设置评价指标、确定指标权重是特定对象的评价研究中不可或缺的重要环节和基础,它对揭示评价对象的规律,解构评价样本的特点,把握评价主体的状态,具有宏观性、战略性和指导性的意义。但是,任何理论性的评价指标体系都会遇到评价信息、评价数据的来源问题、落地问题、可行性问题、可操作性问题,甚至反过来需要修改或修正指标体系,使之更有效、更便捷、更客观。而基于“三维模型”的大学智库评价方法和指标体系构建后,也同样会遇到智库评价信息的数据采集问题、方法问题以及破解基础数据“困境”的路径问题。
困境一:信息与数据不对称、不完整。传统研究和评价方法,如问卷调查、实地调研、专题研讨,不仅工作量大,难度和成本也高。由于任何评价对象都是历史的、动态的、发展的,人为跟踪评价研究具有很高的难度,甚至智库机构提供的信息和数据也会受到数据的系统性和真实性之质疑。尽管国内智库评价机构也探索与设计客观评价指标体系,采取多轮主观评价方法,以问卷调查和专家评议相结合的方式开展研究,甚至采用决策咨询的用户评价、同行评价与社会评价相结合的方法(见上海社会科学院智库研究中心《2015年中国智库报告——影响力排名与政策建议》),兼顾样本“点”上的专业性、代表性及调查“面”上的差异性、多样性,并取得了一些突破和进展。如由南京大学中国智库研究与评价中心联合《光明日报》智库研究与发布中心自主研发的“中国智库索引”系统,在信息数据采集机制上展开了有益的尝试,这一系统可以通过智库机构或专家自主填报、工作人员手工搜集整理以及网络爬虫自动采集三种方式获得智库数据,但目前还是主要依靠智库机构或专家自主填报为主,这也使得评价信息和数据出现不对称、不完整的特点,影响了全面、快速、高效、客观地开展智库评价。可见,如何有效跟踪智库机构和首席专家的动态与变化,传统的社会科学研究方法仍力不从心,信息数据问题仍然困扰研究与评价工作深入。
困境二:信息与数据海量化、碎片化。随着互联网和信息技术的发展,信息与数据的获取方式和路径也发生了革命性的变化,政府原有的封闭的海量信息与数据正逐步对公众开放,数据增长正在体现“摩尔定律(Moore’s Law)”,即数据在未来18个月内,数据量将增加一倍。因此,今天的人们突然发现信息与数据“大爆炸”,数据越来越呈现出颗粒度小、无序性高、碎片化强的特点,传统研究方法显得无能为力。各种社会科学研究包括智库评价研究等都面临着“堆积如山”无序化的海量数据,如何快速采集、有效界定、分层遴选、判断归类、科学评价、实时跟踪变成了处理信息与数据必须要面对的诸多现实问题。好在大数据、云计算和人工智能等新一代信息技术,为不同类型、不同体量的数据结构化存储、批量处理以及价值挖掘提供了技术支撑,也为获得公共数据资源的“红利”提供了技术路径。
众所周知,随着信息技术和互联网的快速发展,全球数据呈现爆发增长、海量集聚的特点,对经济社会产生了重大影响。公共数据资源作为数据中的一种,有着其特殊的地位和作用,美国国家科学院国际科技信息项目部主任保罗·乌勒(PaulUhlir)在给联合国教科文组织起草《发展和促进公共领域信息的政策指导草案》时,把公共数据资源定义为“不受知识产权和其它法定制度限制使用以及公众能够有效利用而无需授权也不受制约的各种数据资源”。推动公共数据资源整合和开放共享,业已成为中国实施国家大数据战略的重要内容,而这也为量化评价智库提供了实现的基础。
通过研究不难发现,过往的智库评价之所以偏重传统的主观定性研究,是由于开展评价的量化研究缺少成熟的手段和方法。令人欣慰的是,新一代信息技术的发展,为在公共数据资源进行特定对象和目标的表征搜索与挖掘提供了可能性与可行性[8]。研究表明,大学智库机构和首席专家等所参与的国内外重大活动、论坛报告、媒体发声、观点阐述等都会转换成网络信息被大量传播或转发、被关注或推送、被留痕或记录,这里包括主持和承担的国家基金重大项目、政府委托的重大研究课题以及在国内外发表的学术论文、理论观点,甚至包括智库网站的源信息数据等,这些共同组成了公众都可获取的公共数据资源,它为“互联网+量化评价”提供了重要基础和可能[9]。我们对大学智库评价设立“活跃度”这一维度,就是为弥补大学智库信息数据不完整性的一种方法,也是希望利用公共数据信息平台,运用大数据和云计算技术开展大学智库的活跃度的量化评价,从而使得数据化、数字化改变传统人文社会科学的评价方法成为一种可能或趋势。
大学智库评价研究中,一方面应重视考察、调研、问卷、研讨等传统研究方法,对大学智库发展状态作出直接判断与评价;另一方面应充分利用公共数据资源,如政府开放的各种公共数据,包括(1)国家自然科学基金、国家社会科学基金、政府决策类咨询研究项目的立项数据库;(2)第三方数据,如国内外各类学术论文数据库,包括影响力(被引用率—quoted rate数据)等;(3)大学智库机构网站(源信息与数据);(4)网络媒体、传统媒体的数字化等信息资源和数据资源。通过对以上公共数据库的检索,充分利用各类搜索引擎技术,不断更新与丰富智库的基本情况数据、智库活动信息、首席专家社会活动数据(图1),做实“契合度·活跃度·贡献度”三大基础数据。
1.丰富“契合度”基础数据。通过问卷、调研、考察方法,同时利用大学智库网站的“源数据”特点,收集微观评价和观测数据,跟踪大学智库机构的发展状态,如研究平台建设、组织架构、数据信息处理能力和基础、资政建言的渠道建设、首席专家变化、专职人员增减情况、研究经费来源与规模情况、运营经费来源与数量变化等数据。
2.采集“活跃度”基础数据。众所周知,百度(Nasdaq:BIDU)是全球最大的中文搜索引擎,中国市场占有率达90%,百度搜索频度可表征特定对象的活跃度和影响力。采用大数据、云计算和AI技术,从公共数据资源中,对大学智库机构和首席专家,进行总量搜索、年度搜索、月度搜索,获得“活跃度”评估的基础数据。搜索的内容包含大学智库机构和首席专家发布的咨询报告,参与的咨政活动,开展的学术交流、国际合作以及在各类媒体上的智库发声等。
3.搜索“贡献度” 基础数据。运用网络爬虫技术(Zoology)进行定向搜索、精度搜索、持续搜索,通过快速收集、清洗过滤、价值判断、分类储存等手段,提供客观、丰富、实时的基础数据,如领导批示数量与层级、资政建言的成效、参与政策制定和规划研究的层级、科研项目数量与层级、国内外论文与专著发表情况、研究成果获奖层级与数量、智库人才培养与国际培训等数据。
信息与数据是一组既有联系又有区别的概念,数据是信息的表现形式和载体,信息是数据的内涵。数据和信息是不可分离的,信息依赖数据来表达,数据的最终目标是为传递特定的信息。要形成丰富、真实、全面的大学智库评价基础,有赖于数据的收集、存储、归类、运算,最后得到评价所需的各类信息。
大学智库数据采集有“两条路径”:(1)采用API (Application Programming Interface)采集,以“大数据”为代表的数据资源,来源更加广泛,数据粒度更小,记录单元更加碎片化。但云计算技术可从相关性中快速获得有价值的数据挖掘,从而获得特定大学智库机构或首席专家的重要信息和数据。(2)网络爬虫技术(Zoology)是一种自动获取网页内容的程序,是搜索引擎的重要组成部分,可实时、定向搜索大学智库信息和数据,将一定数量信息和数据存储在云池(HDFS),再经人工方式的定性分析和价值判断,分类进入大学智库研究的数据库系统(图2)。
基于云计算架构的公共数据的Hadoop采集与挖掘及跟踪分析平台,首先将公共数据资源中搜索和获得的大学智库数据进行清理、转换、加载等预处理,再通过数据挖掘、价值判断、分类处置,为智库评价提供数据分析基础和依据。Hadoop是一个由Apache基金会所开发的分布式系统基础架构。Hadoop的优点是在用户不了解分布式底层细节的情况下,开发分布式程序。Hadoop基础架构最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce为海量的数据提供了计算。
大学智库数据库系统建设是一项基础性、建设性和创新性的工作,数据库建设本身也是一个不断丰富、充实、完善和发展的过程。数据库不仅需要容量大、速度快、便于统计与计算,而且需要一个开放、共建、共享的平台和载体。构建基于Wiki技术之上的数据库系统具有众多优点,可作为中国大学智库建设的一种可行方案。
众所周知,维基(Wiki)的发明者是沃德·坎宁安(Ward Cunningham),世界上第一个维基(Wiki)网站就是由他在1995年建立的。维基(Wiki)是指一种超文本的编辑系统,这种超文本系统支持面向社群的协作式写作,利用这一技术可以实现在Web的基础上对文本的浏览、创建、更改操作,这一技术的最大优势是只要具备基本的Web浏览和文字录入技能的人都能轻松、熟练的使用,并可以多人同时在线录入和修改,提升了大学智库数据库的建设效率,降低了建设成本,缩短了建设周期。利用Wiki技术在数据分析中的快捷、易用、方便、开放、实时、可扩展等特点,构建基于维基百科(Wikipedia)的大学智库数据库,形成“四大专题数据库”:(1)评价指标库;(2)绩效数据库;(3)数据内容库;(4)信息资源库。研究团队可基于标准化、规范化、数据化的要求,添加、移动和编辑常态化数据内容,在不需要了解HTML和其他编码语言的多人协作下构建大学智库数据库,从而实现大学智库数据的共建和共享,为遴选、评价、比较大学智库发展状态提供坚实的数据基础。