俞立平 钟昌标
人文社会科学是人类的精神家园,高校在人文社会科学研究与发展中发挥着极其重要的作用。大学是创新活动的重要载体[1],高校科研人员重在基础研究,对原有技术实现根本性、革命性的突破[2]。知识经济时代要提高高校的科研水平和竞争力,就要不断强化高校科研的战略意识与创新意识[3]。在自然科学研究中,高等院校、国家级的科研院所往往侧重基础研究,而广大企业、一般科研院所则侧重应用研究。与自然科学不同,人文社会科学科研院所侧重应用研究,广大高等院校既重视基础研究,也重视应用研究,高校绝对是人文社会科学研究的主力[4]。近年来我国高校人文社会科学发展较快,2009年高校人文社会科学投入54.63亿元,2018年为190.54亿元,平均年增长14.89%。从研发人员看,2009年为425939人,2018年为764235人,平均每年增长6.7%。从产出看,2009年高校人文社会科学的论文、学术著作、获得批示的研究报告分别为312807篇、27021部、3347部,2018年分别为363712篇、30109部、9474部,论文和学术著作稳步增长,而研究报告增长速度较快,平均每年增加12.26%。
人文社会科学投入产出关系相对复杂[4]。从投入看,人文社会科学研究许多取决于学者多年的积累,不同学科研究的异质性相差较大。此外不同学科研究对于经费需求也大相径庭,一些具有自然科学特点的学科,对科研经费需求相对较大,而一些人文学科、艺术类学科,尤其是一些侧重基础理论研究的学科,对科研经费的需求相对较少。此外,研发经费与研发人员之间也是相关的,会出现变量的内生性问题。从产出看,人文社会科学研究产出更加多样化,并且不同产出之间也存在互动关系[5]。常见的人文社会科学产出包括学术论文、学术著作、研究报告等多种形式,他们之间是相关的。以上问题导致在研究高校人文社会科学投入产出分析时,容易出现估计偏误,难以得出真实的结论。
目前的人文社会科学投入产出关系的研究方法有局限性。现有的研究主要采用回归为主的方法与DEA效率为主的方法,另外还有少量采用指标体系分析的方法。由于效率分析仅仅是投入产出关系分析的一个方面,许多研究更关注人文社会科学投入要素的弹性,但是目前基于回归方法的分析均存在结果信息不足问题。比如研发经费与研发人员两种要素,如果研发经费的弹性没有通过统计检验,或者通过统计检验,但回归系数为负数,这两种情况均说明研发经费的绩效较差。如果进一步提出这样的问题,研发经费绩效虽然较差,但在人文社会科学研究中不可能没有作用,它的作用到底有多大?与研发人员相比,哪个更重要?相对重要性多大?现有的投入产出分析中,并没有解决这个问题,本文将这个问题称为投入要素盲点。这个问题是回归的基础问题,较少有研究关注。
从新的视角开展高校人文社会科学投入产出分析具有重要意义。第一,有助于对高校人文社会科学投入产出关系进行全面的分析,从而把握投入产出特征。第二,有助于发现高校投入产出中存在的一些问题,从而针对性地提出政策建议。第三,有助于从方法论的角度探索进一步研究的方法,从而丰富投入产出关系研究。
本文以教育部高校人文社会科学信息网公布的省际高校人文社会科学面板数据为例,在理论分析的基础上,综合采用联立方程模型和BP人工神经网络模型进行相关研究。其主要的创新体现在,第一,基于联立方程模型,有利于消除变量的内生性,使得投入产出关系分析更加准确。第二,将BP人工神经网络模型引入到投入产出分析中,从而更好地分析投入要素贡献,解决投入要素盲点问题,更好地进行全面评估,在研究方法上有所创新。
关于高校科研成果投入产出关系研究,主要集中在投入产出分析和效率分析。在投入产出分析方面,侧重自然科学或高校整体角度的研究较多,鲍威、哈巍等研究了原“985工程”建设高校国际学术影响力的驱动要素,发现专项财政资金有效促进了相关高校全球知识网络建构、国家间学术互动,短时间提升了我国高校国际学术影响力[6]。王晓娆、李红阳比较了中美高校研发经费投入绩效,发现中国工业企业最强,其次为科研机构和高等学校,而美国高等学校最强,其次为企业和联邦政府科研机构[7]。郭泉恩、孙斌栋研究发现,高校创新产出和研发人员对区域创新有显著促进作用[8]。梁剑莹、安宁对广东高校研究发现,对创新能力影响最大的是人力资源,其次是产学研合作,最后是政府公共政策[9]。王萧萧、朱桂龙实证研究发现,高校独立研发对专利质量无显著正向影响,更接近技术先驱者,大企业有显著正向影响,更接近技术独特者[10]。
关于高校人文社会科学投入产出分析的研究总体不多,俞立平、彭长生首先采用TOPSIS评价创新成果,然后采用面板数据模型和面板向量自回归模型分析投入产出关系,发现对科技成果贡献最大的是研发人员,科研经费弹性较小[11]。董珏、陈天天等研究发现,人文社会科学领域人才引进效能受到人员引进前基本情况的影响[12]。马瑞敏、张欣等构建中国本科高校人文社会科学竞争力评价指标体系,对当时全国778所本科高校的人文社会科学竞争力进行评价和分析[13]。李贞、张体勤建立“投入—中介—产出”(IMO)模型,对高校人文社会科学团队绩效进行评价[14]。
从DEA效率角度研究高校效率的较多,Warning评价了73所德国公立大学的效率[15]。黄建国、袁伟灿研究了41所世界一流大学建设高校科研效率,发现科研效率水平总体不理想,技术退步是造成高校科研效率整体下滑的主要原因[16]。康乐、陈晓宇研究发现,“985工程”建设高校效率优势体现在英文发表,我囯高校中文发表效率开始下降,但英文发表的效率正逐渐提高[17]。王庆金、王强等运用因子分析和DEA分析教育部直属高校的投入产出效率,发现虽然效率普遍偏低,但绝大多数高校处在规模效率递增阶段[18]。宗晓华、付呈祥研究了教育部直属高校科研效率,发现高校科研效率近10年虽有提高,但进步不快,整体效率偏低,并且规模效率不断减小[19]。阚大学研究了中部地区高校效率,发现综合类、师范类、财经类高校整体效率较高,农林类、医学类、其他类高校效率偏低,“985工程”建设高校效率整体情况最好,其他公办本科高校效率较差[20]。
还有一些研究从学科或某个视角研究高校效率,Kocher等测度了21个OECD国家和地区经济学学科科研效率[21]。Tomkins等对英国大学会计学院的效率进行评价[22]。杨博、曹辉测度我国各地区高校技术创新国际化效率,发现华东、华中、华北、西南地区效率较高,东北三省效率较低[23]。魏国江建立空间计量模型测算我国产学研不同主体的协同创新效率,发现各创新主体更多依靠自主研发,研发经费外部支出即协同创新投入的效率均较低[24]。
从现有的研究看,学术界对高校投入产出关系的研究总体比较丰富,研究涉及投入产出分析和DEA效率分析,还有一些基于指标体系的评价分析。大多数以自然科学为主,少量研究涉及人文社会科学。从研究视角看,既包括高校内部投入产出分析,也包括高校对经济社会发展的贡献;既包括整体绩效分析,也包括学科分析、学院分析,还包括国际化、协同创新、专利质量等视角的分析。总体上,在以下领域有待进一步深入:第一,人文社会科学研究产出较多,不同类型产出之间关系复杂,对于投入产出关系以及不同产出之间的关系需要进行进一步的理论研究,在此基础上进一步进行深入研究。第二,从研究方法看,现有研究主要集中在回归分析、DEA分析和指标体系,关于投入要素盲点问题,现有的研究缺乏有效的方法,迫切需要推进研究方法创新。第三,即使采用回归分析,考虑到变量的内生性以及产出变量之间的互动关系,现有研究至多采用工具变量,较少采用系统估计方法,如联立方程模型来描述高校人文社会科学投入产出之间的特征。
人文社会科学投入要素主要包括研发经费和研发人员,产出成果主要包括学术论文、学术著作和、研究报告和奖励等。投入要素之间、产出要素之间、投入与产出之间存在复杂的互动关系。
人文社会科学投入产出诸要素之间的互动关系如图1所示。
图1 人文社会科学投入产出互动关系
首先对课题与奖励进行必要的说明。课题虽然重要,但在人文社会科学研究中,课题既不属于投入,也不属于产出,它是广大学者为了申请科研经费资助时一种必不可少的行为,尽管课题的中标率以及级别高低反映了学者的水平,并且和科研成果紧密相关,但它本质上并不属于科研成果。关于奖励,它是在现有学术论文、学术著作和研究报告的基础上申请的,不是直接科研成果,属于间接科研成果,加上本文研究数据并没有很好地区别不同级别的奖励,因此本研究暂时不考虑课题与奖励两个指标。
研究经费和研发人员无疑是人文社会科学研究中两个最重要的投入要素,两者高度相关。对于人文社会科学研究,科研经费同样重要,它是学者进行调查、参加学术会议、购买图书资料、支付必要专家咨询费和劳务费等等的重要经费保障。需要注意的是人文社会科学不同学科对科研经费的需求多少、开支渠道有较大差别,并且人文社会科学研究经费与自然科学相比总体较少。对于人文社会科学研究而言,研发人员更强调知识积累和个性化的劳动,更加具有特色。同时需要注意的是,研发经费与研发人员是高度相关的,并且具有互动关系。当研究经费充足时可以吸引更多的研发人员来进行研究,而研究人员较多时也意味着通常情况有更多的申请科研经费的机会,从而获取更多的科研经费支持。
学术论文是人文社会科学最重要的成果,学术著作是最系统的研究成果,而研究报告是应用性最强的研究成果,三者密切相关。高校的教师、研究员和研究生等均被鼓励发表学术论文来促进学科发展,而其中一部分成果质量较高,属于学科前沿,能够促进相关产业发展,学术论文是高校知识溢出的主要途径之一[25]。对于人文社会科学而言,学术期刊既刊登基础研究论文,也刊登应用研究论文,尤其随着国家近几年来对智库建设的重视,应用论文比例有增加的趋势。学术著作是更加系统化的研究,比学术论文更加全面,学术观点也可以更深入全面地进行论述。研究报告往往是高校服务政府部门和企业的重要表现,属于应用研究。基础研究是应用研究的基础和重要支撑,理论学术论文和学术专著是研究报告的重要基础。学术论文与学术著作密切相关,应该说学术论文是学术著作的基础,如果长期从事某个领域的研究,积累了一定的学术论文成果,可以在此基础上进行归纳和提升,形成学术著作。在学术著作的撰写过程中,一些能够独立成章的创新性研究也可以用来发表论文。此外,一些高质量的研究报告也可以出版,成为学术专著,或者其中的一些章节作为应用型研究论文发表。
人文社会科学投入产出的互动关系也比较显著。首先投入决定产出,根据生产函数,人文社会科学科研活动也属于典型的生产,其研发经费和研发劳动力是科研成果的重要基础。其次,科研成果对研发投入具有反作用,当学术论文、学术著作、研究报告等成果丰硕时,会促进高校加大研发投入,同时国家和地方政府也会加大对人文社会科学政策与经费支持,产生良好的反馈。当人文社会科学科研成果不佳时,也会影响投入,甚至使得研发资源的增长停滞。
联立方程模型是用来分析诸变量投入产出复杂关系的模型,它较好地克服了变量的内生性问题,根据前文分析,本文建立联立方程模型如下:
公式(1)中,Y1、Y2、Y3分别为学术论文、学术著作、研究报告,K表示研发经费、L表示研发劳动力。cij表示回归系数,其中i表示方程序号,j代表变量序号,i,j=1,2,3,4,5。
方程一中,研发经费、研发劳动力是学术论文的投入,此外,学术专著、研究报告也会对学术论文有促进作用。学术著作和研究报告的部分章节,也可以整理后作为学术论文发表。
方程二中,研发经费、研发劳动力是学术著作的投入,学术论文、研究报告也会对学术著作有促进作用。学术论文是学术著作的重要基础和积淀,研究报告也可以作为学术著作出版。
方程三中,研发经费、研发劳动力是研究报告的投入,学术论文、学术著作也会对研究报告有促进作用。理论性学术论文和学术著作是研究报告的理论基础,没有较好的基础研究,难以做好应用研究。
方程四中,研发劳动力对研发经费会产生影响,当人文社会科学研究人员较多时,一方面高校会增加研发经费支持,另一方面也增加了申报政府和国家科研经费的机会。此外,良好的科研产出会促进研发经费的增加,形成正反馈。
方程五中,研发经费对研发人员有重要的影响,当研发经费充裕时,会促进研发人员增加。此外,良好的科研产出会促进研发人员的增加,形成正反馈。
基于联立方程模型或传统的各种多元回归模型来研究人文社会科学投入产出关系有一个重要缺陷,即只能通过回归系数的符号、大小以及是否通过统计检验来分析变量之间的关系,会出现投入要素盲点错误。
如图2所示,在典型的投入产出回归分析中,假设有3个投入要素,根据其是否通过统计检验大致分为三种情况,一是投入要素的回归系数为正,并且通过了统计检验,在这种情况下,可以比较不同投入要素回归系数的大小,从而比较不同投入要素的绩效。二是投入要素的回归系数为负数,并且通过统计检验,此时可以判断该投入要素绩效不佳。三是投入要素的回归系数不管是正数还是负数,均没有通过统计检验。对于第二种、第三种情况,只能大致说明第二种情况投入要素绩效最差,但均不能判断这两种情况下投入要素对产出的积极贡献,并比较其大小,本文将这种情况称为投入要素盲点。在投入要素盲点情况下,不能简单说该要素就没有作用,还是要进一步分析比较各投入要素的贡献与作用。
图2 投入要素盲点
投入要素盲点问题本质上是过度掩盖了投入要素的积极作用。根据经济学投入产出原理,尽管某个投入要素的绩效可能不佳,比如劳动力对经济增长的贡献不显著,没有通过统计检验,但这并不代表劳动力就没有任何作用,毕竟经济增长是广大劳动者通过辛勤的双手创造的。所以在存在投入要素盲点的情况下,需要采用新的方法来估计投入要素的实际贡献,从而给政策研究提供重要参考,而BP人工神经网络就是一个较好的工具。
人文社会科学投入产出关系本质上也是一个黑箱,虽然其基本运作机制是清楚的,但由于投入产出关系复杂,涉及变量多,本质上属于复杂巨系统,因此用BP人工神经网络分析是可行的。将人文社会科学投入产出分别作为BP人工神经网络的输入和输出,建立机器学习模型并进行训练,从而可以高度拟合投入产出关系,并且得到各投入要素的权重,这样就可以比较投入要素的权重大小。
BP神经网络模型是对人脑神经网络若干基本特性的抽象和模拟,可以进行分布式并行信息处理[26]。BP神经网络一般由输入层、隐含层、输出层组成,是一个包括隐含层的多层前馈网络。其中隐含层可以有多个,每层的神经网络节点也可以有多个,一般根据经验确定。模型的核心思想是不断调整网络连接的权重使得网络的总体误差最小。假设输入层神经元有m个,隐含层有q个,输出层变量有l个,其学习步骤如下:
第一,网络初始化。预先给出权重系数最小的随机数。
第二,输入训练集。输入向量为x(1),x(2),…,x(n),期望输出向量为t(1),t(2),…,t(N),N表示训练样本数量。
第三,BP网络前馈计算。假设用样本P进行训练,隐含层第i个神经元的输入为:
式(3)中,g()为隐含层激活函数,一般用sigmoid函数表示:
式(5)中,ωki为隐含神经元i与输出节点k的连接权重,θk为输出层神经元k的阈值。
第四,计算误差。BP神经网络系统的总误差函数Ep为:
第五,权重系数调整。如果总误差没有达到要求,则使权重系数沿着误差函数的负梯度方向进行调整。输出层和输入层权重系数调整量的计算公式分别如式(8)和式(9)。
Δωki和Δωij分别为输出层和输入层权重系数调整量,η为学习速率,取值大于0,经过反复训练,直到误差达到满意结果为止。
需要注意的是,BP人工神经网络作为一种新的估算投入要素贡献的方法,其可靠性有待与传统回归结果进行对照分析,如果权重排序与回归系数分析基本相近,那么就可以将BP人工神经网络作为一种新的分析工具适当进行推广(图3)。
其次,BP人工神经网络对投入产出关系是一种智能化模拟,也存在拟合优度问题。回归分析的拟合优度也是对投入变量解释程度的一种反映,由于缺失一些投入变量,或者是投入变量难以计量,或者存在统计数据误差等原因,会导致投入变量不一定能有效地解释产出变量。对于这个问题,从提高稳健性角度,应该将回归分析的拟合优度与人工神经网络分析的拟合优度同时考虑。具体做法是,对于总体拟合优度,要用回归拟合优度乘以BP神经网络的拟合优度。
图3 BP神经网络与回归综合分析
本文从宏观视角研究高校人文社会科学投入产出特征,并且尝试在方法论层面有所创新。所有数据全部来自于教育部中国高校人文社会科学信息网(https://www.sinoss.net),依托其中的省际高校面板数据进行实证研究。
对于投入变量,人文社会科学研发经费来源于研发经费内部支出,研发劳动力来源于研发人员数量。对于产出变量,人文社会科学学术论文与学术著作采用原始数据,研究报告往往是高质量成果,相当于自然科学研究的成果转化,是一个更好的产出变量。
教育部网站省际面板数据的时间跨度为2009-2018年,包括大陆31个省市数据,所有人文社会科学产出数据均为中文成果。考虑到高校人文社会科学投入与不同产出之间存在不同滞后效应,研究报告的滞后期一般是数月到十几个月,学术论文的滞后期一般是数月到1-2年,学术著作滞后期一般需要数年,经过综合平衡最后确定滞后期为1年。变量的描述统计如表1所示。
表1 变量描述统计
教育部高校人文社会科学数据时间跨度为9年,总体不长,但为了防止出现伪回归,还是需要进行变量的平稳性检验,结果如表2,当0阶时,所有变量是部分平稳,当1阶时,所有变量均为平稳时间序列。
根据公式(1),联立方程的估计结果如表3所示,模型5个方程的拟合优度总体较高,最低的为因变量是研究报告的拟合优度,为0.707,说明研究报告的决定和影响因素比较复杂,其他方程的拟合优度均在0.850以上。大部分变量的回归系数均通过了统计检验,模型总体结果良好。
表2 变量的平稳性检验
表3 联立方程估计结果
方程一因变量是学术论文,拟合优度为0.957,水平很高。从回归结果看,研发人员的弹性系数最高,为0.597,且通过了统计检验;其次是学术著作,弹性系数为0.386,也通过统计检验;再次为研究报告,弹性系数为0.046,虽然较低但通过了统计检验;最后是研发经费,弹性系数为0.008,没有通过统计检验。
方程二因变量是学术著作,拟合优度为0.895,水平较高。从回归结果看,学术论文回归系数最高,为1.132,并且通过了统计检验;其次是研发经费,回归系数为0.107,也通过了统计检验,但远小于论文的弹性系数;研发人员的弹性系数为-0.237,通过了统计检验,但结果为负数,说明研发经费的绩效不佳;研究报告的弹性系数为-0.018,但没有通过统计检验,说明大多数研究报告并没有形成专著,更多发挥了决策咨询的作用。
方程三因变量是研究报告,拟合优度为0.707,属于中等水平。从回归结果看,学术论文的弹性系数最大,为0.882,通过了统计检验;其次是研发经费的弹性系数,为0.789,也通过了统计检验;研发人员的弹性系数为-0.436,通过了统计检验,但结果为负数,说明决策咨询是少数研发人员擅长;学术著作的弹性系数为-0.018,没有通过统计检验,说明大多数学术著作侧重基础研究,对擅长从事基础研究的学者而言,大多数并不适合从事应用研究。
方程四因变量是研发经费,拟合优度为0.852,水平较高。从回归结果看,研发人员的弹性系数最大,为0.711,通过了统计检验;其次是研究报告,弹性系数为0.249,通过了统计检验;第三是学术著作,弹性系数为0.219,通过了统计检验;学术论文的回归系数为0.050,但没有通过统计检验。
方程五因变量是研发人员,拟合优度为0.921,水平很高。从回归结果看,学术论文的弹性系数最大,为0.775,通过了统计检验;其次是研发经费,弹性系数为0.153,同样通过了统计检验;学术著作的回归系数为-0.105,同样通过统计检验,但系数为负数;研究报告的弹性系数为-0.030,仅在10%的水平下通过了统计检验,并且回归系数为负数,可以视为不相关。
以上回归结果可视化后如图4所示,箭头方向表示作用方向,实线表示弹性为正,虚线表示弹性为负,线条粗细表示回归系数绝对值大小。
以研发经费的绩效分析为例,研发经费对研究报告的弹性为0.789,对学术著作的弹性为0.107,与学术论文无关。但是研发经费通过两条间接渠道对学术论文发挥作用,一是通过学术著作对学术论文产生影响,其间接弹性为0.041(0.107*0.386),二是通过研究报告对学术论文产生影响,弹性为0.036(0.789*0.046),其间接弹性之和为0.077(0.041+0.036)。
图4 联立方程回归结果可视化图
再以研发人员的绩效分析为例,研发人员对学术论文贡献的弹性最大,弹性为0.597,表现为粗实线;对学术著作的弹性虽然为-0.237,表现为虚细线;与研究报告无关,没有线条相连。但是通过学术论文对学术著作的极高弹性1.132弥补了这种损失,实际对学术著作的弹性为0.439(0.597*1.132-0.237=0.439);通过学术论文为研究报告的较高弹性0.882同样弥补了损失,实际研发人员对学术报告的弹性为0.527(0.597*0.882)。上述分析结果如表4所示,综合分析可以看出研发人员的绩效要高于研发经费。
表4 研发投入的综合绩效比较
下面分别在公式(1)的5个方程基础上建立BP人工神经网络模型并进行训练,同时得到输入变量的权重。由于神经网络模型结果受模型结构、模型方法和训练次数等多种因素影响,每次结果均不一样。为了提高研究的稳健性,本文同时建立5个模型,并根据经验不断调整神经网络结构,然后进行训练,得到权重结果,取其平均值作为模型的最终结果。
表5是学术论文作为产出时的结果。从平均值看,其拟合优度为0.944,相关系数为0.974,属于很高水平。从各变量的权重看,重要性最大的为研发人员,权重为57.58%;其次是学术著作,权重为38.94%;第三是研究报告,权重为3.26%;最低的是研发经费,仅为0.22%,这个结果和联立方程中方程一的弹性排序结果完全一致。
表6是学术著作作为产出时的结果。从平均值看,其拟合优度为0.875,相关系数为0.943,属于较高水平。从各变量的权重看,最大的是学术论文,权重为97.49%,占绝对主导地位;其次是研发人员,权重为2.24%;第三是研发经费,权重为0.25%;最后是研究报告,权重为0.01%,几乎可以忽略。虽然变量弹性排序和方程二有所差别,但考虑到学术论文权重占绝对地位,以及方程二回归结果中学术论文同样占绝对地位,两者总体上是一致的。
表7是研究报告作为产出时的结果。从平均值看,其拟合优度为0.626,相关系数为0.854,属于较高水平。从各变量的权重看,研发经费的权重最高,为59.91%;其次是学术论文,权重为31.12%;研发劳动力的权重排列第三,为8.34%;学术著作的权重最小,为0.64%。联立方程中,方程三的拟合优度也不高,两者相近。对比回归系数与权重排序,两者也稍有区别。
表5 学术论文作为产出时的神经网络权重
表6 学术著作作为产出时的神经网络权重
表7 研究报告作为产出时的神经网络权重
表8是研发经费作为因变量的结果,从平均值看,其拟合优度为0.877,相关系数为0.946,属于较高水平。从各变量的权重看,研发人员的权重最大,为54.64%;其次是研究报告,为32.76%;第三是学术论文,权重为6.65%;最后是学术著作,权重为5.55%。对比联立方程中方程四的回归结果,研发人员和研究报告的排序一致,后两个有所差异。
表9是研发人员作为因变量的结果,从平均值看,其拟合优度为0.905,相关系数为0.958,属于较高水平。从各变量的权重看,学术论文的权重最大,为73.07%;其次是研发经费,为24.97%;第三是学术著作,权重为1.72%;最后是研究报告,权重为0.42%。对比联立方程中方程五的回归结果,学术论文和研发经费的排序一致,后两个变量因为没有通过统计检验,比较没有意义。
表8 因变量为研发经费时的神经网络权重
表9 因变量为研发人员时的神经网络权重
对于以上BP神经网络分析的结果,可视化后如图5所示。为了简化分析,将权重小于5%的关系删除,线条粗细同样表示权重大小。
图5 神经网络分析结果可视化图
以研发经费绩效分析为例,研发经费对学术论文的权重很低,仅为0.22%,研发经费对学术著作的权重为0.25%,同样很低,研发经费对研究报告的权重很高,为59.91%。但是由于研究报告对学术论文与学术著作的权重分别为3.26%和0.01%,均较低,这样研发经费对学术论文的间接权重为0.007%(0.22%*3.26%),研发经费对学术著作的间接弹性为0.000%(0.25%*0.01%),因此研发经费的绩效总体不佳。
再以研发人员绩效分析为例,研发人员对学术论文的权重为57.58%,对学术著作的权重仅为2.24%,对研究报告的权重为8.34%,总体上研发人员对学术著作和研究报告的权重并不高。考虑到学术论文对学术著作的权重为97.49%,以及学术论文对研究报告的权重为31.12%,这样实际研发人员对学术著作的间接权重为56.13%(57.58%*97.49%),研发人员对研究报告的间接权重为17.92%(57.78%*31.12%),同样可以说明研发人员是通过学术论文的传导机制发挥其对学术著作和研究报告的影响,其综合绩效较高。上述分析结果如表10所示,总体研发人员的绩效较高,与联立方程分析结果一致。
表10 研发投入的综合绩效比较
对于投入与产出方程与模型涉及的未尽问题,本文在此作进一步解释和分析。
1.总体拟合优度
对于投入产出方程,如果关键投入变量绩效不佳,导致回归系数不能通过统计检验,或者通过了统计检验,但是回归系数为负数的情况时,可以同时借助回归分析和人工神经网络来分析各投入要素的重要性或者权重。对于模型的总体拟合优度应采用连乘计算,这是因为回归拟合优度是整个模型的基础,它是在经济理论基础上得到的结论。在此基础上,BP人工神经网络模型做了进一步的投入产出模拟,这种模拟是有误差的,拟合优度反映了这种模拟的精度,所以最终整个系统的总体拟合优度一定要用回归和人工神经网络两者的拟合优度相乘,结果如表11所示。
表11 模型的总体拟合优度
从模型的整体拟合优度看,研究报告的总体拟合优度为0.443,总体偏低,可能是由于研究报告的特殊性决定的。
2.同时采用回归分析与BP人工神经网络分析的前提条件
本文研究发现,同时采用回归分析与BP人工神经网络分析,两者虽然大致一致,但是还是存在差异。那么如何进行取舍或者综合分析呢?需要注意的是,采用BP人工神经网络分析的条件其实比较苛刻,就是只能在纯粹的投入产出分析中才能使用,对于影响因素分析,是不能采用BP人工神经网络进行分析的。本文之所以对研发经费和研发人员也做了神经网络分析,是为了便于说明问题。
BP神经网络的基石是系统论,系统有一定的输入和输出,内部是黑箱。而应用到经济系统和科技系统分析时,这种前提条件同样存在,因此凡是影响因素的研究,一般不宜采用,因为投入产出分析中,非常明确知道各投入要素均有贡献,只不过有些投入要素的绩效可能不高,但并不意味着其没有贡献。而影响因素分析,不能肯定哪种因素就一定发挥作用,不能贸然将其作为BP人工神经网络的输入变量。
3.回归分析与BP人工神经网络分析不一致的处理
在投入产出分析中,回归分析会得出一个结果,BP人工神经网络会得出另外一个结果,那么如何选用呢?总体上,应遵循以下原则:
第一,当回归分析结果得到的主要投入要素弹性系数均为正数,并且均通过统计检验时,以回归分析结果进行进一步的分析,不需要建立BP人工神经网络模型。
第二,当回归分析结果中,有些关键投入要素的弹性系数为负数并且通过统计检验,或者弹性系数没有通过统计检验时,建议继续采用BP人工神经网络进行分析,并以BP人工神经网络得到的权重作为后续政策分析的基础,回归分析结果供参考。
本文实证发现,在很大程度上,回归分析与BP人工神经网络分析的结果是大致一致的,两者同时采用,可以提高研究的稳健性。
本文通过理论研究发现,在人文社会科学投入产出分析中,如果回归分析发现公认的投入要素没有通过统计检验或者通过统计检验但其弹性系数为负数,在这种情况下回归分析无法得到该要素作用的估计,即存在投入要素盲点问题。研究结论如下:
第一,BP人工神经网络是解决投入要素盲点有效方法。在这种情况下,应继续采用BP人工神经网络分析来估计各投入要素的权重,从而进一步分析这些要素的作用和贡献。这种分析范式推进了传统的投入产出分析理论与方法,是一种有意义的创新,并且可以广泛应用在经济社会分析中。从本文的实证结果看,采用BP人工神经网络进行投入产出分析可以作为传统回归分析的重要补充,两者研究原理和方法不同,但结果可以互相验证和支撑,从而提高的研究的稳健性。
第二,研发经费总体绩效偏低。从联立方程回归分析结果看,研发经费对学术论文的弹性系数没有通过统计检验,对学术著作的弹性系数总体较低,只对研究报告的弹性系数较高。因为研究报告侧重应用研究,并且只占人文社会科学产出的很小部分,所以研发经费的绩效总体偏低。从BP人工神经网络的分析结果看,研发经费对学术论文权重仅为0.22%,对学术著作的权重仅为0.25%,只对研究报告的权重高达59.91%。这个结果和回归分析结果基本一致,因此研究结论是稳健的。造成研发经费绩效不高的原因是多样的,第一是人文社会科学研究有其特殊性,这是由学科特点所决定的,广大科研人员更多是凭兴趣和爱好从事研究,物质条件虽然重要但有时也能无米下炊;第二是一般人文社会科学研究不需要太多的实验条件,研发经费分配有时更倾向于适当普及,多方兼顾;第三是人文社会科学研发经费的分配机制存在问题,导致其绩效不高。
第三,研发人员的绩效良好。从联立方程的回归结果看,研发人员对学术论文贡献的弹性最大,弹性为0.597;对学术著作的弹性虽然为负数,但通过学术论文对学术著作的极高弹性弥补了这种损失,实际对学术著作的间接弹性为0.439;研发人员对研究报告的弹性虽然为-0.436,但通过学术论文为研究报告的较高弹性0.882同样弥补了这种损失,实际研发人员对学术报告的间接弹性为0.527。从BP人工神经网络的结果看,研发人员对学术论文权重最高,为57.58%;对学术著作的权重不高,仅为2.24%;对研究报告的权重也不高,为8.34%。考虑到学术论文对学术著作的权重为97.49%,以及学术论文对研究报告的权重为31.12%,这样实际研发人员对学术著作的间接权重为56.13%,研发人员对研究报告的间接权重为17.92%,同样可以说明研发人员是通过学术论文的传导机制发挥其对学术著作和研究报告的影响,其综合绩效较高。人文社会科学研究更加强调研发人员创造性的劳动,个性化较强,特色鲜明,侧重思想性,因此更加依托研发人员。
第四,学术论文与学术专著互动较好,学术论文对研究报告影响较大。从联立方程的回归结果看,学术论文对学术著作的弹性高达1.132,对研究报告的弹性也是最高,为0.882;学术著作对学术论文的弹性为0.386,与研究报告无关;研究报告对学术论文的弹性较低,为0.046,与学术著作无关。从BP人工神经网络的结果看,学术论文对学术著作的权重高达97.49%,对研究报告的权重为31.12%;学术著作对学术论文的权重为38.94%,对研究报告的权重极低,仅为0.64%;研究报告对学术论文的权重较低,仅为3.26%,对学术著作的权重极低,仅为0.01%。这个结果和联立方程的结果基本一致。学术论文是学术著作的重要基础,很难想象没有一定的学术论文积累就可以完成高水平的学术著作。如果长期从事系统化的研究,也有利于发表学术论文。但是研究报告比较特殊,高水平的研究报告是以学术论文的理论水平作为基础的,但由于学术著作更侧重基础研究,因此其对研究报告影响较低。
第五,学术著作和研究报告对研发经费反馈作用较好,学术论文对研发人员反馈作用较好。从联立方程回归结果看,学术著作和研究报告对研发经费具有良好的正反馈,学术论文对研发人员具有良好的正反馈。从BP人工神经网络分析的结果看,研究报告对研发经费反馈作用显著,学术论文与学术著作反馈作用一般,此外学术论文对研发人员的反馈作用显著。两者的研究结论基本一致。
第六,研发经费与研发人员互动效应良好。联立方程中,研发人员对研发经费的弹性为0.711,而研发经费对研发人员的弹性为0.153。BP人工神经网络分析中,研发人员对研发经费的权重为54.64%,而研发经费对研发人员的权重为24.79%。以上充分说明两者互动效应良好,当然研发人员的作用更大。
综上,本文提出如下政策建议:
第一,必须更加精准地配置人文社会科学研发经费以提高其绩效。人文社会科学研究存在较大的异质性,一些侧重实验的学科与自然科学比较接近,相对而言需要更多的研究经费;一些侧重思辨性的学科,可能需要相对较少的研究经费;一些需要进行大量调查的学科,也需要较多的研究经费。目前我国高校人文社会科学投入,一般根据项目级别体现经费差异,很少根据学科或研究领域不同体现经费差异,这就必须进行适当调整。此外在人文社会科学研发经费的覆盖面上,建议适当扩大范围,研究项目本身也是一种激励措施,会鼓励广大科研人员静心从事科研,在资源有限的情况下,可考虑适当增加项目数,减少项目资助强度的方式实现。此外,要注重研发经费在不同高校之间的分配,对于项目绩效偏低的高校应适当减少研究经费。
第二,加强对优秀学术著作的支持力度。研发人员对学术著作弹性显著为负数的原因包括两个方面:首先,学术著作总体上属于高水平、系统性的研究成果,是少数高水平学者的努力;其次,部分学术著作质量有待提高,近年来,国家加大了对学术著作质量的监管力度,这个问题有所好转。建议在严格控制学术著作质量的基础上,加大对人文社会科学著作的经费支持力度,同时加大国家社科基金后期资助、教育部人文社会科学后期资助等项目的支持力度,提高优秀著作的奖励力度和奖励数量,以体现对高质量人文社会科学著作的有力支持。