吕波,杨志军,裴大茗
基于支持向量机的重大科技项目立项依据评估研究
吕波,杨志军,裴大茗
支持向量机作为一种机器学习算法,具有出色的学习性能,尤其在小样本识别方面具有独特的优势。重大科技项目的立项依据评估是科研管理中非常重要的一个环节,如何准确、客观和有效的刷选出科技项目是一个值得研究的问题。基于重大科技项目具有备选项目少、立项精的特点,建立了重大科技项目立项依据评估的指标体系,提出了基于支持向量机的立项依据评估模型,案例表明该模型能够很好地筛选出优秀的重大科技项目。
重大科研项目;支持向量机;立项依据评估
重大科技项目作为国家科学研究计划的重要组成部分,体现着国家科技发展的长远意图,因此,重大科技项目的立项评估任务重大。客观和公正的立项评估可以保证选拔出最符合条件的优秀项目给予资助,从而提高科研经费的使用效率。相关方面的研究历来是项目管理部门和科研人员不断探索的课题[1]。目前的科研项目立项评估主要依赖同行专家评议和综合处理,前者是以定性判断为主,后者主要是定量分析。由于重大科技项目具有超前性、探索性、隐含性和不可预知性,评估专家对评估标准和研究内容不一定完全一致,从而造成评估工作的失效率增加。为了提高立项评估的科学性和客观性,探索和创新立项评估的方法体系是一项颇具意义的课题。著名的评价大师科隆巴赫在对比评价和科学的差别时,就认为前者更具有艺术成分,每一项评价只有经过反复调试,才能适合项目决策者的需求。为了探索项目评估的本质,刘炳胜和王雪青(2007)基于东方系统论思想,提出了项目评估决策的概念模型和项目评估的全过程模型[2]。从国内外相关的研究结论来看,科技项目的立项评估主要还是以人的需求为尺度,主观因素无法排除,而且注定是评估的核心。
由于主观因素无法排除,重大科技项目的立项评估就需要在评估流程或者评估方法上创新。从目前重大科技项目的立项评估实践来看,立项评估这一环节是作为一个整体来进行实施的。虽然立项依据是项目能否通过的重要衡量因素,但并没有放在突出的地位,其结果是导致了一些不具有前瞻性和创新性的项目立项,这些项目在正式启动后不能达到预期的效果。因此,考虑到重大科技项目的特殊性、长远性和影响力,从评估流程上来看,有必要把立项依据的评估单独作为一个环节进行分析。立项依据评估作为立项评估的初评程序,是为了保证立项工作的科学性和客观性。对那些不能通过立项依据评估的科研项目则直接剔除,无需进行后续的评估。基于此,本文综合考虑科技项目的立项评估实践和重大科技项目的实际情况,构建了重大科技项目立项依据评估的指标体系,并分析了支持向量机在立项依据评估中的应用,最后给出一个具体的案例。
重大科技项目的立项依据评估仍然需要采用定性和定量综合的方法。在评估的过程中,首先需要同行专家依据事先设定的评估指标进行综合评定。从以往的研究来看,针对科研项目立项评估指标的研究比较多,立项依据的评估指标没有单独的研究,仅仅是包含在立项评估指标之中。一般来说,任何项目的执行都存在从立项到执行再到项目结束三个时间段,有的科技项目甚至包括跟踪评价的阶段。科技项目的不同执行阶段应该采取不同的评价目的和评价标准[3]。
为了做好科技项目的评估工作,还需要对项目进行正确的分类、明确评估的目的以及评估主体的准确定位。重大科技项目的立项依据评估属于项目执行的第一个阶段,其目的是为了筛选对国民经济有重大推动作用的科技项目,其评估标准的关键是评估指标是否能够反映评估项目的意义。在参考前人针对项目立项评估指标研究的基础上,本文设置了表1所列的重大科研项目立项依据评估指标体系[4][5]。
表1 科研项目立项依据评估指标体系
为了保证重大科技项目立项依据评估的客观性和公正性,就需要选择合适的评估方法。有关定量评估的方法较多,例如层次分析方法、数据包络分析等。但是,由于重大科技项目的立项依据评估局限在特定的领域,而且依靠的样本比较少,这就使得拟合最佳的建模方法反而效果不好[6]。20世纪90年代中期发展起来的支持向量机方法能够在样本量较少的情况下获得良好的统计规律。因此,本文选择支持向量机做为科研项目立项依据评估的方法[7]。
重大科研项目的评估实际上是一个分类的过程,就是把好的科研项目从评估样本中筛选出来。为了实现分类的目的,假设把全部参与评估的科研项目看做n维实空间中的点,评估的目的就是希望把这些点通过一个n-1维的超平面分开,而且最好是使得属于两个不同类的数据点间隔最大。重大科研项目的立项依据评估依赖不同的具体指标,其分类问题具有高度的非线性,支持向量机通过事先选择的非线性映射(核函数)将输入向量映射到一个高维特征空间,在这个空间中构造出最优分类超平面,如图1所示。
图1 输入空间与高维空间映射图
在上图中,输入空间代表的是要评估的重大科研项目,而高维特征空间则是转换后的科研项目状态空间,从而就可以实现对训练数据的超平面分割,避免在原输入空间中进行非线性的曲面分割计算[8]。为了在高维空间进行超平面分割,需要进行内积运算。根据泛函数的有关理论,通过引入核函数将问题从原始空间嵌入到特征空间,从而转换为特征空间中的线性可分问题。
为了分析问题的方便,本案例假设重大科研项目的立项依据评估分为两个类别:一是通过级,二是取消级。笔者选择了21个样本数据作为训练样本集。样本数据是根据指标体系中4个评价因子对每个项目的立项依据进行评分,每个评价因子的得分范围是[0,10],分为三个等级:较差[0,5],良好[6,7],优秀[8,10],并将最终评价结果转化为:-1(较差,0-5)、0(良好,6-7)以及 1(优秀,8-10),这样就得到相应的21组样本数据。如表1所示,通过立项依据评估的科研项目(“1”类样本)和没有通过立项依据评估的科研项目(“2”类样本),作为评估用的训练样本集[9]。
表2 科研项目的评审结果表
上述指标体系可以用数学形式描述为:X为输入指标集,X=(x1,x2,…,x4),Y为输出指标,是X所对应的分类结果。用表2所列参数张成四维空间,将“1”和“2”两类点记入其中。首先经过模式识别计算,发现在四维空间中这两类点可以用两个超平面分开。为了提高支持向量机方法的评估能力,我们把没有通过评估的样本分为两组,分别与通过评估的样本对比。根据支持向量机程序优选结果取调节参数C=10,C是设定的惩罚因子值,取核函数为五阶多项式。两组数据计算所得支持向量及b值如表3和表4所示,b值是回归方程中的常数项[10]。
表3 第一组样本集计算结果(b=1.2197)
表4 第二组样本集计算结果(b=0.8021)
根据表3和表4所列的数据构造支持向量机评估模式,经过两次评估判断为通过的就可以进入下一轮的立项评估,所构造的评估网络如图2所示。应用以上方法对训练样本的立项依据评估进行检验,支持向量机算法对取消样本全部判断正确,显示了优良的分类效果。
图2 立项依据评估判断图
重大科技项目具有超前性、探索性、隐含性和不可预知性的特点,而同行专家对重大科技项目的评估标准和研究内容不可能达到完全一致,这就造成重大科技项目的立项评估工作存在误差,其结果可能会导致不符合条件的项目立项。因此,需要创新重大科技项目的立项评估程序和方法,以提高立项评估工作的客观性和公正性。本文根据立项评估中轻视立项依据评估的现实,基于文献总结和评估实践,构建了重大科技项目立项依据评估的指标体系,分析了支持向量机在立项依据评估中的应用。具体的案例分析表明,在重大科技项目的立项依据评估中,支持向量机方法能够很好地区分“通过”和“取消”的科研项目。最后需要指出的是,本文为了分析问题的方便,把科技项目的立项评估分为“通过”和“取消”两个级别,在实际的立项评估工作中,评估的级别可能会有三类:“通过”、“讨论”和“取消”,这可以通过设计三个两类分类器就可以完成评估工作。
[1]肖人毅,王长锐.科研基金项目立项评估方法的研究与改进[J].系统工程理论与实践,2004(5).
[2]刘炳胜,王学青,李金海.东方系统方法论指导项目评价实践:科学性和艺术性的结合[J].管理学报,2007(4).
[3]杨列勋.研究与开发项目评估与应用[M].北京:科学出版社,2002.
[4]刘希宋,李玥,喻登科.基于多视角的国防工业科技成果价值评估研究[J].科学学与科学技术管理,2007(10).
[5]傅毓维,邵争艳,谷德斌.基于人工神经网络的国防科技工业项目评价方法研究[J].技术经济,2003(5).
C913
A
1673-1999(2011)02-0086-03
吕波(1974-),男,山东泰安人,中国船舶工业综合技术经济研究院(北京100081)高级工程师,研究方向为项目管理、科技政策;杨志军(1967-),男,吉林长春人,中国船舶工业综合技术经济研究院研究员;裵大茗(1976-),男,安徽巢湖人,工程师。
2010-10-27