基于深度学习的成果筛选与评价

2019-09-10 07:22刘雪飞唐帅唐亮孙辰军
计算机与网络 2019年15期
关键词:科技成果深度学习

刘雪飞 唐帅 唐亮 孙辰军

摘要:科技成果筛选与评价对于判断成果的价值非常重要,是科技成果产品产业化领域的一项重要研究课题,也是降低科技成果产业化风险的关键,具有重要的研究价值和实际意义。但由于传统的成果筛选与评价方式存在缺陷,一方面导致了一些产业化能力较弱的成果进入产业化阶段,提高了成果转化的成本、代价与风险;另一方面也导致了一些优质的项目评价指标与结果不佳而失去了有效的机会。为了更好地促进科技成果转化,提高转化率,将从目前科技成果筛选与评价过程中存在的问题入手,在贝叶斯理论基础算法下,渗透深度学习思想,提出了一套科技成果筛选与评价的方法,并建立了相应的评估指标体系,为科技成果转化提供了有效的参考与借鉴。

关键词:科技成果;成果筛选;成果评价;深度学习

中图分类号:TP391文献标志码:A文章编号:1008-1739(2019)15-65-4

0引言

随着科学技术的迅猛发展,科技成果产业化的需求也越来越高,科技成果转化服务在国家或地区的创新体系中发挥着越来越重要的作用。但是我国的科技成果转化率不高,能在生产中稳定使用且具有一定规模的不足20%,最后形成产业的只有5%左右,原因之一就是尚未形成有效的技术市场评估方法与风险控制体制[1]。尽管目前国内己经建立了许多科技成果立项与转化评估的组织机构,但是由于知识存量以及知识产权在科技成果中所具有的关键性影响[2],使得评价过程与结果呈现出复杂特性。

传统的成果评估基本上是以个别专家的个人鉴定因素为依据,而在整个项目评估操作过程中,难免会存在一些人为因素并影响到科技项目评估的独立性、客观性、公正性和科学性。因此,提高科技成果的转化效率以及降低成果转化的风险,加强对科技成果产业化程度评价的可行性、合理性和公平公正性,已成为科技成果转化与投资过程中一个迫切需要解决的问题[3]。

针对上述情况,在建立一套科学、完整的科技成果产业化评估指标体系的基础上[4],根据科技成果产业化评估的实际情况,采取定性与定量相结合的方法,建立和开发一套完善的科技成果产业化评估系统,运用快速计算来协调不同地域的专家资源,利用专家评估经验与新的评估方法以及快速准确的高效运算能力,来减少因评估专家的标准差异而导致评估结果的不同,从而保证了评估工作的公正性与效率,为科技成果产业化评估提供快速、准确的科学方法与依据。

1科技成果应用型转化指标及权重分析

国家大力推动科研工作力度,重视产学研一体化发展模式,科研的深度和广度要充分体现在产品成果转化方面,应有一定的成果输出,研究的理论和算法除了经过实验室测试外还应能够经受得住现场的验证和考验。科研成果将由过去的理论型向应用型成果转变,理论型科研成果的评价指标主要检查理论创新点,是否有新的想法和解决问题的方法,通过查重或者专家评审方式可确定评价指标系数[5]。应用型科技成果評估过程相对要复杂很多,应用型科技成果除了理论性创新要求外,还应形成设备输出,综合评价设备性能,具体的转化指标内容及权重比例如图1所示。

技术可行性:是科研工作的前提,完全不可行的技术盲目研究对科研经费是一种极大的浪费,因此一般在立项之前,都需要对重点的技术难点实现进行可行性方案论证,在充分说明后则可开展研究。但是在后续的深入研究中也会存在陷入歧途的风险,因此在最后验收阶段同样对技术要做可行性验证,对这个指标评价是一个最基础的参数,占比一般为20%。

对可行性的评估主要分为技术方案和产品应用2个方面。技术方案主要针对技术理论、设计方案、开发方法、软硬件平台、网络结构、系统布局和结构、输入输出技术以及系统相关技术是否符合应用设计需求;产品应用主要是针对产品成熟度、产品风险和产品应用场景等现实性指标进行综合评估,二者同时满足的情况下,才能给出指标的综合评分。

技术创新性:是近年国家科技部比较看重的指标,技术在持续推行多年后,已经逐步走向发展瓶颈阶段,必须采用科技创新的方式突破难点,为科研创造更广阔的领域。创新指标由过去的属于加分项逐步转为必须项,分值一般为5%,虽然不多,但是将会是整个项目的亮点,项目方案及产品特性应具备一定的差异化特性,在未来市场上有竞争性。在技术报告或者产品说明中一般都会有创新性描述部分,评审专家会以经验值判断创新程度,创新性具有前瞻发展性,且创新点数多,得分一般比较高。

投资比例:项目投资包括研发、开发、建设和验收等周期投资,每个阶段的投资金额应配合比例要求,一般开发和建设比例最大,如果研发比例过大则表示此技术的成熟度不够,投入了大量的人力、物力开发,不具备任何借鉴性的开发是不建议进行的。投资比例的合理性直接影响着投资总金额,占比一般为10%。

经济效益:国家提倡整体集约化发展,主要针对财务方面,项目开发和建设一定要综合考虑资金的全寿命周期的配比及衔接,以及产品上市后的效益成效,此指标值很低,说明科技成果转化的应用意义越低,因此它的占比较高,为45%。在科研编制阶段会重点对项目经济效益进行分析,包括试点应用及大规模商用经济分析。经济效益和投资成本应该按照一定比例计算,符合条件的项目才允许开展,效益太低不利于整体科研发展。

产业化水平:说明产品的大规模应用及产业渗透的能力,评价产品适应市场的能力高低,越高说明产品能更好地符合目前市场需求,并且能够同已有产品完美兼容,可进一步推动产业化发展,形成良性的产业链发展,此指标占比一般为10%。

市场推广性:主要是说明未来发展的前景,具备可持续发展的能力。如果某个产品使用周期很短,说明产品的综合效能有限,指标太低,会给市场的连贯性和融合性造成一定困扰,此指标一般占比为10%。

评价一个科技成果的综合性能主要从这6个指标进行说明,总分为1,分为3个等级:0≤撤销<45,45≤可接受<70,70≤大力推荐<100。

2科技成果定量筛选及产业培育规划方法研究

为了有效规划未来产业发展,应对已有的科技成果进行综合评价,提取重点研究方向并联合分析,结合市场产业链发展现状,给出较准确的发展蓝图。前瞻性技术制定越贴近未来发展需求,越能形成可持续发展的产业生态链。

对于一个企业而言,每年会产生大量的科技成果,梳理和清洗成果集合,从庞大的数量和复杂的内容中提取出有条理的信息,需要经过系列数据处理,通过智能学习算法中准确地判断重要指标信息,不同类型成果之间形成合理组合策略,有效整合技術资源,充分运用企业已有的科技成果做铺垫,不断提升企业重点技术及产品的市场竞争能力[6]。科技成果定量筛选及产业培育规划方法如图2所示。

一级分类:首先利用关键字搜索将科技成果大致分类,关键字一般为专利、论文、技术报告、软著、专著、产品和软件等,将科技成果库的所有成果按照类型分为不同类别,并统计各子集合数量;其次对子集合进行降维,成果库中文档和产品存在很多滥竽充数的问题,针对每个子集制定一定的初步筛选规则,如技术报告可规定页面数、创新点数和关键词等作为评判规则,能够将品质极度差的成果直接作为备份,不再进入下一级评价过程,如果某些得分会预估很低,可能会降低整体得分,导致误判结果。

二级分类:主要是根据研发方向进行主题分类,按照树形结构进行逐一搜索分类,形成正三角的筛选模型,以论文筛选为例,将论文做了4级分类,并统计了每一个子集的数量,下一步对每一个子集进行算法训练,这样会提升训练的时效,一类相似数据更具有聚合性,在训练的过程中很容易收敛,并且判断结果相对准确。

指标评价算法:目前指标评价的算法很多,包括聚类算法、因子分析法、贝叶斯分析法、权重分析法和主成分分析法等,这些方法的目的都是为了把不同指标的评价得分取得更加精确,但这些算法都存在一个难题就是缺乏对较相近的点特性区分。

规划优化:在指标计算结果出来后,充分分析评分细节,应对企业科技规划重新编排,根据现实研究进展,深度挖掘指标得分等级,进行相应的优化调整。国家政策和市场需求都会不停地变化,计算的指标评价结果也会有所变化,有时方向会呈较大的扭向,因此必须及时调整规划方向,否则对企业来说造成效率低下的办公模式。

产业培育:规划的作用是为了企业形成核心的产品体系,并配有辅助的产品增加营业收入。那么规划优化后进一步就是做产业培育。企业的产品研制一定具有持续性和兼容性,主流方向应有自己的明星产品,作为企业招牌,并且可持续性衍生和扩大产品类型,最终形成产品生态圈;而针对特殊时期或特色需求时可视实考虑研制少量产品填补市场的空缺,这样就形成了主打+配合的产品体系,企业将产业培育方向作为基准培养科学技术人才,并部署配套科研基础设施,逐步提升企业的市场占有率。

3贝叶斯算法模型

贝叶斯分类方法是以统计学的相关知识为基础进行分类的算法,能够为未知类别的数据属性进行分类,即指出数据属性属于哪个类别的概率。其本质就是利用先验概率进行分类的一种方法,因此,可以说各个类别中所有的样本全体为待分类样本进行分类提供了基础[7]。贝叶斯分类方法的特点如下:

①贝叶斯分类方法是通过计算得出数据对象属于不同类的概率。对于确定属性属于哪个类,分为单类标数据和多类标数据2种情况。单类标数据是选取其中概率值最大的作为类的对象,而多类标数据则有些不同,它不一定选最大值,只选取较大的类作为对象的类。

②通常情况下,所有属性对于贝叶斯分类来说都是有其潜在作用的,即要想得到更好的分类就要包括所有的属性,当然可能存在一些对分类有很大影响的属性。

③利用贝叶斯分类方法的数据格式没有具体要求,这保证了贝叶斯分类的实用性和通用性。

3.1朴素贝叶斯分类方法

贝叶斯分类方法中比较经典的分类方法有朴素贝叶斯分类方法和树扩展模型TAN分类方法等,朴素贝叶斯分类模型方法的步骤如下:

①朴素贝叶斯一般只能处理离散的数据,因此,第1步是分别对训练样本数据集和测试样本数据集进行缺失值处理和离散化处理。

②对训练样本数据集进行扫描,分别统计训练集中类别和类别的样本中属性取值为的实例样本个数,分别用,表示,并根据结果构成统计表。

③分别计算先验概率( )= /和条件概率(= | )的结果。

④根据上面的知识构建分类模型。

⑤最后扫描待分类的样本数据集,调用前面已经完成得到的统计表或概率表以及构建好的分类模型,并得出结果。

上面表达了朴素贝叶斯实现的一个过程,从中可以看出贝叶斯分类方法的优点,简单且易实现,通过试验证明算法健壮性和鲁棒性都较好。

4科技成果筛选与评价逆向耦合模型建立

单一的贝叶斯网络属于基础算法模型,根据概率来预测样本类别,但是会因为样本的特殊性,导致判断误差。科技成果评价经过一次计算过程得出的结果并不精确,必须设置反复训练,通过隐含层的设置,将先验信息经过反复推理得到后验信息,后验信息在逆向耦合到算法输入侧,作为评价参考,自调整网络参数关系,不断优化网络结构,提升输出结果的有效性。

本文采用贝叶斯+深度学习算法,贝叶斯算法主要单纯从概率估计角度判断数据归属类别,但是一次性判断往往缺乏可信度,而深度学习的思维恰好是利用多次自学习方式,加深算法的验证能力,因此结合二者的优势,提出深度学习思想辅助贝叶斯算法的模式,对原始性能指标数据反复训练,确保评价结果的精准性。科技成果筛选和评价逆向耦合模型如图3所示。

一般的数据分类法都是正向计算法,很少算法会进行自反评估,但实际评估时,测算的评估结果往往对计算过程会有一定的影响,所谓的评价逆向耦合就是所谓的反评估过程。贝叶斯算法的后验结果对先验数据的递归过程则体现了逆向性,在通过选择合适的深度计算权值矩阵,进行神经网络训练学习,获取可信评估结果。设置训练集权值为1,2,...,,输入采样集合为,根据以往专家系统经验初设先验参考值,计算二者的概率分布值,并通过1权值进行训练,得到后验概率1,计算过程中会掺杂白色噪声,混合作为一级输出,输出结果逆向耦合到先验值和下一级权值,并自动优化调整,进行二次权值训练,直到训练耦合性符合阈值要求,则说明已经收敛,结果可作为最后输出。

此模型的优点是计算的中间参考数据都具备智能调节能力,可朝着最优化方向调整,过程无需人工干预,并依靠数据结构间的关联性,判断指标的发展趋势,多层级的训练计算,避免了判断的偶然性,综合提升了计算的可靠稳定性。

5结束语

科技成果的发展关系存在必然性和偶然性,通过贝叶斯算法确定指标间的必然性,通过多次计算规避指标的偶然性,成果指标的判断精准性对公司的技术发展成败起到决定性的作用,因此算法性能的选择是至关重要的。本文提出的贝叶斯+深度学习算法首先在计算模式上是一种创新的逆向耦合思维,在分析过程中利用概率论和多层级计算等提供一种更稳固的保障,将智能计算深入渗透到科技成果评价系统中,为固步的科技成果分析评价发展历程注入了创新血液。

参考文献

[1]刘家树,菅利荣.科技成果转化效率测度与影响因素分析[J].科技进步与对策,2010,27(20):113-116.

[2]黄伟.我国科技成果转化绩效评价、影响因素分析及对策研究[D].长春:吉林大学,2013.

[3]曹晟,田大山.美国科技评估立法实践及其对中国的借鉴意义[J].自然辩证法通讯,2004(6):57-61.

[4]宋小燕,汪克强.科技成果评价体系中的知识产权保护问题[J].科技与法律,2003(1):24-25.

[5] Al-Najjar N, Weinstein J. A Bayesian Model of Knightian Uncertainty [R].Reihekonomie/Economics Series, Institutfür Hhere Studien (IHS), No.300, 2013.

[6]畢克,吴甜,谢迎新.重大科技成果智能评价体系模型研究[J].企业技术开发,2012,31(23):57-59.

[7]张明卫,王波,张斌,等.基于相关系数的加权朴素贝叶斯分类算法[J].东北大学学报(自然科学版),2008(7):952-955.

猜你喜欢
科技成果深度学习
着力促进科技成果转移转化
加快农业科技成果转化促进农业发展方式转变
线上平台解决“转化难”
福建省:出台新规促进科技成果转化
国家食药监总局:促进监管科技成果转化
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
国务院印发《实施〈中华人民共和国促进科技成果转化法〉若干规定》