文/李松 宋时佳
科技创新是科技进步的基础和动力,近几年来,科技部提出科技服务业是向社会提供智力服务和支撑的产业,并在“十二五”中指出现代科技服务是基于数据、运用先进科学及技术、分析方法的产业。在科技服务业存在的重要共性服务的提取及有效利用是当前研究的关键。然而,“碎片化”的服务资源具有多样性和复杂性的特点,当前大数据时代为解决这类问题提供了可能。为实现创新、创业项目的顺利、高效及合理评审,针对传统的创新、创业项目中专家评审匹配度低、针对性差等问题,本文提出了基于区域协同过滤的专家评审智能推荐算法。通过实践证明,基于区域协同过滤的专家评审智能推荐方法大大提高了专家评审的匹配度,加速了专家评审的效率和速度。
技术创新和产业变革成为科技服务业持续稳定发展的核心动力。基于大数据的科技服务业通过虚拟化资源和数据处理,提供基于模型的资源可持续利用,同时创新、创业项目的专家评审是一个关键环节,提高项目的匹配度能促进科技技术的快速转移,提高科技资源的利用效率和传播,加速科技成果的转化,具有很大的现实和经济意义。目前,我国产业结构调整已经进入改革关键期,“创新驱动”上升为国家战略。科技服务业作为实现转型升级的重要支撑,已成为中国经济增长的新动力。通过对服务资源的虚拟化并有效利用,可以提高资源传播速度,并通过数据挖掘提炼出数据背后的秘密,提高科技成果到生产力的转变效率。
表1:专家评分矩阵
表2:匹配相关性和满意度对比
图1:基于大数据分析的服务资源推荐
目前科技服务的创新资源主要被一些龙头企业、高校及科研机构占有,服务资源相对“碎片化”,无法形成一个体系而成为信息孤岛。资源的整合和有效利用并实现共享成为企业发展的前提。因此,通过当下的科学技术及大数据分析实现资源的共享成为研究的热点:王宏起等人以黑龙江省科技创新创业共享服务平台为实证研究对象,给出平台未来发展对策建议;汪艳霞等人提出了“孵化-加速”三位一体耦合对接的科技服务资源集成路径;梁晓星等人对制造任务的分解和制造资源的匹配方法进行研究。
如图1所示,根据科技服务基于模式的不同,可以将服务资源的智能推荐方法分为基于内容、协同过滤、关联规则、基于知识和基于需求五类方法。
图2:专家评审流程
CF方法主要分为基于领域和基于模型的推荐两种。基于模型的方法主要包括基于矩阵分解和潜在语义、基于贝叶斯和基于SVM三种方法。基于矩阵分解的方法如下:该算法首先将稀疏矩阵用均值填满,然后利用矩阵分解将其分解为两个矩阵相乘。
基于领域推荐的方法是利用的
其中,I(ij)是代表用户i和用户j共同评价过的物品,S(i,x)代表用户i对物品x的评分。S’ 代表用户i所有评分的平均分。本文根据创新、创业项目中的流程和专家评审特点,提出利用领域协同过滤的方法实现资源推荐。
协同过滤算法通过对专家历史行为数据进行分析,挖掘出每个专家的研究领域,然后对专家群组进行划分并推荐相关领域的项目进行评审。专家评审推荐的流程如图2。
基于用户领域的协同过滤算法步骤为:
(1)数据属性表示:每个专家对项目领域的评价如表的矩阵形式,评价值越高说明匹配度越高。如表1所示。
(2)相似领域查找:基于公式3.1中的数据,用公式(2)计算出相似性。设定阈值t,依据各个用户之间相似度大小排序。与目标用户类似的前t个用户的类似邻居集,这是该推荐方法的核心。
(3)智能推荐:
通过利用本文提出的基于领域的协同过滤推荐方法,对比来自八个领域的160名专家评审项目的所用时间及匹配满意度,可以得出,通过使用基于本文的评审项目推荐方法,专家评审项目匹配度及评审效率明显提高。调查如表2所示。
本文通过基于协同过滤的专家评审推荐方法,提高了评审项目的匹配度和推荐结果满意度,加速了科技服务资源利用及生产力的转化速度。未来将进一步研究基于深度学习的有效资源利用方法。