吴 斌,邓 艺,龚金梅,邬 平
(云南省科学技术情报研究院,云南昆明 650051)
2021 年5 月28 日,习近平总书记在“科技三会”上发表重要讲话,再次强调坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑。区域技术创新力作为地区生产力结构改革和动力机制转换的原始创新动力[1],不仅能有效撬动先进生产力的跨越式发展,还能持续性地培育区域经济发展的新业态与新模式。科技资源共享服务体系作为催化科技原始创新的“助燃剂”,可以有效刺激区域科技资源主动开放互联与协同共享的意愿,引导区域间错位发展,构建优势互补的区域创新发展格局[2]。大型科研仪器是开展科学研究、支撑知识和技术创新的重要物质基础,为我国科学前沿探索、战略性高新技术突破和社会发展提供了重要支撑[3]。周小平[4]、王肖波等[5]、许欢[6]、蔡萌等[7]的研究表明,大型科研仪器承担着繁重的科学测试分析与理论实证的重任,可以有效支撑新品开发研制,加快企业科技创新的步伐,因此其分析测试内容能在一定程度上反映区域当前技术发展水平和趋势。鉴于此,通过对大型科研仪器承担的大量具体分析测试内容进行内容挖掘,绘制出当前区域重要行业的技术发展趋势,并将其作为一种行动指南和战略规划制定的重要手段[8],可以动态反映区域内重点行业的技术创新空间格局的演变,为管理部门制定科技发展规划提供指引,同时及时发现科研领域内有关技术研发相互重合的现象并调整发展策略,防止“内卷”。
目前大量关于区域技术创新能力的研究主要集中在区域间分布与产业集聚和区域技术创新能力评价两个方面。
在区域间分布与产业集聚方面,肖玉贤等[9]基于文献计量法发现我国区域创新能力水平呈现东西部差异明显、邻近城市发展相似的特点,这意味着区域之间存在缓慢流动的技术创新力,但具体流动的模式仍有待进一步探索;杨骞等[10]利用二次指派程序(quadratic assignment procedure,QAP)识别技术创新效率的区域差异,发现区域间差异是呈下降趋势的,而区域内差异是区域总体差异主要来源;曹晨等[11]基于社会网络和潜在狄利克雷分配(LDA)研究了成渝地区技术创新合作现状,定量化分析与总结区域技术创新在产业方面发展趋势与不足;李国锋等[12]利用区域高新技术研发数据,结合政府驻地迁移信息进行双重差分倾向得分匹配(PSM-DID)分析发现,政府驻地迁移会左右区域技术创新进程;何龙斌等[13]综合运用空间基尼系数、行业集中度以及区位熵等方法,基于官方统计年鉴得到中国区域高技术发展的空间演化情况;刘乃全等[14]从区域合作论文与合作专利的视角出发分析长三角区域的科技协同创新时空演变,发现政府之间紧密的合作交流能破除技术创新的地域与行政限制,促进区域间创新力的均衡流动;李哲等[15]基于熵权法构建综合指标评价体系,用于分析我国省份之间技术创新时空演变;王业强等[16]根据技术创新与地区差距的关系,对技术创新区域发展路径进行研究。
在区域技术创新能力评价方面,赖一飞等[17]基于超效率SBM 模型、Malmquist 指数和托宾(Tobit)模型分析了我国技术创新面板数据,认为政策条件、科技基础设施以及经济水平是区域技术创新效率的关键影响因素;刘天寿等[18]设计了随机森林最小二乘系统辨识(RFWT)模型对我国12 个自贸区进行技术创新能力评价,以避免主观因素和信息重叠带来的影响;刘立燕等[19]结合数据包络分析(DEA)和灰色关联度对湖南区域技术创新能力进行研究,同时利用变量替换以及时间序列替换验证创新能力差异结果的稳健性;杜英等[20]基于三螺旋理论构建创新能力评价指标体系并结合熵权法对指标进行确权,通过分析子系统之间的协作耦合,系统化地揭示不同创新主体对区域技术创新能力的影响程度。除此之外,还有如冯岑明等[21]、杨艳萍[22]、李柏洲等[23]、王晓梦[24]等学者分别使用层次分析法(AHP)、径向基函数(RBF)、主成分分析、熵-粗糙集以及灰色关联分析等方法来进行区域创新能力评价研究。
从目前的相关研究内容来看,技术创新能力的区域间分布与产业集聚的研究侧重于探索其空间分布的形成机制、科技协同与合作的动态演化过程以及技术创新产业集聚的构成因素等方面,而区域技术创新能力评价的研究则重点关注影响区域技术创新评价指标优化以及影响技术创新的各类因素,然而鲜有文献对特定区域内技术创新力形成的动力机制进行探索。原因可能在于:一是部分评价指标或存在模糊性与混淆性,因此基于观测的统计模型无法可靠地识别因果关系[25];二是部分有关国内区域的实证分析多基于《中国统计年鉴》、中国科学技术发展战略研究院的《中国区域科技创新评价报告2022》以及地方统计年鉴等宏观数据进行跨区间的分析验证,区域内的空间相对独立,仅仅一组宏观指标(诸如用于衡量投入的科研人员占比、研发支出、人均科技投入等指标,用于衡量产出的技术合同、高新技术服务收入、论文、专利等指标),无法洞察区域内技术创新力的动力演化机制;此外,根据当地产业发展需要,技术创新领域的侧重点不同,区域内技术创新主导政策不尽相同,区域内所形成的创新格局也迥然相异,如郭平等[26]、刘洁[27]、陈敬明等[28]的研究所述。
针对采用宏观统计指标衡量技术创新力的时滞性较长、难于观测对区域内技术创新力的动力学变化的难题,有学者如罗扬等[29]、张铁山等[30]、郑明等[31]、戴显红等[32]、王晓辉[33]的研究发现,区域内的科技基础设施对于技术创新具有正向性的引导作用;同时,有学者研究表明,科技基础设施对技术创新能力的影响存在区域异质性[34],因此对科技基础设施的利用过程能表征当前区域的科研活动类型与技术创新程度。
大型科研仪器作为重要的科技基础设施,承担了大量高端和前沿的科学研究与科技研发任务,其所承担的分析测试内容不仅能代表区域内主流的前沿科技研发活动,也是区域内技术创新力的具体表现。综上,本研究对云南省大型科研仪器分析测试服务数据进行语义文本聚类分析,探索不同年度的热点技术,观测和总结区域内技术创新空间格局的演变和发展规律,为支撑区域技术创新发展政策与制度的制定提供相关依据。
云南省大型科研仪器开放共享服务平台(以下简称“大仪平台”)于2016 年上线投入使用,面向全省提供仪器共享、在线预约、分析检测、服务案例浏览、仪器设备查询统计等共享服务,其共享服务记录包括了共享服务单位名称、主要检测仪器名称、服务金额、实际服务时间、开机时间、依托课题名称、分析测试具体内容、服务类型、申请人姓名电话与工作单位等字段,实现了整个仪器分析测试服务过程的全流程记录。其中,分析测试具体内容记录了具体的分析测试任务与相关的研究内容,能体现开展分析测试的科研目的。
截至2022 年12 月,云南省内入网仪器管理单位有135 家1),共享大型科研仪器有3 634 台套,仪器原值共25 亿元。其中,大型科研仪器设备包括分析仪器(2 306 台/套)、计量仪器(233 台/套)、物理性能测试仪器(220 台/套)、电子测量仪器(53台/套)、海洋仪器(6 台/套)、地球探测仪器(18台/套)、大气探测仪器(15 台/套)、医学诊断仪器(152 台/套)、核仪器(2 台/套)、特种检测仪器(67 台/套)、工艺试验设备(213 台/套)、激光器(9 台/套)、计算机配套设备(47 台/套)、其他仪器(293 台/套),共计13 个大类,能为云南省内各类科研任务提供全面的分析测试共享服务,累计的共享分析测试服务记录数约85 万条(以下简称“样本”)、服务案例225 个。
基于自适应虚拟惯性的微电网动态频率稳定控制策略//刘尧,陈建福,侯小超,裴星宇,李建标,粟梅//(9):75
为甄别出与研究相关的大型科研仪器设备分析测试任务,只选择高等学校、科研院所等非以检验检测为主营业务的管理单位,剔除具有市场性质检验检测机构,得到有关服务记录数为125 639 条,服务记录数据跨度为2015—2019 年(见图1)。
图1 云南省大型科研仪器共享服务记录数年度分布
云南省的大仪平台于2015 年上线,2017 年达到使用高峰。究其原因是,2017 年科技部、国家发展改革委与财政部印发《国家重大科研基础设施和大型科研仪器开放共享管理办法》,同年云南省第一次实施了大型科研仪器入网管理单位共享服务评价考核与激励性后补助政策措施,在政策与奖补的双重红利影响下大型科研仪器设备管理单位工作积极性较高,2017 年科研分析测试的共享服务记录数量达6 万余条。2018 年,由于财政预算资金紧张,云南省没有开展大型科研仪器设备共享服务考评工作,因此大型科研仪器设备共享服务记录数回落明显(约3.9 万条)。2019 年年初,根据科技业务管理需要,大仪平台统一迁移至云南省科技信息管理系统,开展了为期2 年的系统集成改造工作。云南省2015—2019 年大仪平台的共享服务记录涵盖了动植物、农业、金属、化工等62 家科研机构约12 万条分析检测数据,内容涉及了生物基因工程、生态环境监测、复杂矿物成分分析、痕量杂质分析、自动化检定等与研发项目和科研课题相关的前沿性技术。
为观察区域内技术热点的迁移与演变,按照时间窗口t对大型科研仪器设备分析测试的热点进行聚类。由于各个窗口期ti聚类名称不同,很难看出聚类之间的关联关系,因此按时间顺序将数据拆分为3 个窗口进行语料库的切片:t1为2015—2016 年,代表分析测试在共享服务启动阶段的技术领域;t2为2017—2018 年,代表分析测试服务关注的热点技术领域;t3为2019 年,代表分析测试所关注的最新的技术领域。其次,按ti生成对应语料库,构造基于TF-IDF 权重的“词项-文档”矩阵进行文本聚类,生成基于年度的聚类网络。第三,不同年份的聚类主题名不同,将不同年份之间的聚类cij(i为时间窗口,j为聚类主题)进行逐次交集运算,获得子集合的元素个数作为毗邻窗口的两个聚类主题的连接频率。不同时间窗口的两个聚类的连接强度wxy定义如下:
式(1)(2)中:x与y分别是毗邻时间窗口的聚类序列号;c(i+1)j为聚类主题;f(·)是集合选择函数,根据连接强度wij,选择集合cij元素,εij是集合c(i+1)j中新出现的分词术语。
技术主题演化模型如图2 所示。
图2 云南省技术创新领域技术主题演化模型
最后,从最初时间的每个聚类主题选择连接强度wij最大值作为技术演化路径,最终形成基于时间的技术演化路径。初始化每个聚类演化路径:
对样本数据进行清洗,基于时间窗口进行切片,并利用jiebaR 构建基于时间序列的多个语料库(corpus),同时利用tm 工具包构建基于TD-IDF的TermDocumentMartrix 矩阵,将每条服务记录作为一个文本(document)。在海量服务记录的情况下,基于TD-IDF 构建的稀疏矩阵会产生大量的稀疏词条,设置阀值98%进行过滤,对语料数据进行Hopkins 聚类趋势分析,得到主题聚类具体情况见表1,基于时间切片的层次聚类分别如图3~图5 所示。
表1 基于样本数据的主题聚类情况
图3 样本数据按时间切片t1 的文本聚类
图4 样本数据按时间切片t2 的文本聚类
图5 样本数据按时间切片t3 的文本聚类
鉴于样本数据形成的多个聚类中的词条数量较少,无法形成主题,因此选择包含词条数量为5 条以上的聚类作为时间切片的聚类主题(见表2):时间窗口t1中聚类1 主要是化学成分检测,聚类2偏重环境监测,聚类3 偏重食品成分测量,聚类4与聚类5 偏重化肥与农药的分析测试;时间窗口t2中聚类1 偏重生物元素的定量分析,聚类2 偏重环境监测,聚类3 偏重食品安全测量,聚类4 偏重仪器的检定;时间窗口t3中聚类1 偏重环境监测,聚类2偏重仪器的检定,聚类3偏重病原菌的分析检测。
表2 基于样本数据的技术聚类主题分布
为进一步观察技术演化路径,利用stringdist 工具包计算不同时间切片的相似度矩阵(见图6),以代表不同技术主题聚类的连接强度wxy,并作为技术主题的演化路径。
图6 基于样本数据不同时间切片的技术主题聚类连接强度矩阵
将t1与t2、t2与t3技术主题聚类连接强度矩阵进行乘积运算并进行归一化处理,得到全部技术演化矩阵(见表3)。
表3 基于样本数据的技术主题聚类连接强度矩阵
分析以上技术主题聚类连接强度矩阵中的数值不难发现,云南省大型科研仪器开展分析测试与科研任务主要涉及环境监测、农肥分析、食品安全、生命科学以及仪器检定5 个方面。其发展趋势包括以下4 个方面:
一是环境监测一直是科研分析与研究的主要领域。这与近年来云南省积极部署生物多样性与生态安全战略有关,特别是联合国生物多样性大会(COP15)在昆明举办之后,云南省在生态安全领域设立并推进了多项重大工程,环境监测是其中的重要工作任务。
二是从起初的食品检验向食品安全检验方面过渡。近年来,国内食品安全事件不断出现,为保障人民生命安全,云南省积极开展各类重大食品安全突发事件演练,使得食品安全检验任务量大为提升,特别是在新冠病毒感染疫情之后,倒逼研究人员大量开展了对食品安全检测的各类研究。
三是仪器检测成为一项重要工作。仪器检测从t2时间窗口成为热点领域,从时间线可知,自中美贸易摩擦以来,自主研发国产仪器成为了我国的一项紧要任务,特别是大型仪器设备的研制与开发成为了科研攻关的重要领域,因此仪器检测的相关研究成为了对设备测试与分析的主要关注对象。
四是病原微生物分析检测成为重要领域。近年来甲型流感、登革热、埃博拉、新冠病毒感染等传染病的暴发,对全球公共卫生产生巨大的影响,而病原体检测技术在上述疾病的诊断和防控中发挥了重要作用,因此加强全基因组学检测技术的应用、开发新型的快速便携式检测方法以及快速识别病原微生物,对于人类以及动物的健康、公共卫生安全、食品安全意义重大。
根据大型科研仪器共享服务数据的技术时空演化路径发展趋势来看,云南省应重点在生物多样性与生态安全、食品与生命科学以及大型设备制造、生物医药和大健康产业方面开展相关科研攻关,顺应省内技术创新发展的诉求。
一是构建完备的生物多样性与生态安全监测评估体系。主要是重视完善生物多样性调查监测技术标准体系,组织开展重点区域生态系统、重点生物物种及重要生物遗传资源调查,构建生态定位站点等监测网络,以及相关数据库建设等;同时探索卫星遥感、无人机航空遥感、人工智能应用,在保障生物遗传资源信息安全的前提下实现数据共享,研究开发生物多样性预测预警模型,建立预警技术体系和应急响应机制等。
二是培育健康食品,开展绿色生态农业研究。在农业主管部门的协调下,组织农业科研机构开展定向科研任务,支撑特色农林资源培育与生物种业、转基因育种与安全评价,推动全基因组设计育种的基础科学问题研究;同时大力开发绿色农药,研究新型除/杀草剂,为绿色农业的食品安全管理提供基础支撑。
三是开展仪器检验检测创新能力研究。依托省级大型科研仪器共享服务平台,在科技主管部门协调下,针对云南省八大支柱产业的关键技术项目、重点研究项目等,开展仪器自动化、智能化与智慧化的分析检测与服务,统筹实现仪器检验检测的资源互通共享,提升区域协同创新服务能力,同时加强推动关键计量测试仪器国产化,促进国产计量测试设备的推广使用;基于现有仪器进行适度的检测分析工艺改造,提升仪器灵敏度、分辨率、分析速度等,并注重在原位测量、追踪测量等领域开展技术创新研究,同时结合人工智能相关技术加强探索研究仪器分析的智能判断和预测方法,以提升全省整体科技服务创新能力。
四是加快生物医药与大健康发展。集聚云南省资源要素,推动生物医药与大健康产业集聚化发展。目前云南省疫苗产业集群基本建成,加之省内中药材资源优势比较突出,应开展关键技术攻关、科研成果转化,推进细胞、中药、疫苗等生物医药产业全面发展,同时要培育疫苗龙头企业,壮大中药材种植(养殖)企业,引进和培育细胞工程和基因科技产业集群。
区域科研活动是技术创新能力的具体体现,而科研活动必然离不开对科研仪器设备的使用,因此本研究通过对云南省开放共享的海量大型科研仪器设备服务记录数据按时间切片进行文本挖掘,同时基于文本聚类形成多条技术演化的时空链路,由此具体观察区域内技术演化趋势,在一定程度上把握区域科研活动的现状与趋势;同时,结合区域科技发展的实际情况,基于研究发现总结得到区域技术创新发展的启示,并给出具有针对性的发展建议,为区域内科技主管部门在科技创新布局与科技发展规划方面提供参考,支持区域技术创新发展。
下一步,将通过神经网络对本研究构建的模型进行优化,提升有关文本聚类精度、优化技术主题聚类,使得对技术路径时空演化趋势的判别更加准确。
注释:
1)此数据为笔者根据有关官方网站信息统计而得。如无特别说明,文内其他有关数据来源均同此。