刘 佳,钟永恒,3,赵展一,王 辉,李贞贞,孙 源
1.中国科学院武汉文献情报中心,湖北 武汉 430071;2.科技大数据湖北省重点实验室,湖北 武汉 430071;3.中国科学院大学经济管理学院信息资源管理系,北京 100190;4.中国科学院文献情报中心,北京 100190)
“围绕产业链部署创新链,围绕创新链布局产业链,促进创新链和产业链双向融合、精准对接、相互促进、协同发展”已成为各地科技创新 “十四五”规划中的重要任务。洪银兴[1]将产业链与创新链的融合过程分为以下3个步骤:①创新核心技术的创新链,从基础研究开始,致力于产生处于国际前沿的原创性核心高新技术;②培育世界级的高科技企业,解决好从 “科学”到 “技术”的转化;③在每个环节实现产学研深度融合,产学研各方共同介入创新。创新链与产业链融合的关键是加速从科学发现到技术创新的过程,推动科学、技术、工程和产业创新之间的资源整合[2]。习近平总书记在第二十次两院院士大会上指出,创新链与产业链融合,关键是要确立企业创新主体地位,明确企业在双链融合中的重要作用。因此,研究基础研究对企业技术创新的作用,有助于理解企业参与基础研究的重要性,掌握创新链与产业链的融合规律,制定有效的科技创新政策。
基础研究与技术创新的相互作用已得到学界证实与关注。Bush[3]指出基础研究是技术创新的源泉,基础研究对技术创新具有推动作用。Carpenter[4]和Narin[5]认为科学-技术关联即为基础研究与技术创新成果之间的知识传递过程,并认可用论文、专利分别作为衡量基础研究、技术创新水平的测度数据,以揭示科学与技术之间的知识流动。Debackere[6]、Bikard[7]等证实基础研究与技术创新之间的正向关系。董坤等[8]梳理国内外学者关于科学与技术之间关联关系的相关研究,进一步明确科学与技术之间具有复杂的知识关联和相互作用关系。文献计量学领域国内外学者从不同角度对二者关系的测度方法进行研究。一是从引文角度分析专利引用论文[9-12]、论文引用专利[13-14]、论文与专利互引用[15-17]的关系,测度科学与技术创新之间的关联度;二是从学者-发明人角度[18-20],建立论文作者与专利发明人的对应关系,研究基础研究对技术研发效率的影响;三是从类目映射角度[21-22],将论文的学科分类与专利的IPC类目进行类目映射,以此反映技术创新与科学研究之间的知识关联与结构;四是利用文本主题关联方法[23-24],探索科学主题与技术主题之间的关联程度。这些研究为基础研究与技术创新关系研究提供了理论和方法基础。
当前基础研究与技术创新关系的研究视角和研究方法日趋多元,但是基于引文关系视角探讨基础研究与技术创新的关联关系仍然是主流。从引文关系的数据来源与关联方向看,多为来自Web of Science的论文及其引文数据[25-26]。从研究对象看,生物科学[27-28]、基因工程[29]、电动汽车[30]、太阳能电池[31]、石墨烯[32]、机器人[33]、3D打印[34]等高新技术领域技术发展与基础研究的关系是关注重点。近年来,政府进一步重视企业参与基础研究,也吸引学者从企业角度研究科学与技术的关联关系[35-36]。
综上所述,现有技术创新与基础研究的关联关系研究侧重于单一领域的关联关系研究,缺少对所有领域的总体研究;从关联关系的节点看,较少以公司为主体的关联关系研究。上市公司作为市场主体中最活跃、最具代表性和影响力的群体,其技术创新能力是高质量发展的重要组成部分。鉴于此,本文选择上市公司的专利数据及其引文数据为数据源,构建 “专利-论文”引文关系网络,从科学关联度、专利引文时滞、科学循环周期、学科多样性等角度分析基础研究对技术创新的作用,并对不同领域之间的差异进行比较分析。
本文的创新点在于研究视角更广,突破了已有研究常以特定领域或特定类型创新主体的范围限制。选择全部上市公司的所有专利申请数据及其引文数据为研究对象,同时从全域和分领域两个维度研究基础研究与技术创新的关系,既能了解基础研究对整体上市公司支撑作用,又能发现领域差异。
论文是基础研究成果的表现形式,专利是技术创新成果的表现形式,此观点已得到业界认可[37]。论文和专利作为两种不同形式的公开出版物,均可获取。论文与专利之间的关系能够揭示基础研究与技术创新的关联情况。本文采用当前主流的方法,从引用关系视角构建专利与论文的引文关系网络,探究基础研究对上市公司技术创新的支撑作用,分析框架如图1所示,步骤如下:①检索并采集全部上市公司的专利数据;②构建单篇专利与论文的引用关系网络,分析整体科学和技术关联的广度和深度;③构建领域视角专利对论文的引用关系网络。技术创新的产业领域以专利申请人所属领域为依据,基础研究的学科领域以论文来源期刊对应的学科分类为依据;④基于领域维度的引用关系网络,计算科学关联度、引用时滞、科学循环周期和学科多样性。科学关联度用于测度技术创新对基础研究的依赖程度,引用时滞用于测度基础研究成果向技术转化的速度,科学循环周期用于测度知识在技术创新过程中的传递速度,学科多样性用于测度技术创新知识来源的学科多样性。
图1 上市公司技术创新与基础研究关联关系分析框架
上市公司名单以中国证券监督管理委员会发布的 《2020年3季度上市公司行业分类结果》涉及的4025家上市公司为初始来源,去掉15家B股上市公司,218家有退市风险的企业,得到3792家上市公司名单。
专利数据来源于incoPat数据库,该数据库由北京合享智慧科技有限公司开发,数据来自各国知识产权官方和商业机构[38]。该数据库已将专利的引文信息区分为引证专利和引证科技文献,为本文研究提供较好数据基础。为了提高专利数据的检准率,检索词为上市公司全称及其曾用名。通过企查查查询,发现共有1724家上市公司有名称变更记录,其中变更频次最高的为金浦钛业股份有限公司、润建股份有限公司、吉峰三农科技服务股份有限公司、新湖中宝股份有限公司,均经历了5次名称变更。经检索,截至2022年3月22日,中国上市公司申请国内专利196.67万件,平均每家上市公司申请专利518.64件。
专利数据引用关系处理是本文重点。首先,剔除没有引用信息或者只引用专利的记录。其次,对原始数据的引证科技文献进行规范化处理。利用python补全原始引证科技文献的出版时间、来源等信息,部分外文引用信息通过手工检索补全;同时删除部分无法获取引证科技文献出版时间的数据,最终得到38.02万条专利含有引文信息,其中9.45万件专利有引证科技文献。
在调研国内外相关指标基础上,构建以下指标测度上市公司技术创新与基础研究的关联关系。
(1)科学关联度 (Science Linkage,SL)。1998年Narin[39]提出利用专利所引用的科学论文或研究报告等的平均数测度技术创新对基础研究的依赖度。据此设计本文的科学关联度指标,公式为:
(1)
式中,i=1,2,3……n,Rti表示第i件专利所引用的论文数量,Pt代表专利的总数。
(2)引用时滞 (Citation Time Lag,CTL)。引用时滞可分为专利引用论文时滞、专利引用专利时滞、论文引用专利时滞和论文引用论文时滞[40]。参考Yoon等[41]、Park等[42]、Chen等[43]的方法构建专利引用论文时滞 (简称引用时滞),利用基础研究成果从出版到被专利引用经历的时间长度测度。CTL值越小,说明专利引用论文时滞越短,基础研究成果向技术转化的速度越快。公式为:
(2)
式中,i=1,2,3… n,j=1,2,3… s,Ypi表示专利i的申请年份,Ycij表示专利i引用的第j项基础研究成果的出版年份;s表示专利i引用的基础研究成果总数。
(3)科学循环周期。Breitzman等[44]提出专利的技术循环周期和论文的技术循环周期,在此基础上,Verbeek等[45]提出论文包括专利的科学循环周期和论文的科学循环周期。借鉴前人研究成果,利用专利引用基础研究成果的出版年龄构建专利的科学循环周期 (Science Cycle Time,SCT)。SCT值越小,说明科学循环周期越短,被引用的论文新颖性越强,知识在技术创新过程中的传递速度就越快。计算公式为:
(3)
式中,i=1,2,3… n;Ssi代表被专利i引用的论文年龄中位数,如果专利i引用的论文数量是奇数,则中位数为文献年龄排序位于中间位置的科技文献的年龄,如果引用的科技论文数量是偶数,则中位数为文献年龄排序位于中间位置两篇文献年龄的平均数;Ps代表施引专利总数。
(4)学科多样性 (Discipline Diversity Index,DDI)。布里渊指数于1956年提出,最初被用于测度一条消息中所包含的信息量,后来发展为测度学科多样性的经典指标[46]。为了对引用的科技文献的学科多样性进行分析,借鉴布里渊指数测度方法从引文角度衡量各行业基础研究知识来源的学科多样性。DDI越大,说明跨学科引用的学科数目越多,多样性越强,技术创新知识来源的学科领域越广。计算公式为:
(4)
式中,DDIX表示行业x的学科多样性指数,N表示行业x引用的所有学科的论文总频次,ni是行业x引用学科i的论文频次。DDI的数值范围是0到正无穷。
上市公司申请并公开发布的专利中,38.02万件专利有引证信息,引证专利、论文数量分别为227.65万件、19.31万篇,平均每件专利引用专利文献5.99篇、论文文献0.51篇,见表1。上市公司引用的专利数量是论文数量的11.79倍,说明上市公司技术创新主要是基于已有技术创新成果进行改进型创新,突破性创新较少。
表1 上市公司专利申请总体情况
对比分析各领域的科学关联度,有利于识别对基础研究依赖程度高的行业,为基础研究投入资源配置提供参考。在上市公司分布的47个行业中,科学关联度最高的行业依次是农、林、牧、渔业,卫生和社会工作业,酒、饮料和精制茶制造业,医药制造业,综合,科学关联度均大于1.5,见表1。
从以上领域中筛选出有引证科技文献且申请专利数大于10、科学关联度大于1.5的企业;若本领域内符合条件的企业超过5家则选取科学关联度排名前5的企业,筛选结果见表2。其中,综合领域广西粤桂广业控股股份有限公司 (简称 “粤桂股份”)有引证信息的专利数为9件,未列入表中。由筛选结果可以看出,表2中科学关联度较高的上市公司均为本领域内龙头企业,具有较高的创新能力。科学关联度最高的企业为申联生物医药 (上海)股份有限公司 (简称 “申联生物”)、浙江康恩贝制药股份有限公司 (简称 “康恩贝”)和温氏食品集团股份有限公司 (简称 “温氏股份”)。申联生物是一家专业从事兽用生物制品研发、生产、销售的高新技术企业,掌握了口蹄疫疫苗关键核心技术,是国内第一家实现口蹄疫合成肽疫苗产业化的企业,2016年参与申报的 “针对新传入我国口蹄疫流行毒株的高效疫苗的研制及应用”项目获国家科学技术进步奖二等奖[47]。康恩贝主要从事心脑血管药、泌尿系统药、镇咳、祛痰药等研制和销售,拥有植物药现代提取分离纯化技术、膜控型制剂缓释技术等核心技术,拥有盐酸吡格列酮生产技术、甲磺酸多沙唑嗪生产技术等专有技术,多数产品拥有独立知识产权。温氏股份是国内农业产业化重点龙头企业,于2008年成立广东省温氏研究院,承担国家星火计划、863计划项目以及国家生物育种高技术产业化项目等重大项目[48]。
表2 科学关联度较高的重点企业
全部143327篇科技文献引文中,除去发表时间不详的引文,共得到108256篇科技文献引文的发表 (出版)年数据,计算每一篇科技文献引文的引用时滞,并统计不同引用时滞下科技文献被引频次,统计结果如图2所示。上市公司专利的科技文献引文最早发表于1931年,最晚发表于2021年,时间跨度达90年。科技文献引用时滞为1年的引用行为,有13939次引用,占引用次数的12.88%。科技文献引用时滞在1~10年的引用行为占引用次数的比重为79.67%。
图2 专利引用科技文献时滞分布
对比各行业上市公司申请专利的科技文献被引时滞可以看出,引用时滞最长的5个行业依次为综合 (10.93),农、林、牧、渔业 (5.41),石油加工、炼焦及核燃料加工业 (5.25),酒、饮料和精制茶制造业 (4.93),医药制造业 (4.70),且科学关联度均大于1。引用时滞最短的5个行业依次为教育 (0.52),计算机、通信和其他电子设备制造业 (0.82),电气机械及器材制造业 (0.89),家具制造业 (0.86),汽车制造业 (0.95),且科学关联度均小于1。对科学关联度和引用时滞两组数据的相关性进行统计,可以发现二者相关性系数为0.76,这进一步说明科学关联度越高的产业领域,引用时滞会越大。
按照科学循环周期的计算公式可得全部上市公司的科学循环周期为12.75年。科学循环周期从2007年的19年逐渐降至10年以下,说明科学理论向技术创新传递知识的速度加快,如图3所示。
图3 专利引用科技文献的科学循环周期
分别计算各行业上市公司的科学循环周期,科学循环周期最长的行业依次为综合 (14.22),石油加工、炼焦及核燃料加工业 (9.82),农、林、牧、渔业 (9.61),医药制造业 (8.92),酒、饮料和精制茶制造业 (8.42)。科学循环周期最短的行业依次为教育 (1.14),家具制造业 (1.36),电气机械及器材制造业 (1.50),计算机、通信和其他电子设备制造业 (1.62),其他制造业 (1.73)。也就是说,这些领域的知识从基础研究向技术创新传递的速度快于其他领域。
筛选和整理143327篇科技文献引文,发现有期刊文章107214篇、会议文章4050篇、其他类型的引文32063篇。进一步,107214篇期刊引文中有10209篇为SCI论文,分布在1834种期刊上,有63110篇为中文期刊论文,分布在3817种期刊上,部分论文所属期刊不属于SCI或中国知网收录期刊范围。
论文的学科分类依据期刊所属学科划分。考虑到中文期刊和Web of Science期刊的学科名称不一致,需要对两种学科分类体系进行融合,融合步骤分两步。第1步:合并名称相同的学科,如地质学、海洋学、力学、林业、农业工程、生物学、生物医学工程、心理学、园艺等中文期刊的学科分类均有对应的web of science期刊学科分类;第2步:合并名称不相同但经专家确认后实质为相同学科的学科。例如,航空航天工程与航空航天科学与工程合并为航空航天工程,机械工程与机械工业合并为机械工程。经整理发现,上市公司专利申请引用的科技文献来自283个学科,环境科学与资源利用、基础科学综合、轻工业手工业、无机化工、有机化工、综合科技等学科被多个产业领域的专利引用,涉及产业领域均在30个以上。
依据学科多样性计算公式得到每个行业技术创新来源的学科多样性,见表3。其中,学科多样性最高的领域依次为计算机、通信和其他电子设备制造业,专用设备制造业,医药制造业,仪器仪表制造业,科学研究和技术服务业,各行业技术创新来源的学科领域数量均大于80个。
表3 主要产业领域技术创新来源学科分布
(1)上市公司对基础研究成果吸收能力有限。当前上市公司申请专利引用的专利数量是论文数量的11.79倍,全部上市公司申请专利的科学关联度平均值仅0.79,科学关联度大于1.5的行业仅有5个。上市公司对基础研究成果吸收较少的原因主要是基础研究与技术创新脱节,产业链与创新链不能有效融合。
(2)领域内龙头企业技术创新能力强,基础研究的支撑作用显著。领域内龙头企业专利申请数量较多,且申请专利的科学关联度也较高,说明这类企业具备较强的基础研究成果转化能力。申联生物、康恩贝、温氏股份等企业的科学关联度均高于4,拥有本领域的关键核心技术,具有独立知识产权,在行业内具有较强的竞争力。这进一步说明,企业在技术创新、攻克和掌握关键核心技术过程中离不开基础研究成果的支撑。
(3)科学关联度越高的产业领域,基础研究成果向技术转化的速度越慢。基础研究成果向技术转化的速度一般为1~10年。综合,农、林、牧、渔业,石油加工、炼焦及核燃料加工业,酒、饮料和精制茶制造业,医药制造业等领域引用时滞较长,专利引文时效性均较低,说明这些领域的基础研究成果向技术转化的速度较慢。
(4)基础研究向技术创新传递知识的速度逐渐加快,从15年前的逾19年缩短至不到7年,缩短了近三分之二。并且,知识传递速度存在领域差异,传统产业领域基础研究的知识转化时间较长,如综合,石油加工、炼焦及核燃料加工业,农、林、牧、渔业,医药制造业,酒、饮料和精制茶制造业等领域科学循环周期均大于8年。
(5)高新技术产业领域的学科多样性高于其他传统产业领域。计算机、通信和其他电子设备制造业,专用设备制造业,医药制造业,仪器仪表制造业,科学研究和技术服务业等领域的学科多样性高,技术创新知识来源的学科领域均高于80个。环境科学与资源利用、基础科学综合、轻工业手工业、无机化工、有机化工、综合科技是多个产业领域技术创新的知识来源学科,需要重点关注。
本研究能够为科技创新管理提供以下启示:第一,引导企业投入基础研究。企业作为创新主体在桥接科学发现到技术创新之间的鸿沟有重要作用,企业特别是领域内龙头企业加大基础研究经费投入占比,并保持投入的稳定性,有利于缩小科学发现到技术创新之间的鸿沟,提高基础研究经费投入对技术创新贡献率。第二,科学关联度较高的产业领域,探索建立长周期评价体系,项目资助方式以长周期项目为主。第三,鼓励高技术产业领域企业开展跨领域的合作研究。
本文也存在一些不足。首先,本文对于科技文献引文的学科对应关系是基于期刊建立,粒度较粗,易造成部分科技文献引文的学科分类不准确。其次,本文仅以专利和论文分别代表技术创新与基础研究,通过定量方法测度二者之间的关系,对于影响技术创新发展的政策因素、市场经济因素等未考虑。再次,仅从领域维度研究基础研究对上市公司技术创新的作用,暂未考虑地域、单位属性、上市类别等维度。因此,在下一步研究中将针对上述问题开展更多的探讨。