22省专利数据分析及影响因素研究

2019-07-23 01:50段博睿柯波杨云帆刘文希焦博卢方芳
科技视界 2019年16期
关键词:回归模型专利申请

段博睿 柯波 杨云帆 刘文希 焦博 卢方芳

【摘 要】“专利申请数据”是一种可以被高效利用和分析的数据包。本文研究地域、私营工业和R&D投入对专利申请的影响。首先利用SQL Server 2008软件对数据进行处理,然后将这些数据进行分类比较,最后利用带有地域这一虚拟变量的回归模型分别研究私营工业和R&D投入对专利申请的影响。得出结论:相比于私营工业企业销售产值和R&D经费,私营工业企业单位数和R&D项目数对专利申请量有着更显著的正向作用,同时在中南地区这两个指标对专利申请量的影响较其他地域更大。

【关键词】专利申请;私营工业企业;R&D;虚拟变量;回归模型

中图分类号: F224;F204 文献标识码: A文章编号: 2095-2457(2019)16-0123-002

DOI:10.19694/j.cnki.issn2095-2457.2019.16.052

22 Patent Data Analysis and Influencing Factors

——Based on “Patents Invention Data” Package Data

DUAN Bo-rui KE Bo YANG Yun-fan LIU Wen-xi JIAO Bo LU Fang-fang

(Hubei University of art and science, Xiangyang Hubei 441000, China)

【Abstract】“Patent application data” is a data package that can be efficiently used and analyzed. This paper examines the impact of geographic, private industry, and R&D inputs on patent applications. First, the data is processed by SQL Server 2008 software, and then the data is classified and compared. Finally, the regression model with the virtual variable of the region is used to study the impact of private industry and R&D investment on patent applications. It is concluded that compared with the sales value and R&D expenditure, the number of private industrial enterprises and the number of R&D projects have a more significant positive effect on the number of patent applications, while the two indicators in the Central South region apply for patent applications is greater than in other regions.

【Key words】Patent applications; Private industrial enterprises; R & D; dummy variables; Regression model

當下,专利的申请产生了一个很大的数据集,而专利数据在社会中具有广泛的用途。通过对以往研究的考察,发现河北省专利增长与经济发展存在因果关系。从全国的角度来看,每个省由于其地域的特殊性和省内对科技创新的资金的投入多少都会对本省的专利申请数量产生直接或者间接的影响。我们希望从能够反映经济发展情况的私营工业企业各项指标、R&D投资各项指标和地域差异的角度出发,去挖掘哪些因素会对专利申请情况产生影响并讨论为什么会产生这种影响,从而发现“专利发明数据”的潜在价值。并希望能够得到专利申请情况随着各项指标有关联的变化,并且印证地域对专利的申请情况也有影响等结论。

1 专利数据的来源

该研究课题以“北京大学开放数据平台”中的“发明专利数据”为基础数据,数据包含中国境内2017年1月4日至2017年9月8日申请专利数。为了在同一阶层讨论专利的发展,研究所使用到的数据排除了四个直辖市,两个特别行政区,五个自治区的数据,23个省中台湾省的数据也被排除在外。通过其他必要的辅助工具,筛选出除了以上提到的地区之外剩下的22个省的专利申请数据作为本次研究的基础。

2 私营企业、R&D投入和地域对专利申请的影响

2.1 变量的选择

本文研究引入四个变量:2016年各省私营工业企业单位数、私营工业企业销售产值、规模以上工业企业R&D经费及规模以上工业企业R&D项目数。数据来自2017中国统计年鉴。

2.2 私营工业企业指标与专利的关系

从全国来看,私营工业企业个数与产值与专利申请数并不总成正比。广东省的私营工业企业单位数和销售产值在都远低于山东省,其私营工业企业销售产值占比也比山东省低11%左右,但广东省申请的专利数占比高于山东省16%左右。

2.3 R&D投资与专利的关系

规模以上工业企业R&D经费值越高与申请的专利项目并不总成正比。落差最大的是山东省,山东省有远高于浙江省的R&D经费投入,但是专利申请量却低于浙江省。山东省之后的18个省中,安徽,四川有着与山东省不同的反向落差。与浙江省不同的是,安徽省和四川省是在规模以上工业企业R&D经费值和规模以上工业企业R&D项目数排名均不靠前的情况下,获得了较高的专利申请量。而这种反向落差最显著的仍属专利申请量第一位的广东省,但同时广东省的规模以上工业企业R&D经费也排在首位。

2.4 地域与专利的关系

将22个省划分为六个地域,对数据进行分析。

华东:浙江、江苏、福建、江西、山东和安徽;华北:河北和山西;东北:辽宁、吉林和黑龙江;西北:陕西、青海和甘肃;西南:四川、云南和贵州;中南:河南、湖北、湖南、广东和海南。

六个地域都遵循规模以上工业企业R&D项目数越多,申请的专利项目越多的规律。除华东地区和中南地区外,其他地区均遵循规模以上工业企业R&D经费越多,申请的专利项目越多规律。华东地区中不遵循这一规律的省份是浙江和山东省。山东的规模以上工业企业R&D经费占比比浙江的多,但山东的专利数占比比浙江的少。中南地区中河南的规模以上工业企业R&D经费占比低于湖北和湖南,但河南的专利申请数卻高于湖北和湖南省。中南地区也是落差最大的地区,广东省三个指标占比都远远高于其他四个省份。

2.5 带有虚拟变量的回归模型

本节利用数学模型给出两组变量及它们在地域影响下分别对专利数量的量化影响。

为了构建模型,本文引入适当的变量符号。考虑到数据差距大,在五个变量数据处理上,没有选择中心化的方式,而是选择了中位数。

SQS:私营工业企业单位数-6709.5(个);

SQC:私营工业企业销售产值-14379.07(亿元);

RDJ:规模以上工业企业R&D经费-249.6622(亿元);

RDX:规模以上工业企业R&D项目-7149(项);

ZL:每省申请专利数-3260(项)。

地域划分为华东、中南、华北、东北、西南和西北,其中西北的平均申请专利数最少,以其为基准,引入五个虚拟变量:

X1=1,华东地区0,其它地区,X2=1,中南地区0,其它地区,

X3=1,华北地区0,其它地区X4=1,东北地区0,其它地区,

X5=1,西南地区0,其它地区

在简单建立ZL与X1,X2,X3,X4,X5之间的线性模型后,根据系数t检验结果,系数均不显著,并且模型拟合度低。根据结论判断地域对申请专利数没有显著的直接影响。

四个变量根据私营企业和R&D投入划分成两组模型,建立线性回归,得到下面两个模型公式:

调整值为0.626675,AIC和SC值均在20以上。(1)中常数项和私营工业企业销售产值(SQC)的系数均不显著(此处及以下均在0.05条件下)。对申请专利数有显著正向影响的是私营工业企业单位数(SQS)。(为随机误差)

调整值为0.870957,AIC和SC值为19。(2)中常数项系数不显著,从模型看,R&D经费增加1亿元,申报的专利增加8.4项。R&D经费投入和项目对专利的申请数都有显著的正向作用。

3 总结

整体来看,但专利申请数量与提到的变量虽有联系,但并不完全由其决定。在大的规律下仍然有部分省份出现了反常的情形,而这些情况的出现可能还与地区工业重心及整体的行业模式有关。比如山东、吉林、河北等省份,由于其主要的重心在重工业,而重工业对技术的发展与其他产业的要求有所不同,并没有出现专利申请数量随着经济指标而上升的情况。还有另外一种情形的出现,即有些省份由于其主要行业模式的原因,对专利并没有太大的要求。比如海南省和云南省,因其主要发展旅游业,所以从我们所选取的表现经济发展的指标中并没有看到这类省份的表现有多出色。

这次的研究表明,虽然私营工业企业的发展和科研投入及地区生产总值和地域的差别会影响专利的申请数量,但这些指标并不能完全表现出专利申请的趋势。各省的专利发明及申请的数量还受除经济之外的很多种因素的影响,比如风土人情,地方特色等等。该研究可以为各地区专利申请情况给出一个大的方向,但具体到实际中还要结合其他的现实条件来具体分析。这样才能结合每个地区的具体情况给出详细的报告。

【参考文献】

[1]张爱华.专利产出与区域经济增长关系的实证研究——基于河北省1985—2012年数据分析[J].河北经贸大学学报,2015,36(05):114-119.

[2]张继红,吴玉鸣,何建坤.专利创新与区域经济增长关联机制的空间计量经济分析[J].科学学与科学技术管理,2007(01):83-89.

[3]詹姆斯·H.斯托克,马克·W.沃森.计量经济学:第二版[M].格致出版社上海三联书店上海人民出版社,2009.

[4]邓芳.EXCEL高效办公:数据处理与分析[M].人民邮电出版社,2012.

[5]黄德才.数据库原理及其应用教程[M].科学出版社,2002.

猜你喜欢
回归模型专利申请
唑啉草酯中国专利申请分析
农村秸秆处理方式的影响因素
国际旅游外汇收入影响因素分析
专利申请审批流程图
专利申请三步曲
专利申请审批流程图
国外专利申请如何尽快被授权
China handles 467,000 patent app lications in H 1,up 9.6%on year