助力学科报告的专利检索与分析*

2015-10-23 08:08:04王晓春迟玉琢
图书馆学刊 2015年1期
关键词:发明人院系检索

苏 敏 阮 卓 张 玲 王晓春 孙 玉 迟玉琢

(哈尔滨工程大学图书馆,黑龙江 哈尔滨 150001)

随着图书馆学科服务工作在高校中影响力的提升,由图书馆提供的各种类型的学科报告也越来越受到高校科研部门、发展规划部门以及院系自身的重视,学科的评估、科研成果的评价、院系的发展建设等对学科报告数据的依赖度与日俱增。学科报告作为图书馆技术含量较高的工作,如何更准确、更科学地提供相关数据以及客观合理地分析进而提出相应的对策建议,仍是图书馆相关部门人员需要思考的课题。同样,专利信息作为集技术信息、法律信息、经济信息为一体的重要信息源,并因其包含最新科技信息、可进行成果转化等特点愈来愈受到各部门的重视,目前很多高校已明确把教师的专利申请情况列入可考察的业绩成果,因此在学科报告中列入专利数据已与学科报告中经常要体现的三大检索工具收录(EI、SCI、CPCI-S)数量、ESI的机构排名等指标一起成为了必不可少的数据。

笔者从实践探索出发,以中国专利检索为重点,平台选择主要为上海知识产权(专利信息)公共服务平台检索系统,从与学科报告结合的专利检索方法、学科报告中的专利分析、对策建议的撰写原则等角度进行阐述,以期对该领域的实际工作提供一定参考。

选择上海知识产权(专利信息)公共服务平台检索系统是因为它是免费的检索平台,同时具有中国专利覆盖全面、检索类型较丰富、检索结果易于导出且数据项全面、有自主统计功能等特点,笔者使用的主要分析工具也以通用软件Excel为主,适于为中小型规模或暂时无购买商业专利分析软件计划的高校和机构提供自主专利分析思路[1]。

1 与学科报告结合的专利检索

学科报告的检索对象通常分为两种:一是高校某学院全部教师专利收录情况;二是高校某学院的某具体学科方向的专利情况,比如哈尔滨工程大学自动化学院的“控制”学科或“导航”方向近3年专利情况等。

1.1 院系全部教师的专利检索

无论是在上海知识产权(专利信息)公共服务平台还是在国家知识产权局的专利检索平台中的“申请人”字段,针对机构如“哈尔滨工业大学”或“北京理工大学”等的检索结果都是相对完整的,但上述两个平台都未直接提供基于高校具体院系的检索途径,只有部分发明人在“地址”字段体现出所在院系的情况,但数量与实际总数量相比差距较大[2]。

因此,目前在上海知识产权(专利信息)公共服务平台上检索院系全部教师的专利建议使用编写检索表达式,从“发明人”途径进行检索。

例如:检索上海交通大学船舶海洋与建筑工程学院的专利情况,就可以通过如下步骤进行:

①通过学校院系的官方网站了解该学院全部教师名单。

②部分人员变动或归属不确定的教师可以通过CNKI数据库的“作者单位”字段输入“上海交通大学船舶海洋与建筑工程学院”及“作者”字段的组合检索进行验证,详细信息还可以通过具体文章全文信息中的作者简介查看作者出生年、作者单位等内容,防止漏检与误检,通常发文活跃的作者也是专利申请活跃的人员。

③在上海知识产权(专利信息)公共服务平台上的高级搜索中选择高级检索,输入检索表达式,同时检索3种类型的专利,检索策略如下:(docType=invention_view OR doc-Type=utiltymodel_view OR docType=face_view)AND AU=(顾某某or杨某某or谭某某or张某某or金某某or缪某某)AND PA=(上海交通大学),经实际测试,该平台一个检索表达式最多可以同时检索20位发明人,因此多数情况下需分批次进行全部发明人的检索。

④每次检索后将选中全部检索结果进行导出,方便下一步数据的清理与分析。该平台提供的导出字段包括申请人、申请日、主分类号、分类号、发明人、发明名称、公开/公告日、申请国家、法律状态、文摘、代理机构等共32个(多于国家知识产权局专利平台),通常选择全部字段,以有助于全面分析。一次导出数量以低于100条为宜,否则会出现死机状况。

在本步骤需要进一步说明的是一项专利通常拥有多位发明人,同一院系的合作情况又会较频繁,因此上述每次20名发明人的检索会出现重复检出同一专利的情况,在后续的分析中一定要注意进行查重工作。

另外,该方法的检索过程中还应注意在“地址”字段同时对本院系进行检索,虽然数量较少,但从专业检索的查全率角度,依然应该补充完整。

1.2 院系具体学科方向的专利检索

在针对院系具体学科方向进行专利检索时,如果仍旧采用上述1.1的检索方法,由于人员构成不易把握,会出现大量漏检的情况,专利文献在撰写时有具体的规范,字段也相对完整,因此在检索时采用关键词与主分类号相结合的方法会取得较好的效果,举例如下:

检索哈尔滨工程大学“船舶与海洋工程”学科2009~2014年的专利情况,可在上海知识产权(专利信息)公共服务平台上输入检索表达式如下。

PD=[2009-2014]AND(((PA=(哈尔滨工程大学)AND(AB=(船 OR海洋 OR舰)OR TI=(船 OR海洋 OR舰)))OR(IC1=(B63)AND PA=(哈尔滨工程大学)))

其中IPC分类号B63(船舶或其他水上船只;与船有关的设备)的确定是检索人员通过维普数据库的科学指标分析中所提供的“船舶与海洋工程”学科该校部分专家的名单,在专利平台上进行试检,并以人工经验分析主分类号所确定的,通过该检索方法检出的专利,在阅读专利摘要后与单纯通过维普数据库提供的本专业学者名单而进行的“发明人”检索对比,前者与学科的关联度更紧密,更符合学科报告的要求。

此外,不论是针对院系的上述哪一类学科报告,如果院系有具体的其他高校或机构的对比目标,或是图书馆学科服务的老师通过检索经验自行确定的定标比超的对象,应在检索时同时导出其相关数据,以为在后面的分析与对策建议中提供相关信息,使得报告的内容更为丰富。

2 学科报告的专利数据分析

在专利信息分析中,无论是定量分析还是定性分析,专利量始终是一个最基本的数据。应用在学科报告中的专利数据分析也不例外,其他主要涉及的分析指标有专利类型、发明人、发明时间、技术分类、机构或人的合作情况、专利被引次数、同族专利数量等,进行专利分析,一般多为技术、人、时间和专利量之间进行二维和多维的组配分析。

对于未购买商业专利分析软件的高校或机构,学科报告中的专利数据分析的方法主要可通过专利检索平台直接提供的统计数据或图表,或是通过通用办公软件Excel对检索平台所导出的数据进行相关分析,另外,有时也可借助于网络上的免费专利分析软件进行分析与专利地图的应用。

2.1 上海知识产权专利检索平台的数据统计与图表

在上海知识产权(专利信息)公共服务平台的检索结果界面中,直接有可对检索结果进行简单统计与分析的“统计”按钮,同时可以自动生成图、表。数据的可视化是目前图书情报领域的主流和热点,在学科报告中提供表达直观的图表等更有助于提升报告的吸引力。该平台可进行的统计项目主要有专利类型、趋势分析(申请日、公开日)、申请人、技术领域、区域等,并可进行数据之间的二维矩阵分析,见图1。

图12011 ~2013年西北工业大学专利检索之申请人与发明人矩阵关联

直接通过该平台导出的数据也有一定局限性,比如热点技术领域IPC分类号的统计只显示到大类号,不利于技术领域的深度挖掘,此外提供分析的字段较少,像专利的法律状态等信息未予以统计。因此,更详细深入的专利分析可以通过该平台全字段的数据导出利用其他软件或统计方法进行。

2.2 利用Excel软件进行专利分析

Excel软件是目前最通用的办公软件Microsoft office中的固定产品,深入挖掘其统计分析功能对学科报告中的数据提供是非常有益的。

上海知识产权(专利信息)公共服务平台中的检索结果通过选择Access文件保存格式可直接导入到Excel中,Excel在数据统计与分析中有很多实用且未被广泛应用的功能,现根据实际经验总结如下。

2.2.1 数据清理

在统计数据清理中最常用的有分列和排序功能,比如针对公开日字段,系统提供的数据为20110112的八位数形式,如果想添加公开年字段就可以对该数据列直接进行分列操作,方便快捷。数据的排序功能可以用在很多方面,比如发明人字段的整理,使用排序功能后,就可以把同一发明人的发明进行汇聚,有助于下一步的统计。同时排序的方法也可以用在非大量数据的查重工作。

2.2.2 函数的使用

在Excel软件使用统计的时候,被经常使用到的多是求和、算数平均数等指标,其实在描述数据集中和离散趋势时,还有其他一些重要的指标,可以通过Excel“公式”功能中的“插入函数”得以实现。

①中位数(MEAN)。中位数是指将数据按大小顺序排列,形成一个数列,居于数列中间位置的那个数据即为中位数。中位数不受分布数列的极大值或极小值影响,因此在数列中出现极端值的情况下,用中位数作为代表值比用算数平均值更有说服力。在具体的专利分析中,比如针对某机构近10年的专利数量,除了提供其算数平均值之外,再提供中位数一方面可以进行比较,另一方面能够避免极端值的出现[3]。

②方差(VAR)。方差是描述数据离散程度最常用的测量值,反映了各变量值与均值的平均差异,方差采用了平方形式,比采用绝对值形式的标准差更易于在数学上予以实现,因此成为测度数据离散型最主要的方法。在学科报告的专利分析数据中,添加该数据可以使得分析更客观与理性。

③频数统计(COUNTIF)。在Excel2007以上的版本中增加了频数统计函数COUNTIF,其在数据统计中非常重要,使用也较方便,比如在导出的“IC1”字段中就可以通过人工设置直接统计相关分类号的总数量,具体函数使用指令为COUNTIF(V2:V75,“G01*”),即可以统计V数列中第2~75行中IPC分类为G01(测量或测试分类)及其细分分类下的所有专利数量,其中“*”为截词符,代表0~n个字符,上述指令可统计的分类可以包括G01B11/16、G01N21/41、G01D5/26等多种次级分类。

另一方面,该函数同样可以通过使用引号进行字符形式变量的统计,比如针对发明人为刘少刚的统计,可以使用的函数指令即为COUNTIF(S2:S75,“*刘少刚*”),其中在发明人刘少刚前后都加了“*”,是考虑同一字段常有多个发明人,发明人之间多用分号分隔,通过该方法经实际测试可避免漏检的情况出现。

2.2.3 图形的可视化展示

Excel提供的图形形式丰富是众所周知的,在学科报告中的图形选择要根据具体的数据指标,比如随时间变化的专利数量,选择曲线图比较直观且连续;不同机构的数量对比可以用二维或三维柱状图来体现;专利中发明、实用新型、外观设计的占比关系用饼状图更一目了然。另外,如果在只有图没有表的情况下,应注意在图形中添加数据标签,以确保图形数据来源的可靠性与真实性。

2.3 在学科报告中引入专利信息的自主分析方法

专利信息分析是有历史传承的领域,除常规的数据分析方法之外,还有其独有的分析方法,在学科报告中引入适合的专利自主分析方法可以为报告增加新颖性和独特性。

比如定量分析中的专利三角图分析法,不仅可以直观地看出3种专利类型的数值,并且通过多时间点的选取,可以揭示发明专利、实用新型、外观设计专利的比率所发生的连续动态变化,进而判断相关机构或技术领域的专利活跃度。

此外时间序列法、回归分析法等也是专利分析中的常用方法,通过基础数据形成的散点图,并通过使用趋势线或回归函数等方法进行最小二乘法的拟合,不仅能进行专利数据的分析,同时也可以进行数量的预测。上述方法的实现,完全可以通过Excel软件进行,在需要的学科报告中是可以进行内容添加和展示的。

2.4 利用网络免费专利分析软件

目前,在专利分析领域,网络上还有一些免费的专利分析软件,比如Soopat软件,可进行国内外专利的聚类分析,同时还可以进行专利的引证分析,并形成专利地图,这是中文专利检索平台所不具备的功能。

国家知识产权局、世界知识产权局WIPO的免费检索平台都提供了专利检索结果的图形可视化展示,在学科报告的应用中可与上海知识产权(专利信息)公共服务平台的图表统计功能交叉使用,丰富学科报告的展示形式[4]。

3 撰写学科报告中对策建议的原则

学科报告中除了相关的检索与数据分析之外,给出有的放矢、言之有物的建设性对策建议也是非常重要的一环,针对专利信息方面的建议也不例外,应遵循以下几点原则。

①体现客观性。对策建议的给出应以报告中的数据作为基础,实事求是地指出优势、不足及努力方向。

②突出建设性。对策建议应具有积极意义与可操作性,有通过努力能够实现的目标。

③对象的针对性。学科报告的使用对象会存在不同的机构,可能是院系也可能是高校中的科研院、发展计划处或者是学校的领导机构,针对不同的对象侧重点也应有所不同,比如科研院更关注科研成果的质量与数量,院系更希望了解与竞争机构的差距等。

④语言的简洁性。对策建议通常比较精炼,不易过长过多,以结论性的阐述为主。

4 结语

在学科报告中提供专利信息的数据及分析建议是有意义且必要的工作,立足于免费专利检索平台与常规统计软件也是可以有所为的,当然在专利统计分析的项目中还应进一步深入挖掘,比如专利的法律状态、专利的成果转化情况与具体机构、技术生命周期的关系等,以进一步为高校学科的良性发展提供思路。

[1] 上海知识产权(专利信息)公共服务平台[EB/OL].[2014-07-28].http://www.shanghaiip.cn/wasWeb/index.jsp.

[2] 中国国家知识产权局专利检索平台[EB/OL].[2014-07-28].http://www.sipo.gov.cn/zljsfl/.

[3] 庄君,蒋敏杰,李秀霞.Excel统计分析与应用[M].北京:电子工业出版社,2013:52-56.

[4] 罗立国,余翔,郑婉婷.专利检索网站比较研究[J].情报杂志,2012(3):163-167.

猜你喜欢
发明人院系检索
发明人角色识别及二元创新能力差异分析
——社会资本视角的解释
2019年第4-6期便捷检索目录
浅析发明人(或设计人)变更的常见问题及建议
专利代理(2019年2期)2019-01-26 15:16:16
摇摆撞击洗涤装置
家电科技(2018年9期)2018-09-28 01:45:00
洗衣机
家电科技(2018年9期)2018-09-28 01:45:00
高师音乐院系艺术实践周实效提升策略
专利检索中“语义”的表现
专利代理(2016年1期)2016-05-17 06:14:36
清华院系手机背景图
大学生(2016年7期)2016-04-29 10:12:06
关于高等院校院系党政关系的思考
商科院系建立咨询委员会的思考
现代企业(2015年5期)2015-02-28 18:50:41