高校专利专题数据库的建设研究*

2024-05-11 12:02陆薇薇赵冬梅杨秋霞王宝清陈月从
科技创新与生产力 2024年4期
关键词:电力行业检索专利

陆薇薇,赵冬梅,杨秋霞,王宝清,付 国,陈月从,陈 普

(华北电力大学图书馆,北京 102206)

1 研究背景和意义

1.1 专利专题库

专利信息是重要的情报资源,可以帮助相关人员充分了解现有技术,提供研发思路,避免专利纠纷,制定竞争策略。

针对某个专题(行业、企业、产品、技术等)建立的专利信息数据库,被称为专利专题库。行业专利专题数据库是针对特定领域专业特点和用户特色需求,从海量的初级专利信息数据中筛选,并进行一定的加工所形成的数据库。通常专利专题库不仅包含了专题范围内的所有专利数据,具有检索、下载、存储等功能,定期进行数据更新,而且通常具有专利分析功能,即统计、分析、数据管理、图表输出等功能。

专利专题库由检索专家和技术专家协同建立,相关从业人员可以在专利专题库中快速找到所关心技术分支的相关专利,省去了对专业技能和检索技能要求较高、耗时很长的检索策略及检索式确定过程,提升了专利检索的准确度,提高了工作效率,加快了项目进程。

各级知识产权公共信息服务平台都将专利专题库作为重要服务内容,提供了针对战略新型产业和高精尖产业的大量专利专题库,比如物联网、云计算、新材料、航空航天、区块链、新型疫苗等专题库,对行业的发展起到了重要的作用。

1.2 专利专题库对大学发展的重要服务作用

大学是培养人才的地方,是科技创新的重要阵地。2022 年政府工作报告提出,推进高等教育内涵式发展,分类建设一流大学和一流学科。新时代的图书馆作为智库,在双一流建设中担当重要职责,而知识产权信息服务在图书馆的服务内容中将越来越重要。2017 年国务院发布的《“十三五”国家知识产权保护和运用规划》中提出加强公共图书馆、高校图书馆的知识产权信息服务能力建设,鼓励高校和科研机构强化知识产权申请、运营权责,加大知识产权转化力度[1]。自2017 年12 月15 日国家知识产权局办公室和教育部办公厅联合印发了《高校知识产权信息服务中心建设实施办法》 以来,至2022 年年底,已遴选出四批共103 家高校国家知识产权信息服务中心,向校内外提供知识产权信息服务,专利信息服务是知识产权信息服务的重点。

国家知识产权局办公室和教育部办公厅2021年发布的《高校知识产权信息服务中心建设实施办法(修订)》中指出“支持高校知识产权信息服务中心结合学科优势,建设学科领域专业化知识产权信息数据库和服务平台”[2],大学图书馆应开展的12 项核心专利信息服务类型中,专利专题数据库服务是重要内容之一[3]。国知局和成熟的商用专利数据库的数据特点是大而全,不针对特定行业或者特定需求,而专利专题库则着眼于特定需求(某一个行业、技术、产品、企业)。虽然知识产权信息服务中心针对特定需求可以提供专利分析服务,但是数据截止到某个时间点,而且提交专利分析报告后服务就结束,而专利专题库由检索专家和技术专家协同建立,数据可以定期更新,简单的专利分析工作可由用户自行利用专利专题库的分析功能完成。

双一流建设以学科为基础,高校专利专题库可针对学科方向及其研究热点进行建设,服务教学和科研,有利促进了大学学科发展,具体优势如下。一是专业人员建库,方便师生查询专利,了解某个专题专利现状;二是明晰学校已有专利价值,重点进行推广以促进专利转移转化;三是探索未来技术发展,确立研究方向;四是灵活建库,以学科发展和科研活动为中心对专题库进行调整和扩充。

高校知识产权信息服务中心的专利专题库服务可以从两方面开展,一是对校内外用户提供按需建库服务,即应用户特定需求建库;二是针对大学的学科特点和发展需要,自行提供一些专利专题库资源供全校用户使用。

2 专利专题库一般建设思路

2.1 确定技术主题,进行技术分解

首先确定专利专题库的技术主题,针对技术主题进行建库,然后进行技术分解。技术分解是检索的前提,是采用模块化的思想将大的主题进行合理切割,对技术主题进行细分化解,将需要检索的内容分成层级分明、逻辑清晰的技术分支,相当于给检索制定了路线图。图1 为针对氢能的一种技术分解方法。具体技术分解分几级,按照什么思路去分解,没有统一的标准,需要根据建库的需求,参考产业分类标准,进行合理安排。

图1 技术分解图

2.2 确定检索策略及数据处理

根据技术分解表,针对每一项细节技术,选取适当的中英文关键词和国际专利分类(International Patent Classification,IPC)或者联合专利分类(Cooperative Patent Classification,CPC),制定检索策略,进行检索,去噪,反复调整检索式,查验查全率和查准率,所有分支检索结果合并后即为上级技术分支的所有专利。

2.3 系统功能模块开发

技术分支及相关数据是专利专题库的核心,但是以什么样的方式提供给用户,是否需要其它功能模块,比如检索功能、分析功能等,需要软件工程师结合需求进行软件功能的设计和实现。

3 能源电力行业专利专题库建设

华北电力大学知识产权信息服务中心2021 年根据大学发展需求,开始着手建设首个能源电力行业专利专题库,2022 年12 月完成项目第一期建设,并将系统部署完成,对校内用户提供服务,运行良好。

3.1 建设背景

华北电力大学(简称华电),是由国家电网有限公司等12 家特大型电力集团和中国电力企业联合会组成的理事会与教育部共建的全国重点大学,是国家“世界一流学科建设高校”。华电的学科体系涵盖了火力发电和生物质、太阳能、风能、核能等各类新能源发电技术,以及输电、配电、供电等电力工业技术,已有相关领域丰富的研究成果。华电与电力企业几十年来在各个研究领域有着密不可分的合作关系,毕业生数量众多且遍布全国能源电力行业,华电被称为“电力黄埔”。因此建设能源电力行业专利专题库,对于大学的学科发展有着非常重要的推进作用。

对于能源电力行业,现有政府服务平台和行业网站提供部分技术的专利数据库,如:新能源、智能电网等,但仍然存在以下问题。一是产业覆盖面较窄。数据资源分布零散,单个数据库仅涵盖某一细分产业方向,没有整个行业的大型专利信息库。二是技术主题分类不规范。各类数据库采用的技术分解标准和方式不同,个别仍在沿用旧版产业分类。三是检索策略不严谨。对于同样的技术主题,各数据库的底层检索策略不统一,数据质量差别较大。有的数据库检索词过少,有的数据库甚至没有进行任何去噪。四是检索功能单一。部分数据库只能进行分类检索,不能满足数据遴选过程中的二次筛选需求。部分专利库只具有检索功能,不具备专利分析功能,而专利分析,尤其是可视化分析,能够即刻提供关于某个技术方向的申请趋势、申请人、发明人、技术生命周期等虽常规但重要的信息统计分析。

华北电力大学高校知识产权信息服务中心针对整个能源电力行业,建立能源电力行业特色专利专题库,具有以下特点。一是行业特色突出且集中。将各种能源发电和电力系统相关的专利信息到一个大平台,用户面更广。二是专利分类导航合理。提出科学的技术分解表,对庞大的能源电力行业专利信息进行合理的分类和导航。三是建库检索策略科学。依托学校的优势资源,由知识产权信息服务中心组织,联合检索专家和校内各细分领域的技术专家协同确定检索策略,保证专题库的数据质量。四是数据库检索功能丰富实用。多种检索方式可以提高用户使用专利信息库的灵活度,节省检索时间。五是专利分析功能简单实用。多维度可视化的专利分析。

3.2 建设思路

行业专利专题数据库的内容包括某一种产品或某一类技术为主题的全球专利信息数据集合,具有检索、统计、分析、数据管理、图表输出等功能[4]。本文所述能源电力行业特色专利专题库包含专利导航、专利检索、专利分析、系统管理四大模块,建设方法按照专利专题库的一般建设思路进行。

3.2.1 技术分解

本文首次提出建立能源电力行业专利专题库,能源电力行业不仅数据量庞大,而且涉及技术、产业和应用范围很广,技术分解可以有多种方式,每种技术分解的方法都可能有交叉,最后经过检索专家和技术专家的讨论和尝试,确定以电能生产消费的过程(发电、输电、变电、配电、用电)为基本框架,同时突出电能生产消费各环节中研究人员通常关注的重点技术内容。发电包括核电、水电、火力发电、风力发电、太阳能发电等各种发电方式及其并网,还包括了氢能和储能,输电、变电、配电、用电方面,则按照热点研究方向进行梳理,选取了柔性直流输电、柔性交流输电、超高压输电技术及电网设备状态检测等方向,最后加上“电力通信”和“电力信息物理系统”,共设定了27 个技术分支作为导航主分类(二级技术分支),并设定了次级技术分支以细化分类导航,全部技术分解已经完成。在具体建库方面,目前已经完成了第一期共15 个二级技术的建库工作,专利导航界面见图2。

图2 能源电力行业专利专题库专利导航界面

3.2.2 确定检索式

15 个技术分支下又有细分的技术分支,所以确定每个技术分支的检索策略和检索式,涉及若干个中英文关键词和分类号,需要联合不同领域的技术专家配合检索分析师进行工作,反复检索协商,工程浩大。数据清洗需要人工参与,也是非常耗时耗力的工作。

以制氢技术为例,首先用“制氢or 制造氢or制备氢or 产氢or 产生氢”进行试检,筛选出相关IPC 分类号并进行去噪,确定IPC=(C01B or B01J or C25B or H01M or H02J or B01 or C12P or C02F or C07C or C12R or C12M or C10J or C12N or C10G)NOT MIPC=A,然后对中文检索词进行扩充,在题目或摘要中使用“制氢or 产氢or 制造氢气or 氢气制造or 氢气生产or 生产氢气or 氢制造or 氢生产or制备氢or 氢制备or 氢气制备or 产生氢or 制高纯氢or 氢能生产or 氢能制造or(氢气1 W 提纯)”结合IPC 分类号的限制进行检索,然后按照相关性大小排列,结合人工判定,进行去噪,将题目或摘要中含有“加氢or 控制氢or 制氢化物or 制氢电极or 产生氢氧or 富氢杯or 轮胎or 膜筒or 沼气or 制氢氧or 抑制氢or 产氢氟or 化氢制备or 化氢生产or 化氢制造or 制氢氟酸or 产氢菌or 制备氢氧or 产生氢化or 产生氢迁移or 脱氢生产or 脱氢制备or 制备氢过氧化物or 制备氢氟or 制备氢氯氟”的数据去掉。这样,就构成了完整的中文检索式。用类似的方法构建英文检索式,中英文检索式结合后,再次进行人工去噪数据清洗,就可得到关于制氢技术专利的完整的检索式。

3.2.3 系统功能

系统功能包括专利导航、专利检索、专利分析、系统管理四大模块。

专利导航是系统的核心功能,35 万条数据按照15 个二级技术分支分类放置,一目了然,数据每2 周更新一次,用户可以直接点击查看感兴趣的技术方向,极大地方便了师生的科研工作。

专利检索功能方面,提供智能检索、高级检索、分类检索、批量检索、法律状态检索、二次检索等方式。充分考虑到各种检索需求,检索的灵活度也很高。

专利分析方面,可以进行申请趋势分析、申请人分析、发明人分析、地域分析、技术分析等。专利分析的结果以多维度可视化图表的方式展示,展示图表包括柱状图、折线图、饼图、气泡图、矩阵图、极坐标图、路径图等。图3 为“柔性直流输电”共8 303 件专利的专利分析功能的申请人分析示例,华北电力大学的申请量接近600 件,各申请人之间的对比也非常直观。

图3 柔性直流输电专利申请人分析

另外,系统还设计有“专利预警”功能,输入界面见图4,可以设置所关注技术的检索式,如果有相关专利出现,系统会自动进行提醒。

图4 专利预警界面

4 结束语

专利专题数据库是高校知识产权信息服务的重要内容,对大学的发展有重要作用。

专利专题库建设的关键是技术分解和检索策略的确定,需要检索专家和技术专家反复协商检索确定以全国首个能源电力行业专利专题库为例,说明了针对大学学科发展需要进行专利专题库建设的具体方法。

实例分析表明,基本框架和重点技术相结合的新的分解思路不仅能有效解决超大型行业数据库的技术分解难题,还能为科研人员提供更有参考性的分类目录,检索策略的确定则需要反复迭代去噪,才能在保证查全率的前提下尽量提高查准率。集专利导航、检索、分析为一体的专题数据库能满足科研用户的各种需求。

猜你喜欢
电力行业检索专利
专利
2019年第4-6期便捷检索目录
发明与专利
浅谈电力行业知识管理的集成信息化
电力行业的减排救赎
专利检索中“语义”的表现
电力行业的碳市大考
专利
电力行业项目费用归集浅谈
国际标准检索