长三角知识产权服务资源池开发技术及应用研究

2022-11-11 11:02张国成魏晨雨毛岱波
电子技术与软件工程 2022年15期
关键词:长三角检索架构

张国成 魏晨雨 毛岱波

(宁波市科技信息与发展战略研究院 浙江省宁波市 315048)

当前,长三角一体化战略已经上升为国家战略,但区域之间知识产权等科技服务仍存在着资源分布不均、区域协作机制不健全、高端服务业态较少、科技服务业与市场经济发展不匹配等问题,亟需整合区域优势知识产权资源,积极推广应用,为区域一体化发展注入新动能。知识产权服务资源池是以区域一体化资源共建共享为基础,覆盖知识产权创造运用与保护全链条的数据资源与服务工具集合,旨在区域层面探寻资源共建共享模式与技术,打造“一窗式”服务、“一站式”应用、“一体化”设计、“一键式”整合的知识产权服务系统,推动知识产权服务资源的高效配置与利用。

本文聚焦大数据时代下知识产权服务需求,针对长三角区域内知识产权服务资源分布较为分散、专利信息利用率低、知识产权数据资源巨量等问题,以知识产权资源汇聚与应用为根本,提出资源池架构设计方案与基于大数据的分布式资源池构建方法,研究相关资源组织模式、资源管理工具等,进而构建服务支撑长三角城市群知识产权运用的知识产权服务源池。

1 资源池建设思路

1.1 资源池开发目标

从资源池建设角度出发,以宁波、苏州获批国家知识产权运营试点城市、区域重点产业知识产权保护中心建设等战略发展机遇为契机,推动长三角知识产权服务资源汇聚;以政府部门推动、建立跨省市、跨行业、跨区域知识产权联盟等方式,推动资源共享,并协调负责相关工作开展,充分发挥资源效用,优化资源布局,研究面向资源池构建的组织模式、资源管理调度及体系架构。

1.2 资源池组织模式

长三角知识产权服务机构众多,知识产权服务需求旺盛,为充分发挥资源效用,优化资源布局,促进区域内技术成果与技术需求高效对接、成功转移,研究面向资源池构建的知识产权资源组织模式,包括知识产权相关数据资源、服务资源和应用工具集等的优化组织。

1.3 资源池管理和优化调度

针对各类资源研发资源收集器,将分散在长三角各个平台和地方的知识产权数据资源、服务资源、工具资源等三类海量资源进行集成,实现从孤立、分散状态到统一集中状态。研究资源池内资源的安全运行、管理和利用模式,研发资源管理、资源匹配、资源共享、业务协作等一系列工具,探索基于资源虚拟化的云服务优化调度模式,实现对资源池内资源的动态管理、优化调度,消除信息不对称问题,打破原有架设方式、地域或物理组态限制,降低信息收集和利用成本,满足对分散于长三角各城市企业的个性化需求,服务长三角产业创新。如图1所示。

图1:知识产权资源池管理和优化调度示意图

2 资源池总体架构

2.1 应用架构

长三角知识产权服务资源池面向个人及企业用户(含普通企业、高校院所等),总体应用架构涉底层支撑、服务集成与门户。底层支撑含统一资源云、数据和平台三项服务,其中,资源云服务提供知识产权及附属资源的数据仓库等;数据服务包括统一的数据标准、数据交换标准、数据可视化规范和数据挖掘工具方法等;平台服务包括统一用户模型、权限规范和目录服务。服务集成包括数据交换、消息订阅、服务订单、统一工作流引擎、数据集成、通用API接口规范和Quartz轮询方案等。依托服务集成,资源池可提供的前端门户含数据检索、融合分析、专利预警、专利价值、专利地图展现等。

2.2 技术架构

长三角知识产权服务资源池是以资源池服务为基础的综合性管理服务平台。可基于SOA技术架构,将传统MVC模式下的业务逻辑层,从逻辑设计上耦合分离业务逻辑、业务服务及业务流程,实现技术标准化,达到业务服务在业务与组织两个层面的标准化与统一性、业务逻辑多样性与继承性、业务应用流程化。具体设计如图2所示。

图2:总体应用架构

底层资源访问需促进资源池服务标准化。IT集成与业务集成系其天然能力,最上层级展现层可为业务界面与交互操作提供各种渠道接入和服务消费方式。SOA标准技术架构既可继承过去IT投入所积累的应用资产,亦可应对业务发展对技术架构的所需。标准化SOA技术架构可助力落实数据应用基础服务发展策略、提升IT与业务的一致性。

2.3 数据架构

长三角知识产权服务资源池包括源数据层、数据导入层、数据集市和交互数据层等部分。根据知识产权数据运用需降低知识产权数据颗粒度、挖掘专利文本、匹配行业特征等特征,资源池整体数据存储规划分设计为七个部分:主数据区、业务系统数据区、数据加工清晰区、数据仓库(DW)、数据集市(DM)、原始数据域和交换数据域。数据存储平台包括数据总体架构逻辑与物理分布。数据逻辑分布设计,即分析数据的业务,分析数据在业务各环节的创建、引用、修改或删除的关系。数据逻辑分布是数据物理分布的基础,以业务架构为指导并严格遵从该架构,具体部署原则为:集中处理、统一共享;当期数据与临时、历史数据分离;操作型数据与分析数据按不同组织方式分离;公共基础数据与应用数据分离;业务数据与元数据分离。如图3所示。

图3:技术架构图

2.4 集成架构

集成架构重点关注系统间协同关系及未来需共享的支撑环境,实现对知识产权资源池中多个功能应用的支撑,避免应用系统各自为政导致整体应用环境混乱。因此,采用烟囱式格局,对各类全局性机制事前控制。基于上述思路,集成架构规划围绕应用、数据及安全三个层面展开。其关键实现目标包括:跨系统全局性应用集成环境,形成所有系统需共同遵循与使用之各类标准、框架及平台;完成数据集成之环境设计,定义出数据集成环境,按照不同场景明确数据集成应用模式;基于安全架构规划内容,从认证、授权等各层面定义应用系统与安全体系的集成机制。

3 基于大数据的分布式资源池构建方法研究

长三角知识产权资源池汇聚了长三角区域知识产权及服务相关数据资源近亿条。为支撑如此庞大的数据量,采用了基于Hadoop的大数据存储技术。Hadoop是一个可靠的、可扩展的分布式计算框架,Hadoop特别适合大数据处理任务,它可以部署在一台到几百台普通计算机节点上运行,利用分布式文件系统提供大量数据的存储,利用并行的编程模型对存储于分布式文件系统中的大量数据进行处理与分析。Hadoop集群中每个节点都能提供本地存储和计算,并且所有节点的本地存储和计算可以统一组织起来形成规模更大、效率更高的存储和计算集群。

HDFS是Hadoop中用于大数据文件处理的分布式文件系统,并且是具有容错性的分布式文件系统。它对进行文件流读取的大型文件进行了优化,而且和I/O吞吐量相比,时效性更高。HBase是HFDS基础上的结构化数据库系统,通过主键Key以及Range来检索数据,适合存储松散数据,能够为长三角平台用户提供对大数据的实时访问。具体框架图如图4所示。

图4:Hadoop基本框架

4 长三角知识产权服务资源池开发

汇聚形成了数据资源、服务资源、工具资源,搭建了知识产权资源汇总、专题库定制、服务机构、培训课程、专利价值评估、专利地图、专利预警、知识产权检索等功能模块。

4.1 知识产权数据资源集

目前,汇聚了专利基础数据资源、专利扩展数据资源、商标、版权等知识产权相关数据资源,构建知识产权数据资源集,并结合长三角产业创新需求,收集产业现状、教育资源、服务资源、市场竞争等信息,构建以专利为核心的重点优势产业创新数据资源集,目前,资源池已汇聚超8000万条知识产权数据。

4.2 知识产权服务资源集

汇聚长三角范围内相关知识产权代理、评估、交易、转化、托管、投融资、律师事务所等中介机构,以及战略分析、信息咨询、维权中心等研究院所和专业服务机构,与国内外一流数据提供商、第三方咨询机构、培训机构等开展深度合作,形成覆盖知识产权全过程的服务资源集。目前,已收录了宁波、杭州、合肥、苏州、南京及上海6个长三角重点城市知识产权服务机构共计170家;收录了涉及运营管理、专代考试、专利法律、专利分析、专利检索、专利申请及专业领域培训视频共计259个。

4.3 知识产权工具资源集

以知识产权基础数据资源库为基础,通过攻克基于CFSFDP聚类的专利地图、基于数据挖掘的企业技术竞争及专利分析技术研究、基于大数据的知识产权定价评估等关键技术,形成覆盖研发初期创意形成、研发立项—研发中期技术攻关、协同创新—研发后期技术成果化、成果产业化等全过程的一系列知识产权应用服务。

(1)专利价值评估。通过输入专利申请号(公开号)对专利进行价值评估[3]。模式一:基于专利的著录项信息、法律信息及审查信息进行价值评估的参考结果,从专利稳定性、专利保护范围、专利技术应用性及专利技术质量4个方面评估专利,最后再通过加权求和得到最终分。模式二:基于市场交易行为进行价值评估的结果,从市场吸引力、市场覆盖、技术质量、申请人得分及法律得分评估专利得分,最终通过参考海外专利交易数据库信息,给出专利市场交易价值供用户参考。

(2)专利地图。用户可对检索到的专利数据能进行直观、可视化3D地图展示和数据分析[4],满足识别技术领域中的各家公司的技术分布,寻找合作伙伴、新进入者和可并购对象;对标竞争对手,识别优劣势;快速验证创新提案,帮助判断侵权风险的可能性,降低投入浪费;了解技术发展现状和专利布局态势,识别技术热点、发现技术空白。用户通过专利名称、摘要、公开号、申请号、权利要求、发明人等信息进行专利检索生成专利集,选取专利数量进行3D地图构建,最高可支持选择10000条专利。选好专利后系统将对所选专利按申请人、发明人、当前权利人及分类号等维度进行汇总,按用户需求绘制专利地图,同时还提供动态演示图,并支持导出、快速定位单件专利、诉讼专利区域等功能,为企业技术研发方向提供参考。

(3)专利预警。基于全国专利数据库,开发了专利预警(检索表达式新增预警)及专利法律状态预警功能。用户通过一系列条件限定形成检索表达式,将检索结果添加至专利预警库,按周自动更新专利预警库中每条检索表达式对应的专利数据,同时将记录保存在用户专利预警库中供用户查看。支持对用户关注的单条专利法律状态进行预警,用户添加需预警专利至法律状态预警库,若法律状态预警中收藏的专利法律状态发生变化,会在该法律状态预警对应的专利列表中将这些专利标红展示。

(4)知识产权检索。对外提供专利、商标、作品、软著等数据检索接口。其中专利检索首页提供快捷检索功能,含表格检索、失效检索、有效检索、专家检索、判例检索(无效/复审检索、专利判决检索、裁判文书检索)、语义检索、批量检索及法律状态检索(中国专利法律状态检索、专利权利转移检索、专利质押保全检索、专利实施许可检索)。针对国内专利,提供分类导航,从IPC、LOC、国民经济导航、地区分类导航、专利密集型产业五方面提供快捷检索功能。

4.4 专利信息管理功能模块

该模块可对相关区域专利信息进行管理,主要功能包括相关区域专利信息管理、专利信息统计、专利信息筛选、二次检索、法律状态分类、专利类型分类等。帮助创新主体、各类机构、政府部门等完成专利日常管理,解决专利工作中管理不善、意识不强、人才匮乏等问题,提升专利信息化水平、管理能力。针对已完善单位信息的用户提供单位专利管理功能,用户可在该页面快速查看所在单位所有有效专利,及时掌握专利缴费信息,支持用户查看专利法律变更状态。

4.5 知识产权分析管理功能模块

通过制定各类专利集合,利用数据清洗、数据标准化、数据标引和常规统计分析、自定义分析、关联分析、申请人阶段分析等分组统计工具,达到分析产业及相关技术的发展趋势与状况,发现技术新分支和产品应用方向、分析竞争对手战略意图,了解竞争对手技术特点与状况、寻找技术合作合作伙伴,指导技术贸易、获取最大利益等目的。针对企业知识产权侵权纠纷等问题,以宁波市为试点,针对高新技术企业及上市企业两类机构从总量、申请趋势、发明人、技术领域等多维度进行企业竞争分析。针对部分龙头企业进行企业专利参数横向对比。

4.6 专题库定制功能模块

针对特定领域专业特点和用户特色需求形成产业专题库,目前已搭建166个一级产业专利数据库,二级三级产业专利数据库合计1400余个。用户点击任意一节点产业即可查看属于该领域的专利清册。已为TCL移动通信科技(宁波)有限公司、宁波敏实集团、宁波聚嘉新材料科技有限公司及宁波迪泰电子科技有限公司等多家核心企业用户,提供了专题库定制服务,便于企业用户快速查与其经营领域相近技术领域专利的申请情况。

5 结论

本文通过对长三角知识产权服务资源池架构设计、分布式构建技术研究、系统开发,探索资源深度利用、广泛共享、增值服务,实现了资源从点状分散分布向统一集中管理,形成了专利信息管理、知识产权检索、个性化服务、专利分析管理、专利地图、专利预警、企业竞争分析、专题库定制等功能,提升知识产权服务效能,支撑了区域科技创新服务体系建设。

猜你喜欢
长三角检索架构
基于FPGA的RNN硬件加速架构
紧扣一体化 全面融入长三角
功能架构在电子电气架构开发中的应用和实践
“首届长三角新青年改稿会”作品选
2019年第4-6期便捷检索目录
LSN DCI EVPN VxLAN组网架构研究及实现
专利检索中“语义”的表现
长三角瞭望
长三角瞭望
一种基于FPGA+ARM架构的μPMU实现