梁玮
摘要:本文分析了当前专利实质审查工作中产生的各类业务数据,并发现这些数据保存分散、综合运用不多的问题,本文结合数据库设计的整体思想,并通过数据库设计的几个步骤,将上述数据如何在数据库中保存或展示进行了详细讲解;最后,介绍了如何在广泛使用的MySQL数据库中实现,并简单展望了如何通过B/S模式更好的进行数据管理。
关键词:专利实质审查业务数据 实体-联系模型 数据库
中图分类号:TP311 文献标识码:A 文章编号:1007-9416(2016)08-0197-02
1 前言
专利实质审查是一项综合的工作,在专利实质审查过程中会产生大量的业务数据和相关信息。从审查员的角度来看,相关的业务数据包括好几方面的内容:第一,相关的培训信息,包括参加集中培训的信息,参加中心和部门培训的信息;第二,开始进行实质审查后,每件案卷的信息,包括申请号、进案日期、出案日期、出案类型等等;第三,审查业务部和部门对案卷进行质量检查后,质量检查的相关信息;第四,审查业务部运行过程中的其他信息,包括:课题信息、优秀案例信息等等。
在日常业务的运行中,笔者发现虽然这些信息对于全面掌握审查工作开展情况及审查员的业务情况具有重要作用,但是目前在信息的存储和获取过程中存在很多不便之处,比如:信息被不同的实审部门或者审业部的不同处室掌握(例如,培训信息在审业部的培训室,案卷信息在协调室,中心质检和部门质检信息分别在中心质检组和实审部门),并且存储方式不一,要综合利用这些数据难度较大。
在计算机应用高度发达的今天,绝大多数企业和事业单位往往将数据存储在数据库中。数据库是为了将数据更有序保存,并且让众多用户共享信息而建立的,已经摆脱了空间地域的限制。不同用户可以按各自的方式使用数据库中的数据,多个用户也可以同时共享数据库中的数据资源。同时,数据库还具备发现故障和修复故障的功能,因此数据库同时也是数据的“保险箱”[1-2]。因此,本文着重讨论为专利审查的相关业务信息在数据库中的保存的解决方案。
2 数据库系统的设计与实现
数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,是指能够有效地存储数据。数据库设计一般遵循的原则包括:数据库结构的合理性、完整性、全局性;数据库对象的独立性。
数据库设计过程一般包括以下几个步骤:(1)明确数据库设计目标。通过了解用户需求,明确数据库设计的目的,并收集相应数据;(2)数据库的概念设计;(3)数据库的逻辑设计;(4)数据库的实施与维护。
2.1 明确数据库设计目标
对于一个复杂的系统,由于业务需求和数据之间的关系错综复杂,为了使得实体-联系模型(即E-R模型)能尽大限度的表示各种数据关系,首先要对数据进行全面的收集、整理及分析[3]。
经过广泛的调研后,获得专利审查业务信息管理系统的主要功能简述:审查员信息查询(包括培训信息、质检信息、案卷信息);质检信息统计(包括按部门、处室、期次的统计);案卷信息统计(包括任务量信息、周期信息、授权率驳回率视撤率)等。
2.2 数据库的概念设计
由上面的分析得到,本系统涉及到的相关实体如下:审查员是一个消息的实体,多个审查员组成的室和部门也是一个实体;审查员参与的业务培训(包括中心常规培训、部门常规培训)也是一个实体;审查员处理的案卷和质检的案卷都是实体;将这些实体联系起来的是审查员。
进而可以得到各实体之间的实体-联系模型(即E-R模型),如图1所示。
2.3 数据库的逻辑设计
数据库的概念设计之后是逻辑设计,现在的主流数据库管理系统为关系模型,逻辑设计也可以简单理解为将E-R图转换为关系模型[4-5]。
按照上面的E-R模型,将各个实体逐一转换为关系模型。对于“审查员”实体来说,实体标识符(主键,Primary Key)应当是其独一无二的审查代码,其他相关的信息包括:入中心时间、期次、个人信息等,由此得到“审查员”的关系模型:
审查员(审查代码(PK),姓名,入中心时间,期次,性别,部门,科室,职称)
对于“业务培训”实体,其主键应当是序列号,其他的信息包括:培训级别(包括中心级、部门级、室级)、开展日期、主讲人、主题、参与人员等等,由此得到“业务培训”的关系模型:
业务培训(序号(PK),培训级别,组织机构,开展日期,主讲人,主题,参与人员)
按照上述分析方式,可以得到其他实体的关系模型:
发明案卷(申请号(PK),发明名称,分类号,审查员代码,申请日,进案时间,各次通知书发出时间,通知书所引用的法条,是否进行过检索,是否引用X/Y/E/R文件,通知书次数,结案时间,结案类型,)
其中,通过审查员代码可以关联到审查员实体,进而获得审查员的其他相关信息。
质检案卷(申请号(PK),质检级别(中心级或部门级),发明名称,审查阶段(一通或中通或驳回或授权或前置或二次结案),质检案件类型(常规或会审或PPH或外部反馈),审查员代码,领域(机械或电学或化学),质检员姓名,是否引用X/Y文件,引用的X/Y文件是否有效,质检结论(结果问题或过程问题),问题种类,具体问题类型,涉及权利要求,涉及法条,三性原因分析,漏检原因分析)
处室(序号(PK),处室名称,所属部门,室主任,组成人员(包括各个审查员的审查代码))
部门(序号(PK),部门名称,部主任,所有室主任,组成人员(包括各个审查员的审查代码))
2.4 数据库的实施与维护
下一步需要将转换后的模型在数据库上进行实现。作为当今最流行的开源数据库,MySQL数据库为用户提供了一个相对简单的解决方案,能够方便的进行部署和管理,能够跨平台使用(包括主要的Linux、Mac OS X,Unix和Windows)。笔者选用的是MySQL数据库(版本为:5.6.24)。
将上面转换的模型直接映射成MySQL上的表,可以通过两种方式实现:命令行方式,或直接用MySQL的管理工具。进一步,将所有的数据全部导入后,可以通过SQL语句方便的进行数据查询和统计了。例如,每个审查员的各维度数据都有记录,可以从各个维度反馈综合反映审查员的个人档案;定时可以方便的了解各科室或部门的任务量完成情况、周期情况、宏观比率(案卷的授权率、视撤率、驳回率、XY率)、质量情况;在审查员进行续聘前或者评选职称前,可以了解其在最近的几年内审查的任务量完成情况和质量情况以及参与培训的情况。
当查询的需求比较复杂时,仅仅是MySQL自带的管理工具或许会难以胜任。这种情况下,开发B/S平台进行管理,如图2所示,选用Jsp+Servlet+JavaBean开发模式JSP作为视图,用来表现页面;Servlet作为控制器,控制程序的流程调用业务进行处理,JavaBean封装了业务逻辑,该模式遵循了MVC设计模式,充分体现了JSP与Servlet自身的优点。
3 结语
在越来越多运用大数据进行数据分析和问题挖掘的今天,数据如何安全有序的进行存储是首先需要考虑的问题。而关系数据库因为其安全易用,可以作为专利审查过程中业务数据的存储和管理工具。本文在分析了常用的专利审查业务的需求基础上,按照数据库概念设计、逻辑设计、实施和维护的步骤,将错综复杂的审查业务数据进行了梳理,并在MySQL数据库中进行了实现。
参考文献
[1]萨师煊,王珊.数据库系统概论(第3版)[M].北京:高等教育出版社,2000:1-80.
[2]Rob P,Coronel C.数据库系统设计、实现与管理(第6版)[M].张瑜,杨继萍,等译.北京:清华大学出版社,2005:64-100.
[3]罗军,吕德文,陈松,李茜.基于E-R模型层次化的录入技术[J].重庆大学学报:自然科学版,2003,26(7).
[4]姜翠霞.E-R模型向关系模型转换的研究[J].齐齐哈尔大学学报,2004,20(4):58.
[5]年轶,林琳.E-R图向关系模型转换规则的研究[J].微型电脑应用,2004,20(1):12-14.