刘娜 张敖木翰 黄莉莉 张莉
【摘 要】 为进一步加强海事数据管理工作,提高海事数据质量和共享使用水平,采用对直属海事系统进行问卷调查的方式,调研海事数据管理与使用中存在现阶段海事数据在完整性、准确性、一致性和及时性等方面和信息系统建设、信息系统使用和相关保障机制等方面都有待完善的问题,分析问题产生的原因,并提出尽快制定出台数据管理办法等制度文件,抓数据管理要从信息化建设阶段开始并覆盖数据全生命周期,积极推动数据共享開放,确保数据安全等对策建议。
【关键词】 海事信息化;海事数据管理;数据共享;全生命周期
0 引 言
海事部门一直高度重视信息化建设,“十二五”规划期之前,海事信息化主要采用“统一建设、下发使用”的模式,在海事监管、执法等实际工作中发挥了积极作用,但“烟囱”式系统开发加大了应用系统集成和信息资源整合的难度[1],导致“信息孤岛”现象严重,无法满足各直属局、分支局和其他口岸管理单位的横向业务需求。对此,在“十二五”期间,交通运输部海事局(以下简称“部海事局”)以强化信息共享和资源综合利用、打造全国统一的海事信息化支撑平台为目标,组织制定并印发了《海事信息系统顶层设计》,形成了海事两级云数据中心基础框架和“一个目标、二个模型、四套体系”的总体框架,有效解决了海事信息系统建设缺乏统筹、信息资源分散不均衡的问题。随着海事信息化建设由单一独立向综合统筹转变,数据资源之间的横向交互、业务协同也日趋频繁,同时也暴露出诸多数据单独使用时难以发现的问题。
现有海事数据研究集中于数据应用和共享,少数的数据管理研究侧重于某一区域的某一业务领域,且管理措施主要依托信息系统自身功能来实现,代表性和全面性不足。为推动海事大数据健康发展、促进海事数据价值挖掘,笔者对直属海事系统进行问卷调查,全面了解海事数据管理使用现状,总结存在的问题,提出对策建议,为管理部门决策提供依据。
1 海事数据资源部署现状
根据《海事信息系统顶层设计》,海事信息系统和数据资源按照集中与分布相结合的原则进行部署,集中系统部署在部海事局一级数据中心(北京中心和上海中心),各直属海事局、地方海事局可直接访问集中系统;分布系统部署在部海事局一级中心和直属海事局、地方海事局二级数据中心,采用数据交换和应用集成技术形成逻辑上统一的数据和系统。海事数据资源部署情况见图1。
一级数据中心建有船舶、船员、船企、载运货物、通航环境和综合管理基础数据库,同时集成直属海事局的相关业务系统,集中存储与船舶、船员、航运公司、相关企业、支撑能力、资源和海事内部管理有关的核心数据。
二级数据中心主要存储具有鲜明属地特征的本地海事业务管理以及跨区域共享需求的数据,有船舶出入港、货物、水文、天气、航标、航路等信息,数据量较大。
两级数据中心通过服务总线Service Bus实现数据的上传和下发。
为使一级数据中心与二级数据中心之间、海事系统与外部相关单位(如口岸单位、中国船级社等)之间的数据实现共享,部海事局组织开展了海事共享数据库工程建设,形成海事数据内外交换共享总枢纽。
目前,两级数据中心基础框架已建设完成,并实现各类数据在一级数据中心的汇聚、清洗和整合,建立了船舶、船员等基础数据库,积累了大量丰富的数据资源。海事共享数据库系统已投入运行,成为海事系统内部及对外数据共享工作的重要依托。
2 调查问卷设计及问卷统计结果
2.1 问卷设计原则
考虑到问卷的发放形式和填答时间要求,问卷设计原则除了目的性、逻辑性、通俗性等通用设计原则外,还增加了完整性、具体性和开放性原则。
(1)完整性:问卷内容包括海事数据管理和使用,以及使用问题、原因及对策等内容,提高调研结果的逻辑性和合理性。
(2)具体性:基于海事数据管理部门、技术支持部门日常发现和收集的问题、原因等设计选项,将问卷调研问题具体化,提高被调查对象的认同感,使其认真作答。
(3)开放性:问卷适量加大了主观填写题的比例,以求全面反馈情况。
2.2 问卷发放与回收
海事数据管理现状问卷调查覆盖15个直属海事局,回收近百份有效问卷,为全面了解海事数据管理和使用现状提供了依据。
2.3 问卷统计结果所反映问题
问卷调查结果显示,直属海事系统数据管理机制较为健全,具体表现为:86%的海事局有数据管理专职或兼职人员;59%的海事局制定有数据管理和使用制度;62%的海事局建立了数据备份制度及配套备份制度;86%的海事局对开发公司或外部单位提供数据或数据服务时签订数据保密承诺书或保密协议;72%的海事局与信息化管理部门的数据管理人员签订了信息安全责任书。海事数据在直属海事系统使用情况总体良好,65%的调查对象使用了部局下发的数据,其中51%的海事局认为数据下发能够满足日常协同监管要求。
问卷调查结果也反映出海事数据在完整性、准确性、一致性、响应及时性等方面存在需要解决的问题,具体如下:
(1)数据完整性方面:①数据下发过程中数据表(主表、子表)或数据项下发不全,导致无法还原成完整的业务记录数据,收到的数据无法使用;②存在必填数据项或用数据字典方式采集的数据项内容为空白的情况。
(2)数据一致性方面:①下发的数据内容比生产系统的数据内容少,共享库信息更新不及时,与生产系统信息不同步;②存在多个系统共用同一数据,在数据名称、定义、内容(静态属性)上不一致的情况;③同一系统中同一对象的同一属性信息不同;④同一系统中不同对象具有相同属性信息。
(3)数据准确性方面:①部分指标数据存在逻辑性错误;②已发现的错误数据迟迟未修改纠正;③源头数据由非源头系统采集;④一些系统数据存在乱码或测试用例数据。
(4)数据响应及时性方面:数据调用缓慢。
3 问题存在的主要原因
(1)信息系统建设方面:首要原因是数据采集多源头,同一数据由各应用系统独立分头采集,相关系统间未作关联,占比(选择该项内容的单位数量与被调查单位总量的比值,下同)64%;其次是系統建设重功能轻性能,对大量的高并发数据的传输、处理和汇聚缺少预研和压力测试,难于满足实际生产需要,占比53%;再次是信息系统数据字典维护缺乏集中统一的管理和发布,多系统各自可修改,占比43%;最后是信息系统录入数据时缺少数据字典引用、必填项控制,内容填写随意、系统保存数据时缺失逻辑校核和合规性检验,占比41%。
(2)信息系统使用方面:主要原因是使用中不清楚表间关系、一数一源标识及数据有问题、日常电子政务和海事监管应用需求与共享库数据支撑有偏差,占比53%;其次是业务人员在业务办理时对数据维护不及时,信息未及时记录在系统中,占比38%;此外,系统使用的操作培训次数不够,接受过培训的人员工作调动后,尚未接受培训的新到岗人员的系统操作水平不如前任。
(3)保障机制方面:首先是缺乏发现数据问题后反馈问题的机制和渠道,占比55%;其次是缺乏发现问题后及时纠错的渠道,占比53%;再次是缺乏保障执行和遵从统一数据标准、数据字典的有效监管机制和手段,占比42%;最后是缺乏保障从生产库写入共享库数据记录及对应数据项的完整性校验机制,占比38%。
具体原因与导致问题的对应关系见表1。
4 对策建议
(1)建章立制,出台海事数据管理制度规范。数据管理是一项需要人员、资金、话语权的系统性工程,为保障各项工作顺利推进、高效衔接,必须首先制定管理办法等制度文件,明确数据管理归口部门、技术支持部门、使用部门等主体,以及工作职责、工作流程等内容,形成过程管理、问题反馈等工作机制,为及时有效地发现和解决数据管理和使用问题提供组织保障。
(2)追本溯源,前置数据管理相关要求于信息化建设之初,并贯穿数据全生命周期。大数据是信息化发展的新阶段,信息化是数据的源头。从调查结果看,当前海事数据使用中发生问题的主要原因与信息化建设有关,所以海事数据管理应从信息化建设阶段抓起。为信息化建设提供统一规则,制订数据元修订、数据库设计、信息资源分类等信息化标准,编制海事数据资源目录、海事业务数据字典等技术规范,从源头消除数据问题;在信息化立项申请、系统设计阶段就明确数据库设计要求和内容,并在建设方案、需求分析、详细设计及系统开发、试运行等信息化建设过程中持续开展设计合规性、一致性审查,保证设计内容的真正“落地”。此外,针对数据的流动性,数据管理应覆盖数据采集、传输、存储、处理、共享、使用等全过程,全面保障数据质量和安全。
(3)统筹兼顾,积极推动海事数据共享开放和安全发展。推动数据资源整合共享和开放应用是政务部门落实国家大数据战略的重要举措。目前,国家和交通运输部均已通过信息资源目录、交通共享平台等抓手推动跨部门、跨地域、跨层级的数据共享,并取得了显著效益。海事系统对于系统内外的数据共享有着迫切需求,应以海事数据资源目录和海事共享数据库为依托,积极开展直属海事之间、直属海事与地方海事之间的数据共享,提高业务协同效率;通过对接部级数据交换共享平台,实现海事系统与交通运输其他系统、国家级政府部门之间、省级政府部门之间的数据共享,促进海事数据效益发挥;加强海事数据安全管理,进一步健全海事数据安全保障机制,建立数据分类分级等管理和使用的安全规则,切实做好数据采集、传输、存储、处理、共享、使用时的安全保障工作。
5 结 语
数据管理已成为大数据战略下的重要命题。相较于数据交换共享机制和支撑工具建设,海事数据已同时进入到数据共享使用后的问题反馈和质量提升阶段。笔者以海事数据管理使用现状问卷调研为基础,总结分析直属海事系统在海事数据管理和使用中的问题及成因,并从制度建设、数据管理源头、数据覆盖范围、数据管理重点等方面提出对策建议,以期为海事数据管理工作提供参考。
参考文献:
[1]薛娟.关于海事信息化建设的几点建议[J].管理观察,2010(15):59-60.