基于云计算的宁波市民生档案共享应用平台开发初探

2016-02-03 08:53宁波市档案局
浙江档案 2016年9期
关键词:档案馆民生服务器

陈 霄/宁波市档案局

数字化时代,建设宁波市民生档案共享平台,能够创新民生档案工作的工作模式与工作理念,提高民生档案资源的共建共享水平,提升档案部门的公共服务能力,提高公众满意度。利用云计算技术建设民生档案共享平台,需依照软件系统生命周期推进,即从系统设计到后期维护,要按照结构化、流程化的方式定义各个阶段。平台建设可采用瀑布模型,从计划、分析、设计、开发、测试、实施与维护等七个阶段依次展开。

1 平台的计划

制定计划时需明确平台界线,应明确平台建设范围为宁波大市区域,以实现市本级与市属县(市、区)档案部门的联动,以及市档案系统与市民生档案形成部门的相互配合,在此基础上实现民生档案共享,提高民生档案服务水平。本环节需要制定平台建设详细的项目方案,以甘特图为例,可设置7个主任务,每个主任务设置二级任务,二级任务下设任务明细,明确平台建设各个阶段涉及的工作、工作责任部门与责任人、需要配合的资源、工作预估时间,等等。

2 平台的分析

平台的分析包括用户需求分析、平台参与者需求分析和需求说明书编制。用户需求是平台的核心内容,用户需求分析包含3个任务明细:其一,从公众视角出发编写调研方案,需要注意针对不同人群采取不同调研方式,同时还要设计问卷表、设计实地走访大纲、设计在线征集方案、设计专家需求意见提纲,并明确工作时限及工作目标。其二,需求收集,指派工作人员根据调研方案分批进行收集工作。其三,整理用户需求,用户对民生档案共享利用的需求主要体现为一站式查询、获取相关的其他各类民生档案、简化档案利用手续、支持多种方式获取民生档案信息等。

平台参与者包含市档案馆、县(市、区)档案馆、民生档案形成单位和政务云管理单位,平台参与者需求分析包含6个任务明细:第一,编写调研方案;第二,收集市档案馆需求;第三,收集县(市、区)档案馆需求;第四,收集民生档案形成单位需求;第五,收集政务云管理单位需求;第六,进行需求整理。此阶段的重点是明确市档案馆与县(市、区)档案馆间的互联工作,以及各民生系统与共享平台间接口、平台与政务云的衔接工作等。

在编写需求说明书阶段,要根据需求重要程度和项目开发顺序,将获得的需求进行归集和排序,并依据软件开发规范进行编写,确保说明书的内容尽可能详尽。

3 平台的设计

设计的核心内容是将用户以自然语言为主提出的需求说明书与平台建设时系统能理解的技术性语言进行联系。在这一环节,需将云计算开发技术与需求说明书相结合。设计环节主要工作包括概要设计、概要评审和详细设计,其中,概要设计包含选定可行方案、编写可行性设计方案书;概要评审即组织专家召开专家评审会,对编写的概要设计书进行评审;详细设计包含平台整体设计,分为平台框架设计及平台模块设计。

4 平台的开发

首先,为提高软件开发规范性,需要对合作的开发商进行资质限定,应要求开发商具备较强的软件过程控制能力,以降低软件开发风险。其次,可采用Hadoop云计算框架。Hadoop是一套开源框架,其模型简单、易于理解、易于使用,它主要分分布式存储和分布式计算这两个层次,含DHFS分布式文件系统、MapReduce分布式云计算技术、Common公共组件、Yarn分布式操作系统四大模块等。

其中,DHFS分布式文件系统采用主服务器(Master)附属服务器(Slave)进行构建,能够提供具有较高扩展性、可靠性、容错性的分布式存储服务,它适应当前民生档案分散保存于各个民生档案形成单位及各级档案馆的现状,有利于实现民生档案信息的统一管理。在本次平台开发过程中,可以在宁波市档案局搭建一台主服务器,并在属于建设范围内的民生档案形成单位和县(市、区)档案馆设立若干附属服务器。服务器可采用虚拟服务器的模式,便于附属服务器的增减,使平台具有更强的灵活性。市档案局主服务器可作为管理文件系统的命名节点(Name Node)和管理命名空间(Namespace),并协调客户端的访问;附属服务器可作为数据节点(Data Node),保存由主服务器分配的数据。在平台开发过程中除利用DHFS基础的分布式存储功能外,还可使用其安全保障技术,通过用户和文件级认证、机器和服务级认证的方式,为民生档案数据提供强有力的安全保障。

Yarn分布式操作系统主要提供管理服务器集群的计算资源,如中央处理器(CPU)资源和内存(Memory)资源,以及提供客户端访问系统的接口(API)。其结构与HDFS的主服务器(Master)附属服务器(Slave)体系类似,并能够将资源管理与任务调度拆分。

MapReduce是发挥并行处理能力的核心算法,需要使用Yarn进行资源调度。开展民生档案共享工作需要从海量民生档案数据中迅速找到所需的档案,然而这并非易事。MapReduce给出了一种解决途径,它分为映射(Map)过程和归约(Reduce)过程,其中,Map对一部分原始民生档案数据进行指定操作,不同Map间没有交集,这使得它们可以在Yarn系统中并行操作;Reduce对每个Map部分中间结果进行合并操作,且每个Reduce处理的内容互不重叠,这使得Reduce也可并行操作,最后只需将所有Reduce产生的结果进行连接即可。这样可充分利用云计算的计算能力,在较短时间内完成分布式民生档案数据查询工作。服务的响应时间是民生档案共享的关键所在,当公众发起民生档案利用请求时,MapReduce算法能大幅提高服务效率,满足公众的并发搜索请求。

再次,民生档案共享平台应用模块开发主要包括民生档案数据管理、同步共享管理、共享服务管理三大模块的开发。其中,民生档案数据管理关注非结构化的、以图像数据为主的民生档案的管理、查询、计算、存储。运用非结构化及关系型数据库的协同,搭建完整的数据平台,以民生档案数据驱动共享服务。管理应用需包含民生档案数据采集、数据整理、数据管理等基本功能。应用民生档案同步共享,适合采用云爆发架构的弹性扩展,建立动态的扩展形式,民生档案上传虚拟服务器时,若上传的资源到达预设的阈值,民生档案共享云会自动调配内部IT资源扩展(爆发)到档案云中,当不再需要时,将该IT资源归还到原先内部环境中。此外,可利用云计算和分布式计算特性,在民生档案同步共享过程中对计算资源、存储资源进行协同分配,降低工作峰值时云环境的压力,提高服务效率和服务质量,提升公众满意度。

5 平台的测试

测试的目的是确保民生档案共享平台正常运行,满足业务需求。未经严格测试的软件产品,往往会在用户使用中出现各种问题,甚至会发生系统崩溃的问题,严重影响用户体验和用户数据安全。在测试工作中,需要定义一系列细化内容,这些内容应涵盖平台从底层到页面所展现的方方面面。测试按照用户实际应用中的流程环节进行,即模拟现实场景,对流程中所有功能点进行测试用例的编写,并将这些测试用例汇集成测试手册,再根据测试手册安排相应测试工程师对整个平台按步骤进行详细测试。平台测试按照方式的不同,可分为单元测试、系统测试、集成测试。

6 平台的实施

平台的实施即发布民生档案共享平台,让所有参与者使用。平台的实施可采用试运行加正式运行的方式,分为用户使用说明书编写、平台宣传、业务培训、平台试运行和正式运行等步骤。在用户使用说明书编写阶段,开发商会同档案管理部门,以参与者的视角编写说明书。以查阅民生档案的公众视角为例,说明书应以开发设计阶段形成的用户需求为导向,使用简洁易懂的文字,并辅以图表,描述系统使用过程,编写用户说明书。在平台宣传阶段,通过门户网站、电视、期刊、微信、微博等方式对民生档案共享平台进行宣传,让更多公众了解这项服务,并主动参与进来。业务培训分为系统用户业务培训和普通公众业务使用宣传,前者以培训班的模式安排固定的培训时间和地点,进行系统教学;后者以视频短片和网上互动的方式向公众宣传平台,并展示平台的使用方法。平台在试运行时,可在一定范围内试用系统的部分典型功能,在此过程中发现问题并加以改进,达到完善各项系统功能、使系统功能更加简洁和更加人性化的目的。平台正式运行标志着民生档案共享平台正式上线,能够为相关部门和公众提供服务。

7 平台的维护

维护是保持系统生命力的重要手段,要通过系统维护保证平台的安全运行,同时还要随着业务的变化及时调整维护的方式与手段。

参考文献:

[1]万波,李世祥.基于云计算的数字档案馆建设探讨 [J].兰台世界,2012,(23):23-24.

[2]张凤武.基于云计算的档案管理服务创新[J].档案与建设,2013,(08):28-29.

[3]程结晶.云技术中数字档案资源共享与管理体系的构建 [J].档案学研究,2013,(01):38-41.

[4]ICA Study n ° 8: Guide for Managing electronic records from an archival perspective.[EB/OL].[2011.09].http://www.ica.org/10824/studiesand-case-studies/.

[5]怀特.hadoop权威指南[M].华东师范大学数据科学与工程学院,译.北京:清华大学出版社,2015.

猜你喜欢
档案馆民生服务器
服务器组功能的使用
聚焦“三保障” 唱好“民生曲”
云南省档案局办公室关于表彰2018年度《云南档案》优秀通联组及发行先进单位的通报
通信控制服务器(CCS)维护终端的设计与实现
PowerTCP Server Tool
民生之问饱含为民之情
“钱随人走”饱含民生期盼
民生锐评
全省部分档案馆新馆掠影
计算机网络安全服务器入侵与防御