何瓦特 杨毅
(云南大学历史与档案学院昆明650504)
云计算环境下的西南民族档案资源集成管理研究
何瓦特 杨毅
(云南大学历史与档案学院昆明650504)
本文以云计算理论为指导,提出具有西南民族特色的“云计算环境下的西南民族档案资源集成管理”的新模式,分别从云计算环境下的西南民族档案资源集成管理的核心服务、管理服务和用户接口方面进行了剖析,为西南民族档案资源集成管理提供了建设性意见。云计算环境下的西南民族档案资源集成管理将是一个新理念、新模式,它的构建为西南民族档案管理者、爱好者和研究者带来零距离、全天候和个性化服务。
西南民族档案云存储云应用云协作集成管理
G271
A
2017-06-17
西南民族档案资源,就是指我国范围内的各种类型的社会组织和个人,在过去、现在和将来的活动中形成的,反映我国西南区域的各民族文化的,有记忆价值并处于人们有意识的管理中的各种载体的原始记录的聚合。由于西南地区民族众多、分布区域广泛、地理位置分散而不能够集中管理,高效率利用。从而在云计算情况下探讨西南民族档案资源集成管理尤为重要。
所谓云计算,“其本质不是一种具体的技术,而是一种理念和方式,它利用虚拟化技术,通过网络来实现分散资源间的整合和互操作,在任意时间和地点,以被请求的任意方式为用户提供高效、灵活、按需分配且成本低廉的服务,包括软件、平台和基础设施等各层次的服务”[1]。通俗讲,云计算就是硬件资源的虚拟化。它具有四个主要特点:一为虚拟化,即利用软件技术来实现对硬件资源的虚拟化管理,以满足用户在任意地借用各种终端设备获取服务的需求。二为可扩展性,即提供的资源来自于“云”,而云中的各种资源可根据用户规模和需求进行动态伸缩,自动提供足够的空间和计算能力。三为安全性,即通过数据多副本容错、计算节点同构可互换等管理措施来保障用户能够享受到最安全的服务,保证资源共享的方便、快捷、高效。四为效益最大化,即“云”可提供用户各种需求,可帮助用户免去对各种软硬件基础设施的成本投入,节约开支,集中精力专注于本身的业务工作[1]。
所谓大数据,“一般意义上,大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合”[2]。通俗讲,大数据就是海量数据的高效处理。它主要具有四个特点:一为体量浩大,从TB级别上升至PB级,甚至开始以EB和ZB来计数。二为类型繁多,可分为文本、网络日志、图形、图像、视频、音频、地理坐标等,或分为元数据、主数据、业务数据等,或结构化、半结构化及非结构化等类型。三为生成与处理快速,以数据流的形式快速地产生、存储数据和实时重建数据,始终处于动态变化中,具有极大的时效性。四为价值密度低,由于大数据自身的状态与价值会随着时空变化而发生演变,人们现有的传统思维与技术难以挖掘和运用大数据潜在的巨大价值。学界将其归纳为4个V——体量(Volume)、多样(Variety)、价值(Value)、速度(Velocity)[2]。这其中,价值是大数据问题解决的目的,其余3V都是为价值目标服务。
大数据与云计算之间存在着相辅相成的关系。一方面,大数据离不开云计算。大数据的总体架构由数据存储、数据处理和数据分析三个层次构成。存储层负责存储海量的数据,数据处理层负责快速、实时处理类型复杂的数据,分析层根据需求和目标负责建立相应的数据模型和数据分析指标体系来对数据进行分析,三个层次相互配合,让大数据最终产生价值。而在这三个层次配合过程中,需要依靠云计算平台提供强大的IT基础,建立顺畅运营的基础架构。如果这三个层次离开了云技术,大数据就没有了运营的根基,势必成为僵死的数据。可以说,云计算平台就是解决海量大数据及助推大数据成长的驱动力。另一方面,云计算也需要大数据发挥其最大化功能。云计算体系是由服务管理、核心服务、用户访问接口三个层次架构而成。其中,核心服务层通常又可分为:“基础设施层(Infrastructure)、平台层(Platform)和应用层(Application)。其中。每一层都可以为用户提供服务,分别为:基础设施即服务(Infrastructure as a Service,IaaS)、平台即服务(Platform as a Service,PaaS)和软件即服务(Software as a Service,SaaS)。基础设施即服务交付给用户的是基本的基础设施资源。基础设施层向用户提供了虚拟化的计算资源、存储资源和网络资源,这些资源能够根据用户的需求进行动态分配。平台即服务交付给用户的是丰富的‘云中间件’资源,这些资源包括应用容器、数据库和消息处理等。软件即服务交付给用户的是定制化的软件,即软件提供方根据用户的需求,将软件或应用通过租用的形式提供给用户使用,该软件通过网络交付给用户,用户不需要在本地安装。”[3]针对大数据的特点,云计算相应的不仅提供了容纳大数据流的空间,而且运用并行计算、分布式计算、虚拟化等技术手段,为大数据实现了IT服务的无缝化、定制化和弹性服务。可以说,如果没有大数据,云计算只能束之高阁难落地。未来,大数据将越来越多、越来越实时、越来越复杂,大数据的不断积淀,会更大程度上提升云计算在挖掘和利用数据方面的强大的计算能力。
海量数据需要有能容纳、计算海量数据的云计算去挖掘和运用。二者的相辅相成决定了在云计算时代,构建面向大数据的云计算平台体系,是能够充分发挥云计算的优势,强化面向用户的以服务为导向的核心价值观,将各块服务集成为一个体系嵌入到整个服务链中,在“云化”中实现“服务化”。具体来讲,其服务体系包含核心服务层、服务管理层、用户访问接口这三个逻辑层次,如图1所示[4]。
图1 面向大数据的云计算体系架构图
对于档案资源管理来讲,云计算是一种档案资源整合的方式、一种档案服务的创新模式。借助面向大数据的云计算平台体系,研究档案资源的整合,会带来一些新的理念、新的挑战。在这一体系中,档案管理者兼档案资源的占有者、管理者和提供者的三重身份,而其中更多的应该是档案服务的提供者。档案服务机构要充分借助云计算平台体系的优势,采用面向用户的核心理念,在提高数据的存储、运算、管理以及分析的能力的同时,优化自身的界面管理、技术手段,通过“云化”式的资源整合实现面向用户的“优质服务化”。
对于西南民族档案资源集成管理来讲,它是一个体系庞大的系统工程,需要随着西南地区经济社会发展水平的提高、基础设施的发展、各民族语言文字处理技术的不断成熟而逐步推进。在逐步推进的过程中,西南民族档案资源集成管理所产生的数据势必呈现出数据体量越来越大、数据类型越来越繁多、数据价值密度越来越低等特点,越来越具有大数据的典型特征。而另一方面,西南地区又存在着自然环境较为恶劣、持续投入资金缺乏、高科技人员不足等现实。面对挑战,彼此具有相互需求与密切关系的大数据与云计算是最好的解决问题之道,在云平台下进行西南地区民族档案集成管理的优势突显而易见,这也正好顺应了未来大数据时代实现档案集成管理跨越式发展的必然趋势。为此,结合西南地区民族档案集成管理体系,借助面向大数据的云计算平台体系构想,对集成控制、集成归档、集成服务三个阶段作一探讨性设计。
1.云计算环境下的西南民族档案资源集成管理体系。西南民族档案资源集成管理体系在面向大数据的云计算环境下的架构如图2。
图2 基于云计算环境下的西南民族档案资源集成管理体系
在图2云环境下,通过核心服务、服务管理、用户访问接口三层架构把民族档案的集成控制、集成归档、集成服务全部纳入一个整体系统中完成。在这一整体中,核心服务层将软件运行环境、硬件基础设施以及应用程序都统筹定位为层服务。具体来讲,基础设施即服务层(IaaS)作为硬件基础设施建设服务环节,负责提供虚拟机和物理机等设施,为用户按需提供实体或虚拟的计算、存储和网络等基础服务;平台即服务层(PaaS)作为云计算数据处理平台和应用程序的运行环境,负责为大规模数据分析处理应用提供编程接口等一系列程序部署与管理服务,支持按需变化的运算模式;软件即服务层(SaaS)作为基于云计算基础平台所开发的应用程序,提供定制化软件服务,为用户访问和使用提供便利。核心服务层通过上述架构把所有民族档案的产生、归档、保存和利用等档案管理环节列为云端服务。服务管理层为核心服务提供支持,保证所有集成管理中的存储中心、各省会站点所存档案的完整、安全、可使用。用户访问接口层通过物联网、互联网、移动互联网实现了西南民族档案管理数据的云计算服务的访问[4]。
2.云计算环境下的西南民族档案资源集成管理的核心服务。
(1)根据云计算环境下的西南民族档案资源集成管理体系,各省站点、各省级综合档案馆都有一个统一标准的可供西南民族档案资源集成管理使用的云平台;通过云平台建立档案数据中心;依靠网络互联,数据中心建立了档案系统的“档案云”。各省级综合档案馆通过云技术完成对源于各方的纸质档案的数字化、政府电子文件的接收、著录、提供利用等一系列管理工作,基层档案馆、各地的档案存储地可通过网络将档案数据归入集成管理中心,如图3所示[5]。
图3 云计算环境下的西南民族档案资源集成控制
(2)在云计算环境下的西南民族档案资源集成管理体系中,集成归档是个渐进的过程。在初次归档阶段,完成了归档范围、归档模式、归档文字表述、双语著录等整理业务工作,并且确保电子文档完全符合初次归档要求,方能被集成管理中心归档保存并及时导入集成归档阶段,正式进入集成管理体系。集成归档阶段完成格式转换、编码转换等二次整理工作,并通过云技术把集成管理的档案存储并互联在各中心,形成互联互通的档案云。如图4所示。
(3)在云计算环境下的西南民族档案资源集成管理体系中,集成服务体系的主要功能应该包括民族档案资源的提供与检索、整合与加工、共享与交流等。集成服务所面对的档案用户大体上可分为“内部用户”和“外部用户”。内部用户是指与西南民族档案资源集成管理系统的数据的整理、操作、维护、使用等方面有直接关联的人;外部用户是指对西南民族档案资源有需求但与系统没有联系的人。无论哪一类用户在哪个地方哪个时段需要访问集成管理文档,都可通过云技术获得及时服务,如图5所示。
图5 云计算环境下的西南民族档案资源集成服务
3.云计算环境下的西南民族档案资源集成管理的用户接口。在云计算环境下的西南民族档案资源集成管理体系中,档案管理者、档案提供者、档案使用者可以通过物联网、互联网和移动互联网访问西南民族档案资源集成管理信息平台。档案管理者利用物联网对西南民族档案实体进行环境温湿度控制的精细化管理,档案使用者利用物联网对加贴RFID标签的西南民族档案实体实现位置的查找和自动化的抓取[6];档案管理者和档案提供者在西南民族档案资源集成管理互联网平台为档案使用者提供档案的归档、加工、检索、共享和个性化等服务,档案使用者通过西南民族档案资源集成管理护理互联网平台向档案管理者、档案提供者提交根据自身需求的定制化服务;档案管理者和档案提供者依托西南民族档案资源集成管理APP平台、西南民族档案资源集成管理微信公众号为档案使用者提供随时随地的档案信息化服务,档案使用者可以利用手机、手持设备等移动终端媒体实现全天候、便捷式、移动式的档案信息化服务[7]。随着云计算、大数据、“互联网+”、移动新媒体等新兴信息化技术的发展,西南民族档案资源集成管理信息平台将会为档案管理者、档案提供者、档案使用者构建一个全方位、立体化的用户访问接口。
4.云计算环境下的西南民族档案资源集成管理的服务管理。在云计算环境下的西南民族档案资源集成管理体系中,西南民族档案资源集成管理的服务管理对西南民族档案资源集成管理的IaaS、PaaS和SaaS服务提供了高可靠性、强稳定性、易使用性等保障。西南民族档案资源集成管理的服务管理包括档案服务质量保证和档案安全管理。
档案服务质量保证(QoAS,Quality of Archives Service)是西南民族档案资源集成管理信息平台的特性满足档案管理者、档案提供者和档案使用者等相关人员需求程度,通过档案服务相关人员的感知、反馈,才能评价西南民族档案资源集成管理信息平台实现的程度[8]。结合档案服务的提供者、档案服务的使用者、档案服务前后可以构建一个档案服务质量保证的四维视角关系,如图6所示。
图6 档案服务质量保证的四维视角关系
档案安全管理主要是对西南民族档案资源集成管理信息平台数据的安全性,保证西南民族档案资源核心数据不因突发事件(如自然灾害、人为操作失误、断电等)、病毒侵入、黑客攻击而丢失或泄露。除了以上安全意外,还有政治安全、保密性的安全、产权性的安全和隐私性的安全。依据西南民族档案资源集成管理信息平台的特点,研究在云计算环境下的西南民族档案资源集成管理体系的安全与隐私保护技术、制度、操作手册等,这样西南民族档案资源集成管理所有活动才能有序、高效地开展,保证西南民族档案资源集成管理的广泛应用。
云计算环境下的西南民族档案资源集成管理的核心服务、服务管理和用户接口是相辅相成的,西南民族档案资源集成管理的核心服务将云计算的IaaS、PaaS和SaaS服务理念引入西南民族档案资源集成管理过程中;西南民族档案资源集成管理的服务管理为西南民族档案资源集成管理的核心服务的稳定、可靠和安全的运行提供一道防火墙屏障;西南民族档案资源集成管理的用户接口使西南民族档案资源集成管理的核心服务实现了访问的媒体。西南民族档案资源集成管理的核心服务拓展西南民族档案资源集成管理的用户接口媒体;西南民族档案资源集成管理的核心服务不断提出对西南民族档案资源集成管理的服务管理的需求。
1.西南民族档案资源的云存储。基于云计算环境下的西南民族档案资源集成管理体系中最核心的就是西南民族档案数字化资源,如何收集、整理、存储和传播这些数字化资源,将由云存储负责。西南民族档案资源的云存储主要利用虚拟化技术将分布在西南地区的服务器、磁盘阵列、交换器等物理资源整合成为统一控制的资源池。档案提供者可以使用西南民族档案资源的云存储定制自己的CPU数量、内存容量、硬盘空间等;档案使用者可以共享西南民族档案资源的云存储中心的资源,享用高带宽低延迟的网络服务。
2.西南民族档案资源的云应用。基于云计算环境下的西南民族档案资源集成管理体系中最活跃的就是西南民族档案数字化资源应用,云应用赋予西南民族档案数字化资源活力。西南民族档案资源的云应用将传统的桌面应用、移动app应用迁移到互联网,并托管这些应用程序。档案使用者通过Web浏览器便可“零距离”、“全天候”地访问西南民族档案资源的云应用,而不需要下载、安装或维护任何硬件或软件。
3.西南民族档案资源的云协作。基于云计算环境下的西南民族档案资源集成管理体系中最共融的就是西南民族档案数字化资源云协作,云协作为西南民族档案资源集成管理信息平台和社会公众搭建了一个档案业务协同工作平台。西南民族档案资源的云协作如同Wiki模式具有自由、开放、协同等特点,档案使用者和档案提供者在遵守一定协议的情况下,可以在西南民族档案资源的云协作上编辑西南民族档案中已有的信息、缺失的信息、录入错的信息[9]。在社会公众的协调工作中,西南民族档案资源就成为汇聚集体知识的知识体。
综上所述,对云计算环境下的西南民族档案资源集成管理的探讨,是大数据时代赋予西南民族档案资源集成管理的一个新的理念和新的模式,它既是档案界面临的全新挑战和发展机遇,也是档案界把握自身优势,顺应时代发展,提升集成管理力的重要路径。“随着云计算技术的进一步发展及云计算理念被用户广泛接受,云计算技术必将成为最为重要的信息技术,云计算平台必将成为最为重要的基础设施,基于云计算平台的应用也将成为人们最重要的选择,作为档案工作人员必须高度关注,认真追踪研究。”
当然,现有的数据中心技术还很难满足集成管理大数据的需要,大数据处理所倚重的云计算技术目前也还不够成熟,诸如数据集成中的去冗降噪、数据存储的高效率低成本、档案云的安全、虚拟化技术的潜在隐患等许多问题需要档案部门探讨解决,尤其是对于云计算环境下的西南民族档案资源集成管理的安全研究,显得更加重要。对此,还需潜心研究集成管理大数据的内在机理,研究云计算下实现档案资源安全的方法和技术,尽快创建出西南民族档案资源集成管理综合安全防护体系,实现在安全的档案云中为用户提供更加优质、可靠、便利的服务。
[1] 肖晶,吕世炅,张晓丹.云计算环境下面向用户的科技信息资源整合和服务浅析[J].现代情报,2014(3):63-67.
[2] 李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012(6):647-657.
[3] 肖晶,吕世炅,张晓丹.云计算环境下面向用户的科技信息资源整合和服务浅析[J].现代情报,2014(3):63-67.
[4] 毕建新,陈雅,郑建明.面向科学大数据的云计算平台构建研究——以东南大学为例[J].现代教育技术,2013(10):72-75.
[5] 黄新荣,王晓杰,段广利,赵清.云环境下我国数字档案馆建设模式研究[J].档案与建设,2013(6):4-7+15.
[6] 田雷.物联网技术在智慧档案馆建设中的应用研究[J].档案学通讯,2015(1):60-64.
[7] 曾群,钟晓诚.基于3G手机图书馆的移动学习平台探究[J].图书馆学研究,2012(11):17-21.
[8] 黎春兰,邓仲华.论云计算的服务质量[J].图书与情报,2012(4):1-5.
[9] 刘扬.基于Wiki的档案馆服务模式[J].兰台世界,2013(23):21-22.
[10] 方昀,郭伟.云计算技术对档案信息化的影响和启示[J].档案学研究,2010(4):70-73.
Research on the Integrated Management of the Southwest Minority Archives Resources in the Cloud Computing
He Wate,Yang Yi
(History&Archives School of Yunnan University,Kunming 650504,China)
Based on the theory of cloud computing,this essay puts forward the new model“the integrated management for the southwest minority archives resources in the cloud computing”,probes into the integrated management from perspective of core service,management service and user interface and makes some constructive suggestions for it.The integrated management for the southwest minority archives resources in the cloud computing is a new idea and new model,whose construction will provide zero-distance,all-weather and personalized service for the archives managers,enthusiasts and researchers.
the southwest minority archives;cloud storage;cloud application;cloud collaboration;integrated management
本文系云南省哲学社会科学规划课题(项目编号:QN2015059)“‘互联网+’模式下云南档案资源共享研究”的成果之一。
何瓦特,硕士,讲师,研究方向为计算机应用技术、档案学;杨毅,硕士,教授,研究方向为中国民族史、档案学。