李自辉
(华南理工大学 图书馆,广东 广州 510640)
数字图书馆(Digital Library)是20世纪90年代现代信息技术发展的产物,虽然已经经过近二十年的发展,但是还没有一个公认的定义。美国数字图书馆联盟的定义广受认同,其认为:“数字图书馆是一种提供信息资源的组织,包括软硬件、网络与专业人员,以一致性、永久性的方式将数字化馆藏进行选择、组织、提供查询、解释、传播与完整保存,以便于这些数字馆藏可以迅速、经济地提供给特定社区与人们使用。”[1]从这个定义可以看出数字图书馆具有对数字资源在网络环境下进行组织、管理、服务的技术形态特征,是一个通常意义上的典型的信息系统。所以,数字图书馆安全问题的本质就是信息安全问题[2]。
对于信息安全,信息安全管理国际标准ISO27000系列给出了133项控制要素,黄水清等根据数字图书馆的特点筛选出针对数字图书馆的87项控制要素[3]。而具体到高校数字图书馆实际情况,概括来讲,其面临的安全问题主要有计算机病毒,非法入侵,硬件设备损坏和人为操作失误等几个方面。
计算机病毒是一种可以通过修改自身来感染其他程序的程序,这种修改包括对病毒程序的复制,复制后生成的新病毒同样具有感染其他程序的功能[4]。由于它与生物学病毒一样具有生存、繁殖和发作的共同特性,故称其为计算机病毒。据报道,自1983年世界上发现首例计算机病毒以来,计算机病毒正以每天10-15种的“生产”速度递增。而到了现在,计算机病毒又有了新的特征,它的传播途径由软盘、光盘传播变成了网络传播,由被动的触发感染演变成了直接通过计算机系统漏洞主动感染,即计算机只要联接在网络上就有被感染的可能。这样,对依赖网络提供服务的数字图书馆造成了致命的威胁,高校图书馆局域网由于和校园局域网相联接,具有高速和开放的特点,更容易沦为病毒感染的重灾区。
黒客的非法入侵和破坏是高校图书馆面临的重要安全问题,高校作为主要的科研教学机构,高校图书馆收藏有大量本校的科研成果或者购买的学术性数字资源,甚至大量的高校图书馆都收藏有涉密资源,这些难免引来各色不法之徒的觊觎之心。另外,跟地方公共图书馆不同的是,高校图书馆主要的读者群是知识素质比较高的大学生,他们通过自学或者学校授课方式学习了大量的计算机知识,但他们可能同时对信息安全法规没有足够的认识,在玩玩或者练习的想法下对学校的网络进行攻击,图书馆网络作为学校网络的一部分,当然也在攻击之列。
数字图书馆的建设已经进行了十数年了,相应的,一批早期购买的设备已经步入了老化期,表1是笔者根据工作经验总结的设备实际使用寿命[5]。同时,由于其他人为或自然的事故可能会导致设备的意外损毁,而造成数字资源的损失。设备的损坏常常有突发性和偶发性,一旦发生造成的破坏又是巨大的,恢复起来相当困难,甚至是不可恢复的。
表1 设备实际使用寿命
在所有威胁数据安全的因素中人为操作失误发生的频率最高。据调查,在所有数据丢失的案例中,80%是由于人为错误所引起的。工作人员因疏忽或麻痹大意,或者不规范操作,往往会操作失误并导致数据丢失。 常见的错误有误删系统的重要文件,错误修改影响系统运行的参数,进行重要升级时出现错误等等。
2.1.1 技术手段方面
首先,从网络层面考虑,为保证高校图书馆网络的安全,必须要将图书馆网络和整个校园网隔离开来,在图书馆网络入口处设置防火墙,除了必要的端口如80端口和需要对外开放的服务器IP地址外,一律关闭,这样可有效防止图书馆网络外部的入侵和病毒传染。对图书馆内部网络,有线网要和无线网划分开来,无线网要建立严格的接入控制机制。为防止病毒在局域网内部蔓延和按不同级别对网络进行防护,应该将局域网划分为不同的VLAN(虚拟局域网),比如服务器VLAN,工作人员VLAN,电子阅览室VLAN等等。其次,从整体防护考虑,应该有一个完整的病毒防护查杀方案,在服务器跟客户端都要安装防病毒软件跟防火墙,并且及时的安装最新的病毒库跟各种系统补丁,从整体上做好病毒防护查杀工作。最后,从操作系统层面考虑,windows操作系统作为应用最广的操作系统,当然现存的病毒很大一部分都是针对它的,那么,除非有特殊要求,我们尽量使用UNIX或Linux作为服务器的操作系统,这样可以避开大多数计算机病毒的攻击,而且UNIX跟Linux在架构上相对windows来说更优,作为服务器操作系统更好。
计算机安全方面常常是“三分技术,七分管理”,所以还需建立有效的安全防护管理机制。
2.1.2 管理手段方面
建立有效的计算机网络安全管理制度,并严格执行。包括建立口令管理机制,比如定期更换口令,严格限定用户的权限等等。网络间要进行严格控制,服务器的远程控制要对IP进行限制,在绑定工作用机的IP地址跟物理地址的情况下,只准许特定的IP远程操控服务器。对工作用机进行严格管理,尽力保证工作用机的安全,对于在网络上随意下载软件进行安装、使用盗版软件之类的高风险行为要进行严格的控制。
设备的损坏和人为的误操作很难杜绝,所以唯一的防护措施是做好存储备份工作。建立一套好的备份体系不仅需要可靠的硬件设备,一个科学的、完善的、可靠的备份方案同样重要。
2.2.1 存储备份设备
高校数字图书馆最常用的存储备份设备还是磁盘阵列。在磁盘阵列中,有两个关键技术,即数据分割交叉存取和冗余编码技术。由于实现这两种技术的途径不同,因此构成了不同的RAID(廉价冗余磁盘阵列)级别,迄今为止已基本得到公认的体系结构有8种,包括RAID0、RAID1、RAID10、RAID2、RAID3、RAID4、RAID5、RAID6。 其中应用较广泛的为RAID1和RAID5,它们分别利用镜像盘和校验信息交叉存储的方式来进行工作。磁盘阵列按连接和使用的方式不同又分为DAS(直连式存储),SAN(存储域网络),NAS(网络附加存储)等。高校数字图书馆早期DAS使用较多,目前SAN开始日益普及。
2.2.2 笔者设计的一个高校数字图书馆数据备份方案
如图1所示,该方案用一台备份服务器和一套廉价大容量SAN(如使用SATA硬盘)作为备份设备,在备份服务器中根据需要备份的服务器的分区情况进行分区,大小保持一致,备份服务器和服务器通过内部网连接,当服务器需要备份时通过内部网将数据备份到备份服务器,服务器在平常不需要备份时可以跟内部网断开,保持物理隔绝。一旦服务器的数据丢失,可以通过内部网将备份拷贝回去。如果服务器存储发生故障,可以直接连接备份的SAN,将相应的备份分区重新分配给服务器,让服务器暂时使用备份的SAN保持服务的正常进行。这个方案的特点是简单易行,除了能做备份,还可以做设备的容灾冗余。
图1 高校数字图书馆数据备份方案
2.2.3 备份策略
根据数据类型不同,要采取不同的备份策略,常见的备份策略有:完全备份策略,即每次都备份系统中的全部数据,这种策略有它的限制,在备份的对象数据量很大的情况下有比较大的压力,时间也要很长。增量备份策略,每次只备份上次备份以后更新的所有数据,这种备份策略每次备份的数据小,时间短,但需要做数据恢复时比完全备份麻烦。还有一种结合以上两种策略的差分备份策略,即设置一个周期,按周期对数据进行完全备份,但是在周期内只对数据进行增量备份,这种策略相对中和了前面两种策略的优点跟缺点。
当然,高校数字图书馆的安全性问题远不止上面提到的一些,具体到各个馆情况又各不相同,但是,有一些具体的原则是共同的,那就是建立合理的安全防护体系,完备的管理制度,完善的备份系统,这样才能确保安全。
[1]黄如花,王梅,黄晓斌.数字图书馆原理与技术[M].武汉:武汉大学出版社,2005:1-3.
[2]赵亮,刘炜,徐强.《数字图书馆安全管理指南》解读[J].中国图书馆学报,2011(1):47-58.
[3]黄水清,任妮.数字图书馆信息安全风险控制[J].现代图书情报技术,2010(7,8):39-44.
[4]William Stallings.密码编码学与网络安全:原理与实践[M].3版.北京:电子工业出版社,2006:440.
[5]陶宇,蒋春林.数字图书馆应用“云计算”探讨[J].图书馆论坛,2010(4):81-83.