王伟冬
(北京科技大学天津学院,天津 301830)
大学图书馆拥有海量的知识和信息,为了实现资源的快速搜集和共享,数字化是行之有效的方法,也是未来发展的必然趋势。数字化的实现需要合理运用服务器、存储、网络等设备才能发挥最大功效,因此必须利用专业的知识、科学的手段、统一的标准来建设中心机房。
独立学院,是指实施本科以上学历教育的普通高等学校与国家机构以外的社会组织或者个人合作,利用非国家财政性经费举办的实施本科学历教育的高等学校。独立学院是民办高等教育的重要组成部分,属于公益性事业,建设中心机房要有自身的特点。下面将从以下几个方面介绍独立学院将如何建立高效、节能、安全的中心机房。
选择机房的位置对于机房建设至关重要,既要考虑到为读者开放服务的具体位置,如流通、编目、OPAC、电子阅览室等,又要避免日后开展新服务增加不必要的布线成本。首先,选择阴面房间,防止太阳直接照射导致设备变形和升高机房内温度增加空调负荷。然后,选择图书馆地表层,主要原因是由于中心机房里的设备较多,且每个设备的重量都较重,再加上书籍的重量,容易发生建筑楼板坍塌事故。最后要选择避开强磁场区和无线电干扰区,以防止设备受到辐射不能正常运行。
2.1.1 温度、湿度标准。适宜的温度和湿度是建立机房的基本条件。机房的温度和湿度应采用国家标准《电子计算机场地通用规范》(GB/T2887-2011),具体见表 1,表 2。
表1 开机时温度、湿度要求
表2 停机时温度、湿度要求
2.1.2 温度、湿度超标的危害。温度过高,会造成元、器件损坏。实践证明,比标准每上升10℃设备元器件故障率就会增加一倍,且元器件老化程度加快。温度过低,则会造成绝缘材料变脆,结构强度变弱,从而出现传动出错、服务器死机现象。湿度过大,则会造成电路板表面凝露。凝露会造成金属触点的腐蚀,元器件间连电,电路板烧坏等严重的后果。湿度过小,则会容易产生静电。静电对机房设备来说可以称得上是“隐形杀手”,主要原因是静电处于“隐身”状态,管理员随身携带静电,极易对服务器产生危害。静电在相对湿度为30%时,可产生的静电电压为5 000V;在20%时,可产生静电电压为10 000V;而在5%时,产生静电电压则可达到惊人的20 000V。因此把机房内的温度和湿度控制在标准范围内是十分必要的。
2.1.3 调控温度、湿度。温度和湿度的测量可采用两种方式:1)根据实际的机房空间的大小,如无隔间,则每200平方米放置一个温湿度计,如有隔间,则要保证每个隔间至少放置一个温湿度计。这里无论机房的面积的大小要尽量放置2个温湿度计,主要原因有两方面,一方面是保证测量的准确程度,定时读取两个温湿度计的指数,取平均值,并作详细记录。另一方面是起到备份的作用,如果其中一个温湿度计损坏或异常,另外一个可以保证实时监测机房温湿度。2)安装机房温湿度监测系统。不但可以测量并记录温度和湿度,而且还可以设置报警界限,一旦机房的温度或湿度超越界限,系统将自动给预先设定好的手机发送信息,使管理员第一时间了解机房情况并及时处理,避免出现严重后果。
上述两种测量方式相比,后者实现了自动化管理,但机房温湿度监测系统的造价不菲。虽然前者没有实时报警功能,但可以通过安装双空调来解决此问题,同时也解决了单空调故障服务器无法继续运行的弊端。空调调控机房的有效范围可参照表3。独立学院可根据自身的实际情况进行选择。
表3 空调匹数与房间面积对照表
灰尘是影响服务器正常运行的另外一个重要因素。灰尘本身具有微小和广泛的特性,可以进入任何一个设备或者设备的接口当中,轻则造成读取数据错误,重则导致服务器不能正常运行,甚至造成硬件的损坏。因此清理灰尘十分必要。首先,保持每周用干布擦拭服务器表面灰尘,再用干拖布擦去地面灰尘,然后利用每学期闭馆时间关闭服务器,使用鼓风机清理服务器内部灰尘(风扇、主板、机箱等),最后要做好机房的门、窗密封工作,尽量减少灰尘的进入。
由于机房内用电设备较多,电源负荷较大,容易发生电源起火,再加上机房内的管道会有漏水的可能,因此要放置必要的防火、防水设施。要放置干粉或二氧化碳的不导电的灭火器,还要在机房顶处加装烟雾检测设备和应急灯,这样可以在第一时间控制火势,防止火势蔓延。但注意一定不要装自动喷水器,否则机房设备会被水淋而遭到损坏。应急灯则可在因火灾切断电源后起到照明的作用。机柜是防水设施中较为普遍的设备。因为机柜本身距离地面有一定的距离,可保证水在短时间内不会浸泡设备,另外机柜周围也有防护板,可以有效防止水从侧面进入,很大程度上起到防水的作用。另一方面机柜有效地利用了机房的空间,在很大程度上优化了机房面积的利用率。
机房要防止的动物主要是鼠和蚁两种,由于它们都具有打洞的天性,因此可以从机房的各个角落进入。老鼠可以将电源线、数据线等咬断,使服务器不能正常工作,蚂蚁则会进入服务器导致元器件连电,造成硬件损坏。根据鼠蚁活动的习性,可在机房四周的墙沿处和拐角处放置灭鼠药和灭蚁药。管理员还要主动对机房进行细致检查,发现鼠蚁洞立即填堵。禁止任何人将任何食物带进机房,以防招引鼠蚁。
电磁干扰可以让服务器数据传输错误甚至不能正常工作。电磁干扰主要是由电场、磁场、无线电信号等组成。要避免电磁干扰影响机房设备正常运行,首先在选择机房位置的时候要尽量避免强电磁干扰区域,如果无法避免,则在机房内部要安装电磁屏蔽系统,覆盖整个机房,形成一张无形的保护网,然后建立整个机房设备地接地系统,最后在机房地面上加装防静电地板。
稳定的供电系统是保障机房正常运行的必要条件。机房建立初期设计电路时要统计机房内所有预安装的设备,并预留未来五年准备安装的设备,包括空调、UPS电源、服务器、存储等,并设计出各个设备摆放的位置,不同功率的设备安装不同的电路,以防止负荷过大和不必要的浪费。电路是机房建立稳定供电系统的第一步。由于机房的特点是要求24小时不间断供电,如一旦遇到电力故障,所有设备将瘫痪,而且设备突然断电,会对设备本身造成损害,甚至还有可能丢失数据。第二步是建立后备电源(UPS)。UPS建立的步骤:1)核算所有设备的总功率,包括将未来五年准备安装的设备(不包括空调);2)选择在线互动式UPS,后备式无法满足服务器的需求,在线式则浪费资源。所有设备的总功率保持在UPS额定功率的25% ~80%之间;3)选择电池组,电池组功率的大小要根据无人值班的时长而决定。一方面避免无人值夜班不能及时关闭服务器造成电池全部耗尽,机房设备受到断电损害,另一方面UPS电池本身不能深度放电,否则电池组寿命将严重缩短;4)测试充、放电是否正常;5)正式投入使用。需要特别注意的是在UPS的正式使用过程中,要保持平均每3个月要进行一次放电,放至最低电量警告线为止。如UPS长时间不使用,要平均每3个月充一次电,充满为止,这样可以延长使用寿命。“步骤1”中不包含空调的原因是由于空调的功率过大,UPS不能长时间维持使用。解决空调断电问题则需要单独加装后备式发电机,且空调本身需带有恢复市电自动启动功能。至此,稳定的供电系统建立完成。
结合实际的工作经验,UPS可以更加合理化利用,具体方法是只保护对外开放和数据的服务器,其他设备均设置成为闭馆后关机。其主要原因一方面是对外开放服务器需要给读者提供最大化、无障碍服务,数据则是图书馆服务的基础。另一方面可以节约电能,避免不必要的浪费。最后则是节省大功率的UPS和电池组花费的巨额资金。
首先在网络速度方面必须保证主干千兆,百兆到桌面的访问速度,这样才能保证读者从校内、外访问数字资源不会遇到瓶颈。然后在网络安全方面,一定要在内、外网之间架设硬件防火墙,阻止网络攻击,并开放可信端口保证正常访问可以有效执行。最后则需每天检查网络的通畅情况,遇到异常需及时查看并解决。
数据是图书馆的核心,是图书馆所有服务的支撑点,更是多年工作的累积。因此数据一旦丢失,图书馆的所有服务均不能正常进行,所有历史记录均无法查询,所有的工作累积将化为泡影。因此数据的重要性不言而喻。
一般情况下,数据备份机制都是每天闭馆前自动备份,备份存放的介质是服务器本身。但假如当天备份前服务器出现硬盘故障,则会导致当天的数据全部丢失,且如果只是存放在服务器中的硬盘则硬盘数据全部丢失,就算硬盘能修复,但也需要长时间来完成。因此,应结合实际工作经验细化自动备份机制,首先将备份的单位时间变为“小时”,然后在不同地点的工作站进行备份,最后将闭馆前的最后一次备份数据拷贝到移动硬盘中,放至安全地点保存。这里备份单位时间可根据馆内的数据量进行更改,更改的原则是尽可能减少丢失的数据量,同时不影响图书馆正常的服务。特别注意,备份是要尽量选择全部备份而不是增量备份,以防止数据不全和不匹配的情况发生。
如果资金充足,可以建立双机热备或者异地灾备系统。双机热备系统是购买两台完全相同的服务器,一台作为主服务器,另外一台作为备用服务器,一旦主服务器发生故障,备用服务器立即启动,不但可以保证数据的不丢失,而且还可以保证不间断服务。异地灾备系统同样是购买两台完全机同的服务器,只是备用服务器放至在异地,定期备份主服务器上的数据,这种方式可以有效避免自然灾害带来的损失。
机房正式投入运行以后,要尽量减少进、出机房的次数,以保证机房内标准的温度和湿度。当设备出现故障时可利用远程控制系统。远程控制系统可通过联网计算机登录服务器,查看服务器状态,如有问题直接远程解决。远程控制系统是建立在软件基础上,如果遇到系统宕机或者硬件有问题,则需要现场解决。
6.1.1 KVM视频切换器。KVM的功能是使用一套显示器、鼠标和键盘管理多台服务器,只需一键切换便可实施管理控制,很大程度上节省了机房空间。
6.1.2 虚拟软件。其功能是将多个系统装到同一台服务器上,各自运行其服务,互不干扰,这样可节省更多摆放服务器的空间。但需要注意的是装有虚拟软件的服务器必须具有高性能,否则无法承载多个服务。
6.1.3 建立定期检查方案。定期检查是预防设备故障和及时恢复设备故障的有效方法之一。每天安排机房值班人员,并制作值班表,定时查看机房内的设备是否正常运行,电源是否正常供电,温度和湿度是否在标准范围内等,一旦发现异常应立即处理,如无法处理应联系供应商尽快上门解决,将机房的安全隐患消除在萌芽状态,保证设备的正常运行。
6.2.1 管理员日志。其主要功能是方便日后查看工作情况记录,以便快速了解机房的历史情况,第一时间判断是否有故障。其中记录信息包括日期,进入时间,离开时间,姓名,工作内容,备注等信息,不同图书馆可根据实际情况进行增加或删减记录项。
6.2.2 故障日志。其主要功能是记录设备运行情况以及问题处理办法的参考。记录信息包括设备名称、日期、出现故障时间、故障描述、处理办法、解决故障时间、操作员、备注等,可根据实际情况进行增加或删减记录项。
6.2.3 温度、湿度日志。其主要功能是观察温度和湿度的变化情况,以及通过历史记录检测与否正常。记录信息主要包括日期,时间,两个测量仪温度、湿度,平均温度和湿度,测录员,备注等。
图书馆机房建立是一项复杂的工程,需要运用大量的科学知识和先进的仪器设备,但要“量体裁衣”,在满足图书馆服务的基础之上避免资源的浪费,利用有限的资源最大化满足读者需求。
[1]中华人民共和国教育部.独立学院设置与管理办法[EB/OL].[2012-07-01].http://www.gov.cn/flfg/2008-03/07/content_912242.htm.
[2]GB/T2887-2011,电子计算机场地通用规范[S].
[3]郭永建,赵岩碧.数字图书馆机房建设环境建设的实践与探讨[J].江西图书馆学刊,2006(2):120.
[4]张晓东,张计龙,张育超.基于NSPOF的智能化图书馆机房改造研究与实践[J].实验技术与管理,2011(4):282.
[5]空调匹数和房间面积的关系[EB/OL].[2012-07-01].http://zykt.99114.com/Article2/Detail_559880_102101_%e8%a1%8c%e4%b8%9a%e5%b8%b8%e8%af%86.shtml.