周庆华 丁军 周小飞 中国电信股份有限公司江西分公司云网运营部 南昌市 330029
江西电信全省共有4000多个A、B、C、D类四个等级机房,不同机房有不同的管理运营要求,但在实际管理运营当中,经常碰到各类问题,比如作业事项纷杂繁多,管理困难,机房进出纸质填写,难以管控进出人员等。现场作业人员参差不齐,安全性差,机房现场突发问题不能及时发现,比如门被破坏、蓄电池被盗等。机房耗电量缺少稽核手段,能源浪费,又如机房停电无法核算油机发电费用、机房能耗测算粗放、季节变化不能及时到现场调节空调等、机房内动力配套设备能否满足新增设备。信息化、自动化技术不足,效率低下,比如需要人工现场核实机房巡检完成情况,耗时耗力;部分设施需现场例测进行隐患排查;传统巡检方式纸质留存,难以核实巡检结果,巡检质量只能抽检,无法全部核查,因此急迫需要智慧化手段来管理,提升机房运营水平和效率。
智慧机房管理平台总体思路是以视频、门禁、传感器、动环等硬件为底座,推动智慧机房管理平台与视频、门禁等软硬件解耦,打通动环、资源、服保、综合网管、能耗等O域(维护侧)系统,实现机房出入管理、作业计划管理、巡检管理、风险操作、降本增效管理五大管理。
图1 智慧机房管理平台总体架构
通过蓝牙、NB远程、人脸识别、应急钥匙四种开门方式出入机房,电子登记替代人工纸质登记,人员身份验证(门禁、摄像头联动与AI分析)实现出入记录电子化。工程施工、割接操作、日常维护、巡检作业、故障处理、资源管理、客户操作、其他事项8大机房作业场景嵌入出入流程,实现机房出入智能化、记录电子化和流程化。
建立机房房长责任制、三级领导巡检制,实现机房网管与AI自动巡检、自动稽核。
(1)网管巡检
周期性获取全部机房的动环、机房设备综合网管等信息,包括动环值(机房温度、湿度、蓄电池状况、负载容量等)、温湿度、空调、服务器等,进行自动评分、异常派单。
(2)AI巡检
机房通道整洁情况进行巡检,包含设备外观、走线规范、空洞检查、多设备端口识别、电子标签、漏水漏电,并输出巡检结果。
(3)自动稽核
设备风扇清洗稽核,机房内有OLT风扇未进行清洗的,风扇清洁的作业工单不能回单。蓄电池放电测试稽核,一次性放电要求达到87.5%以上,蓄电池组电压高于47.2V则不能回单。
图2 蓄电池总电压时间变化曲线图
自研人脸、人体检测、识别、跟踪和检索算法,构建人脸识别、区域布控等能力,实现人数识别、未戴安全帽、摔倒等场景检测、告警、派单。同时系统针对不同场景进行人工智能学习与训练,自动识别出人员摔倒、人员闯入、通道堵塞及施工未戴安全帽等风险事件,对高风险事件进行故障派单给机房维护人员,一般事件发短信提醒机房管理人员。
图3 AI识别场景图
(1)空调控制
智慧机房管理平台根据根据季节变化、机房温度环境,预先设置机房温度控制规则,自动开启空调(如温度大于摄氏25度)、关闭空调(如机房温度低于摄氏20度)和调整空调温度(如机房温度高于32度),达到节能减排的目的。
(2)能耗稽核
智慧机房管理平台根据机房设备配置计算机房额定功率,根据开关电源电压电流计算实际功率,同时通过接口获取电表功率数据,对于那些电表功率远远大于额定功率和实际功率机房,生成“能耗核查单”通知维护人员进行核查。
(3)油机发电稽核
智慧机房管理平台根据市电停电来监测油机发电过程。在系统停电后,蓄电池会马上进行放电来供电,然后根据电压来判断是否是油机发电,如果是油机发电,系统记录油机发电过程,直到市电恢复。
通过建设智慧机房管理平台,AI识别人员闯入、通道堵塞、未戴安全帽施工等,5秒内自动触发告警并派发短信、工单,进一步强化了机房风险管控。实时监控机房、重要机柜、重要通道等,着火、烟雾、AI识别人员摔倒为0,机房被盗、机房门锁被破坏发生量为0,确保机房安全,规范机房管理。同时加强空调远程智能控制、油机发电稽核、单板卡/机柜/机房PUE稽核,PUE整治节省电费300万元/年,发电稽核节省200万元/年,空调控制节省电费500万元/年。
中国电信正在推进云改数转,智慧机房为运营管理数字化转型提供了新思路,对于兄弟省份而言,具有可实施性和一定的参考使用价值。