文|美国福禄克公司 尹 岗
相对于高速链路而言,“传统的”低速光纤链路是指计算机网络中常见的10M/100M链路,在过去的十多年中,它们在局域网、园区网中得到了极大的应用。低速光纤链路的质量检测只需要执行一级测试就可以确保应用稳定运行,也就是说,只要光纤链路的损耗不超标,10M/100M光纤链路就可以正常运行。从对高速光纤链路的大量实地检测结果看,这给不少网管人员甚至专业人员造成了一种误解:认为只要一条光纤链路的损耗值长度符合要求,就一定能支持未来的高速应用。随着数据集中方式的逐渐流行,情况正变得越来越糟。由于数据中心机房的服务器速度提升很快,从早期最常用的100M、1000M光纤到近几年的万兆以及40G、100G开始迅速入市,早期布线中的大量质量问题开始暴露出来,原先设想仅靠升级设备速度来应对数据流量快速增加的预案,多数被推翻,只能重新设计建造新的机房,达到应用速度随着业务流量快速提升的目的。另外,数据集中的结构形式虽然有很多优点,但也给服务器的光纤接入链路带来了前所未有的“提速压力”,这种压力主要来自于提速的成本。人们不得不在“数据集中”和“分布式计算”两种方案中做出数据可靠性选择和投入成本的取舍。可以这样说,只要提高接入速度所做出的努力其性价比较合适,则人们会毫不犹豫地倾向于优先选择数据集中的结构模式,这给建设规划人员也提出了新的挑战。其实,只要认真把握好光纤布线系统的质量,适时同步升级系统就是一件轻而易举的事情,大可不必花费巨资重建新系统。进一步讲,如果新建光纤布线系统链路质量不能保证,则可能在适时升级时再次遇到升级障碍。
升级障碍又叫“升级阵痛”,特指从原先正常运行的低速光纤(10M/100M)或中速光纤应用(1000M)过度到高速光纤应用时出现的接入异常问题。我们先简单地讨论一下这个问题的形成原因,以便在后文中介绍高速光纤安装特性及质量的检测、链路快速故障诊断定位等内容设定一个知识前提。
速度的快速提升意味着更高的光数据脉冲频率及更窄的光脉冲宽度将被采用。为了达到此目标,出于成本考虑,开发人员倾向于采用或被迫采用多模光纤和更小功率的光器件,以期回避高额成本的问题。采用多模光纤和小功率光收发器件,会导致设计或安装过程中需要谨慎对待的结果:一是整条光纤链路的损耗预算变得很紧张,像在低速的10M/100M时代常见的11/13dB甚至更高的链路损耗都能正常工作的光纤链路,普遍被压缩到2.7dB左右甚至更低的损耗预算值,此时如果在光纤安装过程中稍有不慎就可能导致链路的损耗值预算超标,从而造成中、高速的 1G/10G/40G/100G链路不能工作。另一个结果则是来自于色散的影响,色散限制了多模光纤链路的应用长度,为此富有创意的工程师专门开发出了OM3、OM4等色散优化多模光纤,这些光纤对安装质量的要求变得更为严格,光纤的连接点特别是机械连接点的质量会严重影响整条光纤链路的传输特性。以优化后的折射率渐变光纤为例,由于光纤横截面从中心到边沿的折射率是不渐变的,这就对光纤连接点的直径匹配和轴心匹配提出了更高的要求。在光纤连接点,由于偏心或折射率分布的渐变过程不“同步”、连接点存在污渍和擦伤、熔接点质量差等都有可能导致高速应用的误码率上升。最终呈现给网管人员并令他们手忙脚乱的就是误码率上升造成的连接不稳定或失去高速连接。
对于上述两个问题,一级测试可以应对损耗、长度超标问题,只要损耗、长度测试超过标准就可以判定链路质量不合格,而高精度的色散测试则可以发现色散超标的问题。但在实际的现场测试中,色散测试由于成本高昂,缺少现场手持仪表的支持,目前无法普及,并且即便测试不合格,也仍然无法进一步定位问题的准确物理位置,对故障的排除帮助不大。在此情况下,工程师转而采用高解析度的OTDR测试仪来检测并发现连接点质量问题和可能的色散问题。这是一种间接的方法,实践证明其非常实用、有效。图1是一级测试,图2是二级测试增加的OTDR曲线。
图1 测试损耗、长度(双向)
图2 测试OTDR曲线(尖峰菲涅耳)
OTDR最基本的检测机理是这样的,发光器件将光脉冲注入被测光纤中,此光脉冲能量在光纤中传输时会有微弱的反射能量回到发射端,在光纤的机械连接点或断裂缝隙则会有较强的反射能量回到发射端。其中,光纤末端的反射能量一般都是最强的,如果光纤越长、连接点越远,则反射信号回到发射端的时间越长,反射回来的信号也就越弱。OTDR接收并记录这些反射能量,就能根据信号的强弱和属性判断出哪里是断点、哪里是连接点、哪里是熔接点。传统的OTDR是为测定单模光纤断点位置而开发的,主要用于长途干线光纤的检测,它可以测试光纤断点的物理位置,帮助维护人员快速解决断纤故障。
高解析度的OTDR主要用于园区网,可以精确分析接收到的反射信号的能量,并判断各个瑞利或菲涅耳反射对应的“事件点”的属性。比如,根据反射信号记录波形的强弱、形状就可以间接地了解此对应连接点、熔接点的质量。对于高速多模光纤(OM3/OM4),如果连接点偏心,则反射能量会增加,同时损耗也会增加,这些现象都可以从反射信号记录“波形”上反映出来。同样地,OM3/OM4链路中两个紧邻的端接面,如果其折射率由内向外的渐变过程“不同步”也会出现类似现象。另外,更常见的是,如果连接点端面不清洁或有擦伤,同样也会出现相似的结果。测试仪会仔细的自动判读这些反射点的信号差异,然后为工程师提供更多的故障提示信息。对于熔接点,如果损耗过高可能会导致有用信号损耗过大或色散增加,仔细判读这类反射信号也可以获得更多的质量信息。为此,TSB140标准给出了简单易行的判断建议:对连接点/熔接点的损耗及其反射属性进行判断,可在最大程度上帮助工程师确定并排除引起链路故障的各种“事件”。在测试过程中,TSB140标准对应于“事件表”中各个“事件点”的判定门限的量化标准默认值取自TIA 568B.1标准。不过,由于TSB140是一个开放式标准,因此它允许要求高的用户修改并自行设定判定门限值。有两个要点需要提醒读者,一是将修改后的检测门限值在验收合同中注明,以免引起乙方歧义。二是选择高解析度的OTDR,以便准确识别连接点质量,否则,低解析度的OTDR会将一条2~10m长的跳线也认为是一个连接点,误判率较高。福禄克网络生产的OptiFiber光纤认证仪可以识别最短至0.3m的跳线,而不是将其简单地判为一个事件点。
引起不合格“事件”的原因很多,但最终结果都是增加链路的损耗值、色散值和造成幻像干扰。
这些“事件”可来自较差的连接器、熔接点、过度的弯曲(宏弯曲)、捆扎过紧、光纤气泡、杂质、微弯曲、应力裂纹等问题。通过OTDR曲线的详细分析,这些潜在的影响高速光纤链路性能的“事件”将被发现,定位其精确位置后可采取相应措施排除“故障”。
这些措施包括:更换不合格的光纤、跳线、连接器,查看并清洁受到污损的光纤连接器端面,修复/置换连接器内部断裂的光纤、重新熔接光纤、解除过度弯曲和捆扎的应力。
图3 OTDR曲线举例(223.63m)
图3所示为一段223.63m长的多模光纤万兆链路,表现为误码率高,连接不稳定。让我们来看看其中都有哪些“事件”影响了链路的性能。该链路中共有四个连接点、一个熔接点。请对照参看图4事件表,其中201.69~204.11m一段是一根约2.5m长的跳线。在曲线中可以看到中间比较宽的那个尖峰。从图4所示的事件表上判断,整条链路的质量是不符合要求的,具体不合格的位置是:151.68m处的连接点损耗太大,需要检查处理;214.05m处的“跌落”也很差,如果是个熔接点,则此熔接点需要重新熔接,如果是过度弯曲点,则需要“松绑”。结论:长度不超差,但性能不达标,支持万兆或更高速率需谨慎使用。
进一步分析指出,从OTDR曲线还可以看到,因为没有在两头分别加发射和接收补偿光纤,所以本测试结果不包括两端插头/插座的端面质量,也就是说,即便我们修复了图4中的两个“故障点”,也不能保证次链路接入交换机和服务器就一定能正常工作,因为两端的端面质量我们并不能保证。
经常地,我们可以借助光纤显微镜来检查两端光纤端面的质量。查看光纤端面需要使用光纤显微镜,比如福禄克网络公司生产的FT500迷你光纤视频显微镜,它可以在小型屏幕上显示放大端面影像到200倍实时图像,直观了解端面质量、损伤和受污染情况。发现有问题的光纤后可以用光纤清洁工具将其清洁干净。如果是端面损伤或碎裂,则需要重新磨制或更换连接器。如果从OTDR曲线上或事件列表上看到熔接点问题,则需要按照仪器提示的距离找到熔接点并使用光纤熔接机重新熔接。
不能。光纤的损耗问题虽然比较容易发现,但“事件”判断的一致性确实存在差异,也就是说,不同类型的OTDR发现不合格“事件”的能力是不同的,有的强,有的弱,弱者误判、漏判率高。这主要取决于OTDR的解析度,而解析度与光纤测试的量程有时候又是互相矛盾的,光纤越长,就需要降低解析度、增大测试光脉冲宽度来满足长度测试的要求,否则量程可能达不到指标要求,此时可能无助于发现问题事件点。比如,极端的情况下,干线型OTDR甚至会将一根15m的跳线认作是一个“连接点”,这当然谈不上准确识别“异常”连接点(如图4中201.69m~204.11m处的两个事件)。不过情况似乎没有工程师想象的那样糟,由于长距离光纤多数采用单模光纤,而单模光纤的“升级阵痛”比例很小,一般只是损耗超标(多为端面污损造成),基本不存在色散超标的问题。因此,工程师们经常遇到的还是短距离多模高速光纤链路的问题,这类问题在园区网、局域网类型的网络里面占据大量比例。一般使用园区网类型的高解析度OTDR,就可以较好地测试多模和单模光纤,这对于发现更精细、隐蔽的“事件”和短跳线比较方便。在故障诊断的过程中,还可以根据具体情况进行分段测试,以便精确跟踪和定位某些疑难故障点。这样可以提高色散问题的诊断成功率,降低漏判、误判率。
图4 对应OTDR曲线的事件列表(判读门限未定义)
不普遍。原因之一是长期以来只使用“一级测试”来认证光纤质量,TSB140是伴随高速光纤应用普及而推出的标准,但关于二级测试的其他相关标准目前较少涉猎;原因是高速光纤的大量使用还是近几年的事情,遭遇升级阵痛的用户还比较少,或用户干脆回避升级镇痛问题直接考虑建造全新的光纤网络,因此困惑多来自于少数网管和光纤维护人员,这为解决大量潜在的高速链路问题是不利的。
有四个原因。一是认证选用的OTDR是干线型的,适合长距离测试,很可能存在解析度不足的问题,无法发现“真正的”事件点。二是测试的时候没有使用补偿光纤。我们知道,测试仪在接收反射信号时,其感光接口由于受到饱和光反射能量的冲击会存在“事件死区”,“事件死区”会持续一段很短的时间,如果在这段死区内恰恰有不合格事件就不能被发现,这跟用强光手电照射人眼后几秒钟内眼睛看不见东西的道理是一样的。补偿光纤是连接在OTDR测试仪与被测光纤链路之间的一段高质量光纤,或是连接在被测光纤链路末端的一段高质量光纤。如此,接入发射补偿光纤后被测光纤真正的起点就从仪器的测试接口转移到补偿光纤的另一端,这样就可以“避开”仪器接口的死区,保证“被测链路”的第一个真实连接点的质量也能被检测到。多模发射补偿光纤长度一般从几十米到100m,卷绕在一个类似面包的盘纤盒内。在被测链路的末端,由于光纤是开路的,所以光脉冲从此射出时遇到的介质是空气而不是实际在用时的光纤跳线或光模块端口,这两类介质对反射能量的影响是不一样的。因此,为了精确评估末端连接点的质量,此时应该在链路末端再连接一段接收补偿光纤来仿真端面反射的真实情况。第三,临时使用了劣质的光纤跳线接入设备造成损耗或色散超标。第四,虽然是最后一条但却是最常见的原因,光纤链路端面污损,端面未装防尘帽或现场灰尘密度太高、指纹污染等。如图5、6所示。
图7是一种补偿光纤盒的外形图,图8是增加了发射和补偿光纤后测试的OTDR曲线。被测链路就是两条虚线间的100m光纤,即从标记为0m处的第一个光纤插座到标记为100m的最后一个插座之间的那部分光纤。从图中可以看出,两端的菲涅耳反射不高,尖峰后的瑞利反射“跌落”也很小,是一条质量优良的高速光纤短链路。其中在50m处有一根短跳线,连接质量也不错。
损耗和色散是多模光纤链路安装特性的最主要的考察因素。低速光纤的质量评估和故障诊断只考察损耗、长度参数就基本上满足需求,而高速光纤则还要在此基础上重点考察色散。现场评估可以使用高解析度的OTDR测试仪来间接地评估引起性能下降的“事件”,它可能包括诸如损耗、长度等信息,也包括色散信息。二级测试就是在一级测试的基础上增加了高解析度OTDR曲线检测的一种测试手段,并由此判定是否存在引起性能下降的各种“异常事件”,这对于高速光纤链路的质量保证、验收检测和故障诊断都具有非常实用的指导意义。当发现有问题的连接点后,我们可以使用光纤显微镜进一步检查或确认,并可用光纤清洁工具帮助解决最常见的端面脏污问题。
图5 视频光纤显微镜
图6 光纤端面质量问题(损伤、污渍)
图7 补偿光纤
图8 发射光纤和接收光纤