|
间进行了查杀病毒,重装系统,恢复数据等工作,症状大大减轻。但未能经受住昨夜暴风雨
的考验(本周天气除昨天下午间晴外,连续降雨),最终于今晨"死网"。
为便于观察,支行网管人员在计算中心将连接营业部的交换机用集线器暂时取代,
结果导致支行网络速度也变慢。检查营业部内的交换数据无障碍,断定是传输通道的问题。
拔下光纤,支行速度恢复正常,插上光纤则上述现象重新出现。进一部测试光纤链路,连接
和衰减均符合要求。故障排除工作陷于停顿。
[诊断过程]据网管人员介绍的上述情况,光纤和交换机已经过了网管人员初步检测,
基本正常。可以初步判定问题出在链路通道上。将 F683 网络测试仪接入营业部交换机,观
察网络基本正常。进行通道测试,检测营业部到支行的 ICMP Ping 测试结果,成功率约 0.8
%,路由追踪支行服务
器,成功率约 0.5%。从支行集线器上观察,流量 18%,属正常范围,但发现大量"幻象干
扰"错误"Gosts"(16%),拔除光纤,则错误为 0%,至此可以肯定错误与营业部网络及
其通道有关。将营业部与支行连接的交换机接口串入一个 4 端口的集线器,用 F683 网络测
试仪观察网络,流量 5%,发现大量幻象干扰(97%),拔除光纤,错误消失。寻找光纤接线
箱,发现支行一侧的接线箱外包装已被撞击变形、破损(据说是半年前安装空调时被吊车臂
碰坏),雨水已将 3 号接头完全浸蚀(3 号接头用于连接营业部)。清洁接线箱内的所有光纤
接头,用电吹风加热干燥光纤的插头插座,重新更换并密封接线箱,故障彻底消失。
[诊断评点]光纤链路经常被忽视。本故障中,光纤接头因雨水侵蚀和污染,从营业
部送来的信号被大量反射,此时若只测试光纤链路的物理性能是合格的。但由于此段光纤只
有 90 米,强反射信号经过较少的衰减后与正常信号叠加,破坏了数据的结构(包括数据帧帧
头信号格式),网络测试仪即认为这是幻象干扰信号而不是正常的数据信号。此时只有少数
信号可能侥幸通过。由于集线器和交换器不具备前期碰撞的识别能力,所以从网管上只能观
察到数据帧后半部分被破坏后所表现出来的少量 FCS/CRC 类型的错误,此错误往往被人忽
视。
昨天重装系统后因天气转晴,光纤接头性能有所好转,症状减轻。昨夜暴雨又使网
络陷入灾难境地。加上今天测试光纤链路显示正常,致使故障排除陷于停顿,束手无策。
[建议]交换器对均衡网络负荷、隔离故障网段对网络的影响有很好的效果,但也因
此经常成为网管系统监测中的"黑洞"。用网络测试仪定期监测网络可以将故障消灭在萌芽
状态之中。定期测试分很多种,我们将在以后的连载中陆续介绍。本故障如不及时处理,其 |