华为MA5626设备DBA模板配置错误导致业务拥塞 一、故障处理简述:
远洋船员学院WLAN业务通过GPON网络承载,业务开通后大量用户反映忙时上网慢,从数据城域网汇聚交换机上PINGAP管理地址,所有AP的时延都很大,达到700ms以上。通过现场检测光功率、从OLT PING大包到ONU的管理地址、硬件排查都没有问题。用笔记本登录ONU发现OLT发现ONU上行的PING测数据,在OLT侧并没有收全,可判断是网络拥塞的问题。经过更改绑定的DBA模板,故障恢复。
组网拓扑图如下,远洋学院WLAN业务均通过一个PON口承载,共计4台ONU。
同PON口下承载的辽河招待所业务未出现故障,初步判断未分光器以下问题。
二、故障处理过程:
1. 排查光功率,发现光功率无异常,从OLT进行大包ping ONU MA5626的管理地址,没有丢包,问题不是出在光路上,排除光路问题;
2. 怀疑MA5626设备硬件故障,对设备进行重启,重启后WLAN业务测试速率正常,由于AP有上行链路检测机制初步确认为ONU或AP软件故障; 3. 重启后不久,故障再次出现。怀疑ONU负荷过高,查证后,ONU的CPU利用率在25%左右,MA5626处理不是很忙,在OLT上查看PON口流量,也不是很大,只有10Mbit/s左右,带宽占用不高;
4. shutdown ONU的eth端口,发现只有少量AP上线时,ping AP管理地址时延明显缩短,初步判断为网络拥塞;
5. 用笔记本接到MA5626上,在OLT上和ONU上同时做ICMP统计,经过统计,发现ONU上行的PING测数据,在OLT侧并没有收全; 6. 查看ONU上学到的MAC,命令为:
display mac-address all
发现只有AP的管理VLAN的MAC地址。
7. 在OLT上将ONU的管理DBA模板中的带宽提高到30M,再次ping AP的管理地址,时延从700ms下降到3ms,在现场测试,上网速度正常,故障排除。
三、故障总结:
1. 在OLT侧定义了两个模板,分别针对本地、集中转发模式。
2. 集中转发模式下,将上行带宽设成“预留30M,最大60M”,使ONU上行带宽利用率保持在安全范围内。
3. 要求开通业务时,必须对WLAN的转发模式做好沟通,应用不同的配置模板。

