释义:AC全称为Access Controller,意思是接入控制器。BRAS全称为Broadband Remote Access Server,意思是宽带远程接入服务器。SW全称为switch,意思是交换机。SR全称为Service Router,意思是全业务路由器 。CR全称为Core Router,意思是核心路由器。
AC作用:一个加强允许或者拒绝用户访问网络资源的控制方法,通常基于用户的帐户或者用户所属的某个组。
BRAS作用:在数字用户线接入复用设备 (DSLAM)在一个互联网服务提供商(ISP)的网络中。
SW作用:是一个扩大网络的器材,能为子网络中提供更多的连接 端口,以便连接更多的计算机。
SR作用:业务路由器是可扩展升级的Internet路由器,可以提供尽力而为的Internet业务,使传统的数据业务的迁移成为可能。
CR作用:核心路由器又称“骨干路由器”,是位于网络中心的路由器。位于网络边缘的路由器叫接入路由器。
BAS的基本功能是实现宽带用户的管理特性和业务发起功能,包括用户识别、认证、计费、IP地址管理、安全性管理等内容。而承载这个系统的服务器就是BAS服务器了。通过ATM网络下挂DSLAM方式可以实现ADSL用户专线方案,整个解决方案建立在二层网络之上,认证、计费和IP层管理功能都无法实现,为此可通过引入BAS概念,作为ATM网到IP网的互通网关和认证服务器,实现用户的认证、计费和管理。望闻问切"是中医诊病的常用手法,也是沿用了数千年的一个医病良方。在宽带网络架构渐趋复杂化的今天,各种疑难杂症也纷纷光顾。可是,很多宽带网络的维护人员却一直没有找到解决这些疑难杂症的良方。从技术角度来讲,无论何种宽带故障,只要细心观察故障现象,解决宽带故障并不难,如同中医诊病一样,对于宽带网络疑难杂症,同样需要望闻问切。
下面,笔者结合几例非常经典的宽带网络故障,讲述一下如何用"望闻问切"的方法解决宽带网络的疑难杂症。
1、固定IP的ADSL无法上网
故障表现:为了优化ADSL宽带网络,将原有充当路由功能的三层交换机改为数据透传。升级完成之后,ADSL宽带用户可以直接由DSLAM节点透传到BAS服务器,可是,升级完成之后,固定IP的ADSL用户无法上网,而PPPoE虚拟拨号用户则正常。
图一 ADSL宽带网络拓扑
故障解析:经过改造之后,数据的走向如上图所示。PPPoE虚拟拨号用户可以上网,而固定IP的ADSL用户无法上网,从这一故障表现可以看出,固定IP用户的数据可以直接透传到BAS服务器。无论PPPoE虚拟拨号的ADSL用户,还是固定IP的ADSL用户,都需要在BAS上进行身份验证。PPPoE虚拟拨号用户需要提供帐号和密码,而固定IP的ADSL用户需要提供固定IP是否可用,以及该固定IP用户在DSLAM节点的VLAN标签即Tag值。
由于该固定IP的ADSL用户无法上网,其故障点可能在数据透传或BAS验证两个方面。通过对故障的"望"和"闻"之后,必须问一下用户端的症状,以进行故障定位。据该固定IP的ADSL用户反应,在路由器中,可以看到宽带网络局端的MAC地址,在宽带运营商的网管系统中,也可以看到该固定IP的ADSL用户的MAC地址。显然,该故障并不是因为数据透传引起的。
通过一番对比之后,将宽带故障锁定在BAS验证这一环节。过去,固定IP的ADSL用户,其数据通过一台三层交换机转发,DSLAM节点处只有一个Tag值。数据透传之后,原来有三层交换机负责进行IP地址验证转由认证服务器来做,而DSLAM节点的数据仍然仅仅是一个Tag和MAC地址,没有该名用户相应的IP地址信息。对于固定IP的ADSL用户而言,宽带运营商分配的IP地址是数据的通行证,没有IP信息,数据是不能通过BAS服务器的。
在宽带运营商的网管系统中,将该固定IP的ADSL用户的IP地址和MAC地址绑定在DSLAM节点中,认证服务器就可以完成对该用户的身份认证,故障也得以解决。
故障点评:在上述故障的处理中,对该名用户故障的查看就是"望"和"闻",询问用户无法上网的表现是"问"。通过分析宽带接入的原理,结合故障表现,称为"切"。不难看出,只要熟知工作原理,了解每个数据传输的流程,解决宽带故障并不难。
2、ADSL宽带用户有规律的掉线
故障表现:近日,客服热线方面反应,有一个小区的ADSL宽带经常有规律的掉线。掉线时间通常在晚上7点半左右,掉线可以持续2个小时左右。周六和周日也会有掉线,而且掉线频率比平时要高一些。
故障解析:由于掉线的故障是通过客户热线转过来的,加之客户对于掉线的并没有一个准确的认识,"掉线"故障必须要问清楚。从客户热线的数据可以看得出来,反应ADSL宽带有规律掉线的用户,全部是一个DSLAM节点的用户。
晚上8点到9点之间,从网管系统查看DSLAM的状态,发现用户是经常掉线,是用户手工强制断开的。询问用户得知,晚上或者周末上网时,打开一个网页经常需要涮新几次才可以,重新断开拨号连接之后就没有此故障。从技术角度讲,用户反应的有规律"掉线"其实是数据流队列太长所致,并非真正的掉线。仔细查看与DSLAM节点相连的三层交换机的日志不难发现,来自该DSLAM节点的数据流比较大,校验数据占总流量的20%左右。
图二 交换机各端口流量图
故障的根源找到了,大量ADSL用户上网时,DSLAM节点的数据流量会增大,其中一些数据通过三层交换机传输时,校验包的增多,造成网络数据传输的拥塞。
造成DSLAM节点数据传输拥塞的原因,无非是因为DSLAM节点与三层交换机传输协议不一致,或者是端口速度不协调。在网管软件中查看得到,三层交换机分配给DSLAM的端口传输状态是100Mbps Full,而DSLAM节点的光猫状态是10/100Mbps自适应。将传输状态改为一致的传输模式后,故障解决。
故障点评:目前,很多ADSL用户并不明白什么是掉线,什么是数据断流,什么是数据拥塞,为此,宽带维护人员必须亲自查看用户掉线时的具体表现。查看用户掉线的表现,如同中医诊病的"望"一样重要。
3、DSLAM节点工作状态不明
故障表现:一个星期日的中午,某分局局长打过来电话,称该分局的辖区内的几个单位全部无法上网,所有用户都在打电话投诉无法上网。进入网管系统,发现DSLAM节点已经状态不明,查看与其相连的交换机,发现与该DSLAM节点相对应的端口没有数据流量。
故障解析:由于该区域内的所有ADSL用户无法上网,而且在网管系统内无法查看到DSLAM节点的工作状态,通过以上表现不难看出,故障的根源可能是局端机房的网络设备。供电系统,网络系统或者是DSLAM节点,都有可能出现故障。
为了进一步弄清楚故障点在哪里,必须询问ADSL用户具体情况,无法上网有很多原因,到底是哪一种原因导致ADSL无法上网。通过询问得知,所有ADSL用户的宽带Modem无法上线,也就是说,ADSL线路无法激活。看来,是DSLAM节点故障了。
由于网管系统已经无法查看到DSLAM节点的工作状态,也就无法令其重新启动。维护人员赶到现场之后,发现DSLAM设备的指示灯呈现**,而且在闪烁状态。将DSLAM的电源关闭,五分钟后重新启动,DSLAM设备仍然无法正常工作。难道是DSLAM设备出现了故障
图三 交换机温度及风扇状态
从网管系统对该机房的所有设备进行检测,发现该机房的温度和湿度都不在正常的范围之内,难道是温度过高所致立即通知维护人员检查空调的运行状态,发现空调尽管在致冷状态,温度也在24度的恒温,可是,空调的致冷效果并不好,机房内的温度已经升高至33度左右。启动备用空调,温度降低到24度之后,DSLAM设备正常启动了,至此,故障排除。后来,查阅DSLAM的说明书得知,DSLAM有一项过热保护功能,当整体温度达到一定的温度之后,DSLAM会进入休眠状态。
故障点评:尽管通过"望闻问切"的方法,找到了故障的根源是在DSLAM节点上。可是,维护人员一味的查找设备的问题,却忽略了设备的工作环境。电信级别的网络设备,对于工作环境的要求非常苛刻,温度要适中,湿度也要合适。为此,在遇到网络设备无法工作时,首先要查看设备的工作环境。
写在最后:从以上三则宽带网络经典故障的处理过程可以看出,查看网络故障表现必须要细致,更要细致的观察客户端与服务器端的故障表现。要想轻松解决宽带网络的疑难杂症,"望闻问切"的步骤一个都不能少,因为给网络诊病如同中医为人医病是一样的道理。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)