時間:2015-06-28 00:00:00 來源:IT貓撲網(wǎng) 作者:網(wǎng)管聯(lián)盟 我要評論(0)
在管理和維護(hù)網(wǎng)絡(luò)的過程中,相信每一位網(wǎng)絡(luò)管理員都可能會碰到這樣或那樣的網(wǎng)絡(luò)故障,而引起網(wǎng)絡(luò)故障的原因也是各式各樣,要想迅速解決網(wǎng)絡(luò)故障,往往需要經(jīng)過一段時間的仔細(xì)排查才可以;當(dāng)然,也有一些網(wǎng)絡(luò)故障現(xiàn)象比較明顯,我們只要根據(jù)具體的現(xiàn)象就能大概判斷出引起故障的原因,并能迅速采取針對性措施來高效解決故障現(xiàn)象了。這不,本文所描述的網(wǎng)絡(luò)故障,由于現(xiàn)象比較明顯,網(wǎng)絡(luò)管理員經(jīng)過簡單的分析,就迅速找到到故障原因了,由于該故障排除過程具有一定的典型性,故在此與各位朋友一起分享交流!
故障現(xiàn)象
筆者所在單位接上級單位通知,要求建立上下聯(lián)動的數(shù)據(jù)交換平臺,前一段時間,筆者單位在省中心技術(shù)人員的協(xié)助下,使用移動的2M寬帶光纖線路實現(xiàn)了與省數(shù)據(jù)交換平臺的互連。最近,按照工作計劃安排,下屬三家縣級單位也要通過移動的2M寬帶光纖線路與市中心平臺連接,而市中心平臺主要由R1、R2、R3、R4四個路由器以及對應(yīng)的中繼設(shè)備組成,其中R1路由器是核心路由器,R2、R3、R4路由器分別是三家縣級單位的路由器,這幾個路由器設(shè)備統(tǒng)一使用S0端口與R1路由器的S0、S1、S2端口連接。依照組網(wǎng)規(guī)劃,網(wǎng)絡(luò)管理員將R1路由器S0端口的IP地址設(shè)置為了10.176.0.211/30,將S1端口的IP地址設(shè)置為了10.176.0.216/30,將S2端口的IP地址設(shè)置為了10.176.0.221/30,將R2路由器S0端口的IP地址設(shè)置為了10.176.0.212/30,將R3路由器S0端口的IP地址設(shè)置為了10.176.0.217/30,將R4路由器S0端口的的IP地址設(shè)置為了10.176.0.222/30。
在組網(wǎng)過程中,網(wǎng)絡(luò)管理員發(fā)現(xiàn)在前兩個縣級單位接到市中心的R1路由器上后,他們都能通過市中心交換平臺順利訪問到省中心的數(shù)據(jù)交換平臺,而且訪問速度也比較順暢,可是將第三個縣級單位接到市中心的R1路由器上后,發(fā)現(xiàn)沒有多長時間,整個市中心網(wǎng)絡(luò)全部癱瘓,原先能夠正常訪問的前兩個縣級單位也不能正常上網(wǎng)訪問了。
故障排查
剛開始的時候,網(wǎng)絡(luò)管理員還以為是市中心平臺到省中心平臺之間的這段線路出了問題,于是立即電話聯(lián)系當(dāng)?shù)匾苿庸?,請求他們派技術(shù)人員前來測試線路,經(jīng)過一段時間的檢測,移動公司人員確認(rèn)線路不存在任何問題,而且他們還順便檢測了市中心到幾個縣級市的幾條寬帶線路,發(fā)現(xiàn)所有寬帶線路的連通性都是正常的,這說明市中心網(wǎng)絡(luò)平臺癱瘓故障與寬帶線路的連通性沒有任何關(guān)系。
在排除了寬帶線路因素后,網(wǎng)絡(luò)管理員又開始懷疑R1路由器的工作狀態(tài)不正常,畢竟能造成所有下屬單位不能同時上網(wǎng)故障的,只有這臺核心路由器設(shè)備了;依照以往經(jīng)驗,網(wǎng)絡(luò)管理員認(rèn)為類似交換機(jī)、路由器這樣的設(shè)備持續(xù)工作時間比較長的時候,很容易出現(xiàn)一些緩存溢出之類的錯誤,這些錯誤很容易造成交換機(jī)、路由器等設(shè)備的工作狀態(tài)不正常,從而可能引發(fā)網(wǎng)絡(luò)癱瘓的故障現(xiàn)象;對于緩存溢出之類的軟故障,我們往往只要重新啟動一下對應(yīng)設(shè)備的后臺系統(tǒng),就能讓其工作狀態(tài)恢復(fù)正常了。根據(jù)這樣的分析,網(wǎng)絡(luò)管理員立即趕到R1路由器的現(xiàn)場,仔細(xì)觀察控制面板的信號燈狀態(tài),發(fā)現(xiàn)并沒有異常之處,不過為了排除核心路由器自身狀態(tài)因素,網(wǎng)絡(luò)管理員還是切斷了核心路由器設(shè)備的電源,過了一段時間,重新接通其電源,對該設(shè)備后臺系統(tǒng)進(jìn)行了啟動, 待后臺系統(tǒng)啟動成功后,網(wǎng)絡(luò)管理員從本地嘗試訪問省中心的數(shù)據(jù)交換平臺時,發(fā)現(xiàn)故障現(xiàn)象已經(jīng)消除;就在網(wǎng)絡(luò)管理員認(rèn)為故障已經(jīng)被排除時,下屬單位的工作人員打電話過來,說以前的故障現(xiàn)象又出現(xiàn)了,網(wǎng)絡(luò)管理員再次從本地訪問時,發(fā)現(xiàn)網(wǎng)絡(luò)連接的確又不正常了,看來核心路由器受到了大容量數(shù)據(jù)的攻擊了。
考慮到前兩個縣級單位與市中心平臺相連時,整個網(wǎng)絡(luò)平臺訪問省中心一切正常,這說明前兩個縣級單位與市中心平臺所使用的路由器設(shè)備工作狀態(tài)是正常的,而且參數(shù)配置也是正確的。既然第三家縣級單位連上市中心平臺后,整個市中心平臺無法訪問省中心數(shù)據(jù)交換平臺,那么問題可能出在第三家縣級單位上,于是網(wǎng)絡(luò)管理員立即聯(lián)系相關(guān)的技術(shù)人員,請他們認(rèn)真檢查自己內(nèi)網(wǎng)的組網(wǎng)情況,特別是要檢查內(nèi)網(wǎng)的物理連接,看看是否存在網(wǎng)絡(luò)環(huán)路現(xiàn)象;很快,網(wǎng)絡(luò)管理員就得到了反饋信息,說他們經(jīng)過仔細(xì)檢查,沒有看到第三家縣級單位內(nèi)網(wǎng)中存在網(wǎng)絡(luò)環(huán)路現(xiàn)象,而且查看相關(guān)設(shè)備的配置參數(shù)時,也沒有看到不正確的地方,這么說來,難道第三家縣級單位內(nèi)網(wǎng)不存在問題?可事實是,當(dāng)?shù)谌铱h級單位內(nèi)網(wǎng)連接到市中心平臺之后,市級網(wǎng)絡(luò)癱瘓故障才發(fā)生的,這就直接證明網(wǎng)絡(luò)故障肯定與第三家縣級單位內(nèi)網(wǎng)的接入有關(guān);聯(lián)想到核心路由器重新啟動成功后,剛開始的一段時間網(wǎng)絡(luò)連接是正常的,只是過一段時間后,網(wǎng)絡(luò)癱瘓故障才發(fā)生的,為此網(wǎng)絡(luò)管理員估計第三家縣級單位內(nèi)網(wǎng)可能存在廣播風(fēng)暴現(xiàn)象,這種現(xiàn)象很快就將核心路由器給"頂死"了,從而造成了核心路由器啟動穩(wěn)定后過一段時間就死機(jī)的現(xiàn)象。
而造成廣播風(fēng)暴現(xiàn)象最主要的因素,無非就是網(wǎng)絡(luò)病毒、網(wǎng)絡(luò)環(huán)路、網(wǎng)絡(luò)配置已經(jīng)硬件損壞因素;為了排除這些因素,網(wǎng)絡(luò)管理員讓第三家縣級單位的工作人員,只連接一臺沒有病毒感染的計算機(jī)到對應(yīng)的路由器上,看看網(wǎng)絡(luò)故障是否能夠自動消失,如果故障現(xiàn)象仍然存在,那就說明問題與網(wǎng)絡(luò)環(huán)路、硬件損壞以及網(wǎng)絡(luò)病毒沒有任何關(guān)系,的確在第三家縣級單位只有一臺計算機(jī)上網(wǎng)的情況下,市中心平臺仍然還無法與省中心平臺互連,這說明問題肯定是由縣級單位的路由器引起的。
解決故障
既然找到了故障位置,那么故障排除起來也就不是那么麻煩了;網(wǎng)絡(luò)管理員建議先將對應(yīng)的路由器設(shè)備重新啟動一下,看看是不是該路由器存在軟性故障,可是重新啟動之后,網(wǎng)絡(luò)癱瘓故障仍然存在,這說明對應(yīng)的路由器設(shè)備不存在軟性故障,那會不會是該路由器設(shè)備發(fā)生了硬件損壞呢?但是想到該路由器設(shè)備剛剛才工作沒有多長時間,而且該設(shè)備也是品牌產(chǎn)品,按理來說它不容易損壞才對,為此網(wǎng)絡(luò)管理員開始懷疑該設(shè)備的參數(shù)配置不正確。于是,網(wǎng)絡(luò)管理員請對方的技術(shù)人員,將他們使用的路由器配置參數(shù)告訴自己,結(jié)果經(jīng)過仔細(xì)對比,網(wǎng)絡(luò)管理員發(fā)現(xiàn)對方的工作人員無意中將R2路由器S0端口的IP地址設(shè)置為了10.176.0.212/28,而實際上第三家縣級單位網(wǎng)絡(luò)的掩碼位數(shù)應(yīng)該為30位,可現(xiàn)在卻被設(shè)置成了28位,會不會是掩碼位數(shù)設(shè)置不當(dāng)造成了整個市級網(wǎng)絡(luò)平臺發(fā)生癱瘓現(xiàn)象呢?經(jīng)過仔細(xì)分析,網(wǎng)絡(luò)管理員發(fā)現(xiàn)當(dāng)?shù)谌铱h級單位網(wǎng)絡(luò)的掩碼位數(shù)設(shè)置為28位后,R1路由器S0端口的IP地址10.176.0.211/30,S1端口的IP地址10.176.0.216/30,S2端口的IP地址10.176.0.221/30,R2路由器S0端口的IP地址10.176.0.212/28,R3路由器S0端口的IP地址10.176.0.217/30,R4路由器S0端口的的IP地址10.176.0.222/30全部位于同一個工作子網(wǎng)中了,那樣一來下屬單位發(fā)送到核心路由器的數(shù)據(jù)包,在R1路由器中就不能找到合適的尋徑路由,那么數(shù)據(jù)包只能在核心路由器的幾個端口上進(jìn)行循環(huán)傳輸,最終將核心路由器的系統(tǒng)資源全部消耗掉,造成了該設(shè)備發(fā)生癱瘓現(xiàn)象,最終引發(fā)整個市級平臺網(wǎng)絡(luò)無法訪問省中心平臺。為此,網(wǎng)絡(luò)管理員建議工作人員立即將R2路由器S0端口的IP地址修改過來,果然沒有多長時間,整個市中心平臺的網(wǎng)絡(luò)全部恢復(fù)正常了,這說明上述故障現(xiàn)象果然是由第三家縣級單位網(wǎng)絡(luò)的參數(shù)配置不當(dāng)造成的。
故障總結(jié)
從上面的故障排除過程來看,我們應(yīng)該能夠根據(jù)故障現(xiàn)象,很清楚地知道問題肯定出在第三家縣級單位網(wǎng)絡(luò)上,畢竟該單位網(wǎng)絡(luò)沒有連接到市中心平臺時,市中心網(wǎng)絡(luò)訪問是正常的,而一旦連接了第三家縣級單位網(wǎng)絡(luò)后,故障現(xiàn)象才開始出現(xiàn)的。定位好故障位置后,網(wǎng)絡(luò)管理員根據(jù)核心路由器啟動剛完成的時候網(wǎng)絡(luò)訪問正常,而過一段時間網(wǎng)絡(luò)又不正常的現(xiàn)象,判斷得出問題很可能出在R2路由器身上,于是迅速采取針對性措施,解決了網(wǎng)絡(luò)癱瘓故障現(xiàn)象。
當(dāng)然,這則故障也警示我們網(wǎng)絡(luò)管理員,在平時管理、維護(hù)網(wǎng)絡(luò)的過程中,一定要認(rèn)真、仔細(xì),對每一個細(xì)節(jié)因素都要加以重視,而且要在實踐操作過程中,要培養(yǎng)一種良好的操作習(xí)慣!
關(guān)鍵詞標(biāo)簽:網(wǎng)絡(luò)癱瘓
相關(guān)閱讀
熱門文章 提示dns服務(wù)錯誤怎么辦 dns錯誤問題多種解決方法 “無法瀏覽網(wǎng)頁” 十招解決疑難雜癥 路由器無線不能上網(wǎng)等故障排除 解決VPN路由設(shè)置不能訪問外網(wǎng)的問題
人氣排行 解決VPN路由設(shè)置不能訪問外網(wǎng)的問題 登錄SSH服務(wù)器失敗問題的分析及解決 光纖上網(wǎng) 路由器設(shè)置頁面進(jìn)不去怎么辦 核心交換機(jī)故障現(xiàn)象及解決辦法 無線網(wǎng)卡連接不上怎么辦_無線網(wǎng)卡連接不上解決方法 路由設(shè)置不當(dāng) 導(dǎo)致VPN無法訪問外網(wǎng) 提示dns服務(wù)錯誤怎么辦 dns錯誤問題多種解決方法 徹底避免環(huán)路問題 正確配置交換機(jī)步驟