時(shí)間:2015-06-28 00:00:00 來源:IT貓撲網(wǎng) 作者:網(wǎng)管聯(lián)盟 我要評論(0)
??這兩天遇到一個(gè)問題,很讓人頭疼,就是我們的CX3-10C上分配給一臺服務(wù)器的虛擬磁盤老是掉線,原因起先不明,不過現(xiàn)在正常了。
??說說大致經(jīng)過吧,前天晚上開始出現(xiàn)這個(gè)情況,BCC告警短信發(fā)到我手機(jī)上,由于沒有及時(shí)看,過了一會(huì)廣電中心的人電話打過來說視頻上傳不上去,我然后看了一下視頻服務(wù)器,發(fā)現(xiàn)磁盤又沒有了,以為和上次的問題一樣,但是我想也不大可能啊,因?yàn)榍捌谖业臏y試從來沒有出過這個(gè)問題,十一放假剛結(jié)束就出現(xiàn)這個(gè)問題確實(shí)有點(diǎn)奇怪,何況我的那塊HBA卡是新的,以前在服務(wù)器上插著但是沒有用過,最近才剛剛開始啟用。
???問題是這臺視頻服務(wù)器上面的兩個(gè)虛擬磁盤沒有了,存儲(chǔ)陣列管理端提示光纖未連接,然后我就猜測是網(wǎng)通的人把線碰掉了或者是拔掉了,因?yàn)樗麄冏罱诿€,準(zhǔn)備機(jī)房搬遷,碰掉也很有可能。電話告訴陳乾,可能原因,我去機(jī)房檢查服務(wù)器光纖連接情況,處理這起故障。去了之后發(fā)現(xiàn)確實(shí)是光纖松掉,指示燈都不亮了。插好之后重啟,一切正常。
???但是第二天早上,也就是昨天早上又出現(xiàn)這樣的問題就是這臺視頻服務(wù)器上面的兩個(gè)虛擬磁盤沒有了,但是存儲(chǔ)陣列管理端顯示連接一切正常,服務(wù)器端的powerpath一切也正常,也沒有提示任何錯(cuò)誤,只是系統(tǒng)日志里有幾個(gè)提示錯(cuò)誤,錯(cuò)誤截圖如下:
???此時(shí)問題原因不明啊,服務(wù)器端也提示正常,但是確實(shí)是沒有磁盤,很讓人意外。然后我就重啟服務(wù)器,因?yàn)閣indows系統(tǒng)好多問題一重啟就正常了,重啟之后果然正常,但是這時(shí)不知道原因,至少我認(rèn)為在存儲(chǔ)陣列上是沒有問題的,光纖交換機(jī)肯定也是沒有問題的,即使有問題也是某個(gè)端口的問題,我懷疑最大的是網(wǎng)通又把線碰了,打電話問網(wǎng)通那邊的負(fù)責(zé)人問有沒有人去機(jī)房,他們說沒有人去機(jī)房,我很懷疑,但是沒有辦法,因?yàn)槲覀兡菣C(jī)房暫時(shí)沒有門禁系統(tǒng),也無從判斷,我就暫時(shí)把這個(gè)問題放在這里,日志也看不出是什么原因。
???郁悶的是兩個(gè)小時(shí)之后又那樣了,磁盤又沒有了,提示都正常,錯(cuò)誤日志也和上次一樣,我想會(huì)不會(huì)是光纖的問題,去了機(jī)房把光纖和光纖交換機(jī)端口都換了,重啟機(jī)器又正常了,但是還是沒有用,下午三點(diǎn)鐘又出現(xiàn)原問題,又重啟恢復(fù)正常,待進(jìn)一步觀察問題,每次提示的錯(cuò)誤都是一樣的,就是數(shù)量上稍微有區(qū)別。
???由于還有一件事情比這個(gè)重要,下午下班趕緊去辦另外一件事情,回來之后八點(diǎn),那會(huì)在路上同事打電話說又出問題,我說你先重啟一下,又恢復(fù)正常,回來之后立即研究,時(shí)刻監(jiān)控,同時(shí)備份上面的數(shù)據(jù),防止磁盤數(shù)次卸載掛上出現(xiàn)問題,但是備份途中又壞掉,由于已很晚,這臺服務(wù)器訪問量也不是很高,晚上就沒有加班處理,說實(shí)話即使加班也不知道該怎么做,回家想了想,斷定剩下的只能是HBA卡的問題了,端口也換過了,光纖也換過了,還是重復(fù)性出現(xiàn)這個(gè)問題,時(shí)斷時(shí)續(xù),真的很煩人……
???早上來的比較早,發(fā)現(xiàn)磁盤昨天晚上已經(jīng)掉了,昨晚零晨前半個(gè)小時(shí),早上重啟之后和dell售后服務(wù)工程師聯(lián)系,商討問題解決方案,咨詢了類似的問題,他看了一下存儲(chǔ)陣列spa、spb、系統(tǒng)日志、光纖交換機(jī)的supportshow命令的輸出(那個(gè)我看不懂,他讓我抓下來給他的)。然后也斷定是HBA壞掉,我當(dāng)時(shí)已經(jīng)在機(jī)房,由于這臺服務(wù)器上面有兩塊HBA,我把光纖接到另外一塊HBA卡上面,然后重新再管理端注冊這個(gè)hba卡,形成對存儲(chǔ)陣列的有效訪問鏈接。切換過程不用多說,就是一般的注冊過程,很簡單,就這樣問題解決。一切恢復(fù)正常。
???這樣的問題很煩人的,時(shí)斷時(shí)好,你說他有問題吧,他又能工作,沒有問題吧,又反復(fù)這樣出現(xiàn)故障,真的很頭疼,尤其是存儲(chǔ)這樣重要的東西??傊幚韱栴}一定要思路清晰,要判斷準(zhǔn)問題發(fā)生部位,最有可能的原因。這樣才能解決問題。
關(guān)鍵詞標(biāo)簽:磁盤丟失故障處理
相關(guān)閱讀
熱門文章 Linux EXT3文件系統(tǒng)誤刪文件恢復(fù) RAID數(shù)據(jù)恢復(fù)常見故障處理手冊 數(shù)據(jù)無價(jià) 讓硬盤不被惡意格式化 反反復(fù)復(fù)的磁盤丟失故障處理過程
人氣排行 誤分區(qū) 誤格式化 誤刪除數(shù)據(jù)恢復(fù)挽救方法 "一鍵GHOST"傻瓜式系統(tǒng)備份與恢復(fù) 硬盤格式化也可破解還原 恢復(fù)被誤刪QQ好友獨(dú)門秘技 “卷影”共享文件:實(shí)戰(zhàn)卷影服務(wù) 實(shí)戰(zhàn)破解交換機(jī)密碼 Linux EXT3文件系統(tǒng)誤刪文件恢復(fù) 硬盤出現(xiàn)壞道的征兆與修復(fù)辦法