linux 热拔插硬盘,带电热插拔硬盘造成硬盘故障
前天解決一個(gè)硬盤故障:
用戶硬件環(huán)境:
X255 服務(wù)器,現(xiàn)在有6塊硬盤,將硬盤分2組,做成2個(gè)RAID5陣列。在第一組陣列安裝操作系統(tǒng),在第二組陣列存放數(shù)據(jù)和軟件。在一個(gè)通道里建兩個(gè)陣列的原因是:(用戶這樣規(guī)劃的原因是:第一組又3塊36G的硬盤;第二組有3塊73G的硬盤)。用戶使用serverRaid 6M卡。
用戶出現(xiàn)的問題:
用戶想額外購買73G的硬盤,然后在生產(chǎn)機(jī)器上,隨手拔出一塊硬盤,看看硬盤的轉(zhuǎn)速和類型,結(jié)果出現(xiàn)了故障。
故障現(xiàn)象:
開機(jī)時(shí),系統(tǒng)檢測(cè)到有硬盤OFFLINE。
解決的辦法:
一開始用戶給我打電話,問我可以不可以使用SERVERRaid 6M卡的硬盤回寫功能,進(jìn)行對(duì)陣列信息的恢復(fù)。因?yàn)槲乙婚_始沒弄明白故障原因,所以建議用戶使用ServerRaid manager察看陣列狀況 :
1. 找到以前serverraid application CD,由于系統(tǒng)是正常的,登陸系統(tǒng)安裝ServerRaid manager.
2. 從ServerRaid manager 中看到:陣列1有一塊硬盤出現(xiàn)rebuilding的情況,陣列2的硬盤出現(xiàn)一塊DEFUNCT,另一塊出現(xiàn) REBUILDING的情況。
3。陣列1和陣列2依然存在。
說明:陣列信息沒有丟,沒有必要進(jìn)行回寫。
隨后趕赴現(xiàn)場(chǎng),經(jīng)過多方面分析,得出一個(gè)結(jié)論:
用戶對(duì)熱插拔硬盤理解不夠,以為熱插拔硬盤就是機(jī)器運(yùn)行過程中,進(jìn)行硬盤熱插拔;用戶在插拔過程中,正好出現(xiàn)陣列1的一塊硬盤在陣列2的一塊硬盤中,讀寫數(shù)據(jù)。出現(xiàn)這樣的錯(cuò)誤。明白了這個(gè),我對(duì)OFFLINE的那塊硬盤,進(jìn)行ONLINE操作。這個(gè)時(shí)候兩個(gè)陣列同時(shí)進(jìn)行rebuilding 。。。。。
最后,陣列上的數(shù)據(jù)沒有丟失,故障圓滿解決。
總結(jié)
以上是生活随笔為你收集整理的linux 热拔插硬盘,带电热插拔硬盘造成硬盘故障的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 小白理财训练营靠谱吗?花钱上课有没有必要
- 下一篇: linux tcp server开源,G