300GB*6 SCSI RAID5 LINUX服务器数据恢复手记
生活随笔
收集整理的這篇文章主要介紹了
300GB*6 SCSI RAID5 LINUX服务器数据恢复手记
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
[摘要]
??? 某數(shù)碼沖印網(wǎng)站,采用DELL POWEREDGE2850服務(wù)器,存儲部分由6塊300G硬盤組成RAID5,LINUX平臺,1.5T邏輯磁盤中只包含一個卷,文件系統(tǒng)為EXT3,存儲所有客戶數(shù)碼照片,服務(wù)器的故障導(dǎo)致整個公司無法開展工作。
之前網(wǎng)站正常工作中卷離線,管理員進(jìn)入機(jī)房檢查時,發(fā)現(xiàn)兩塊硬盤報黃燈,ID為1號與4號。致電DELL公司,DELL技術(shù)人員提供的解決方案為:隨機(jī)選一塊強(qiáng)制上線。
????用戶選擇了4號盤,強(qiáng)制上線后,可MOUNT,但很多目錄打不開,某些目錄下近一周的文件丟失,用戶意識到了操作的錯誤,馬上關(guān)機(jī),未做其他操作。尋求數(shù)據(jù)恢復(fù)公司幫助。
[分析]
??? 非常典型的,離線的1號與4號盤并非同時OFFLINE,按故障情況分析,應(yīng)該是4號盤先前離線,之后1號盤離線導(dǎo)致整個RAID崩潰??蛻魪?qiáng)制上線后,因數(shù)據(jù)不同步導(dǎo)致目錄打不開或目錄陳舊等現(xiàn)象。
??? MOUNT成功系統(tǒng)便會寫入一定量的數(shù)據(jù),在寫入數(shù)據(jù)的這些條帶中,檢驗(yàn)信息會重新生成,會導(dǎo)致部分檢驗(yàn)信息陳舊。最直接的后果是無法直接通過還原RAID結(jié)構(gòu)的方式進(jìn)行數(shù)據(jù)恢復(fù),只能依靠提取數(shù)據(jù)的方式進(jìn)行恢復(fù)。
[解決方案]
1、? 分析原RAID 6塊盤的結(jié)構(gòu)(RAID信息),去掉4號盤,加入1號盤,通過虛擬環(huán)境搭建RAID平臺。
2、? 對虛擬邏輯卷進(jìn)行數(shù)據(jù)提取,將數(shù)據(jù)輸出到另外的存儲體上。
[解決過程]
1、? 順利分析出RAID結(jié)構(gòu)后,成功搭建RAID。
2、? 通過自主軟件進(jìn)行數(shù)據(jù)提取,發(fā)現(xiàn)1號盤有不規(guī)律的壞道。
3、? 通過專業(yè)設(shè)備將1號盤完整鏡像,90%以上的壞道成功讀取。
4、? 將鏡像加入虛擬RAID環(huán)境,再次提取數(shù)據(jù)。
5、? 恢復(fù)99%以上數(shù)據(jù)。
[給用戶的建議]
1、DELL的2850事實(shí)上可以查詢到RAID的日志,在兩塊以上盤離線的情況下,應(yīng)該通過查詢?nèi)罩镜确绞酱_定離線的過程,即使強(qiáng)制上線,也需要風(fēng)險最小(數(shù)據(jù)重要,盡量少做這類操作)
2、可以通過增加DRAC或hotspare等方式減少此類事故的發(fā)生率。
3、如果數(shù)據(jù)重要,可先行咨詢數(shù)據(jù)恢復(fù)公司
本文轉(zhuǎn)自 張宇 51CTO博客,原文鏈接:http://blog.51cto.com/zhangyu/33741,如需轉(zhuǎn)載請自行聯(lián)系原作者
??? 某數(shù)碼沖印網(wǎng)站,采用DELL POWEREDGE2850服務(wù)器,存儲部分由6塊300G硬盤組成RAID5,LINUX平臺,1.5T邏輯磁盤中只包含一個卷,文件系統(tǒng)為EXT3,存儲所有客戶數(shù)碼照片,服務(wù)器的故障導(dǎo)致整個公司無法開展工作。
之前網(wǎng)站正常工作中卷離線,管理員進(jìn)入機(jī)房檢查時,發(fā)現(xiàn)兩塊硬盤報黃燈,ID為1號與4號。致電DELL公司,DELL技術(shù)人員提供的解決方案為:隨機(jī)選一塊強(qiáng)制上線。
????用戶選擇了4號盤,強(qiáng)制上線后,可MOUNT,但很多目錄打不開,某些目錄下近一周的文件丟失,用戶意識到了操作的錯誤,馬上關(guān)機(jī),未做其他操作。尋求數(shù)據(jù)恢復(fù)公司幫助。
[分析]
??? 非常典型的,離線的1號與4號盤并非同時OFFLINE,按故障情況分析,應(yīng)該是4號盤先前離線,之后1號盤離線導(dǎo)致整個RAID崩潰??蛻魪?qiáng)制上線后,因數(shù)據(jù)不同步導(dǎo)致目錄打不開或目錄陳舊等現(xiàn)象。
??? MOUNT成功系統(tǒng)便會寫入一定量的數(shù)據(jù),在寫入數(shù)據(jù)的這些條帶中,檢驗(yàn)信息會重新生成,會導(dǎo)致部分檢驗(yàn)信息陳舊。最直接的后果是無法直接通過還原RAID結(jié)構(gòu)的方式進(jìn)行數(shù)據(jù)恢復(fù),只能依靠提取數(shù)據(jù)的方式進(jìn)行恢復(fù)。
[解決方案]
1、? 分析原RAID 6塊盤的結(jié)構(gòu)(RAID信息),去掉4號盤,加入1號盤,通過虛擬環(huán)境搭建RAID平臺。
2、? 對虛擬邏輯卷進(jìn)行數(shù)據(jù)提取,將數(shù)據(jù)輸出到另外的存儲體上。
[解決過程]
1、? 順利分析出RAID結(jié)構(gòu)后,成功搭建RAID。
2、? 通過自主軟件進(jìn)行數(shù)據(jù)提取,發(fā)現(xiàn)1號盤有不規(guī)律的壞道。
3、? 通過專業(yè)設(shè)備將1號盤完整鏡像,90%以上的壞道成功讀取。
4、? 將鏡像加入虛擬RAID環(huán)境,再次提取數(shù)據(jù)。
5、? 恢復(fù)99%以上數(shù)據(jù)。
[給用戶的建議]
1、DELL的2850事實(shí)上可以查詢到RAID的日志,在兩塊以上盤離線的情況下,應(yīng)該通過查詢?nèi)罩镜确绞酱_定離線的過程,即使強(qiáng)制上線,也需要風(fēng)險最小(數(shù)據(jù)重要,盡量少做這類操作)
2、可以通過增加DRAC或hotspare等方式減少此類事故的發(fā)生率。
3、如果數(shù)據(jù)重要,可先行咨詢數(shù)據(jù)恢復(fù)公司
本文轉(zhuǎn)自 張宇 51CTO博客,原文鏈接:http://blog.51cto.com/zhangyu/33741,如需轉(zhuǎn)載請自行聯(lián)系原作者
總結(jié)
以上是生活随笔為你收集整理的300GB*6 SCSI RAID5 LINUX服务器数据恢复手记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Centos7常用命令[挂载文件系统]
- 下一篇: Linux Shell获取系统资源使用百