當(dāng)前位置：首頁 > 编程资源 > 综合教程 >内容正文

综合教程

failed command: READ FPDMA QUEUED

發(fā)布時間：2023/12/13 综合教程 47 生活家

生活随笔收集整理的這篇文章主要介紹了 failed command: READ FPDMA QUEUED 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

問題：

failed command: READ FPDMA QUEUED
failed command: WRITE FPDMA QUEUED

1、關(guān)閉NCQ
vim /boot/efi/EFI/centos/grub.cfg
添加libata.force=noncq到啟動項中；
linuxefi /vmlinuz-3.10.0-957.21.3.el7.x86_64 root=UUID=2b1d8b5c-9ca4-4c87-a8b4-5db40d08ac4f ro
crashkernel=auto biosdevname=0 net.ifnames=0 console=ttyS0,115200 LANG=en_US.UTF-8 libata.force=noncq
2、重啟
reboot

3、延伸1

SCSI/SATA information:
[root@liberty ~]# lsscsi -kk
[0:0:0:0]    disk    ATA      WDC WD10EURX-73F 01.0  /dev/sda
[1:0:0:0]    disk    ATA      WDC WD30EFRX-68A 80.0  /dev/sdb
[4:0:0:0]    disk    ATA      WDC WD5003ABYX-0 01.0  /dev/sdc
[5:0:0:0]    cd/dvd  Optiarc  DVD RW AD-5280S  1.01  /dev/sr0
[6:0:0:0]    disk    hp       USB Flash Drive  3276  /dev/sdd

Controller:
[root@liberty ~]# lspci | grep SATA
00:1f.2 SATA controller: Intel Corporation 6 Series/C200 Series Chipset Family SATA AHCI Controller (rev 05)

4、延伸2

fsck -f /dev/sdc  磁盤修復(fù)
echo 1 > /sys/block/sdb/device/queue_depth  關(guān)閉對應(yīng)磁盤NCQ特性
smartctl -a /dev/sdb |grep -i crc 檢測CRC錯誤
cat /proc/scsi/scsi    查看磁盤信息

smartctl -a <device> 檢查該設(shè)備是否已經(jīng)打開SMART技術(shù)。 
smartctl -s on <device> 如果沒有打開SMART技術(shù)，使用該命令打開SMART技術(shù)。 
smartctl -t short <device> 后臺檢測硬盤，消耗時間短； 
smartctl -t long <device> 后臺檢測硬盤，消耗時間長； 
smartctl -C -t short <device> 前臺檢測硬盤，消耗時間短； 
smartctl -C -t long <device> 前臺檢測硬盤，消耗時間長。其實就是利用硬盤SMART的自檢程序。 
smartctl -X <device> 中斷后臺檢測硬盤。 
smartctl -l selftest <device> 顯示硬盤檢測日志。 
smartctl -l error <device> 顯示硬盤錯誤匯總。
smartctl -i /dev/sda 確認(rèn)硬盤是否打開了SMART支持。
smartctl -H /dev/sda  查看硬盤的健康狀況。
smartctl -A   /dev/sda  查看硬盤的詳細(xì)信息 ls

read error rate 錯誤讀取率：記錄讀取數(shù)據(jù)錯誤次數(shù)（累計），非0值表示硬盤已經(jīng)或者可能即將發(fā)生壞道；
throughput performance 磁盤吞吐量：平均吞吐性能（一般在進(jìn)行了人工 Offline S.M.A.R.T. 測試以后才會有值。）；
spinup time 主軸電機到達(dá)要求轉(zhuǎn)速時間（毫秒/秒）；
start/stop count 電機啟動/停止次數(shù)（可以當(dāng)作開機/關(guān)機次數(shù)，或者休眠后恢復(fù)，均增加一次計數(shù)。全新的硬盤應(yīng)該小于10）；
reallocated sectors count 重分配扇區(qū)計數(shù)：硬盤生產(chǎn)過程中，有一部分扇區(qū)是保留的。當(dāng)一些普通扇區(qū)讀/寫/驗證錯誤，
則重新映射到保留扇區(qū)，掛起該異常扇區(qū)，并增加計數(shù)。隨著計數(shù)增加，io性能驟降。
如果數(shù)值不為0，就需要密切關(guān)注硬盤健康狀況；如果持續(xù)攀升，則硬盤已經(jīng)損壞；
如果重分配扇區(qū)數(shù)超過保留扇區(qū)數(shù)，將不可修復(fù)；
seek error rate 尋道錯誤率：磁頭定位錯誤一次，則技術(shù)增加一次。如果持續(xù)攀升，則可能是機械部分即將發(fā)生故障；
seek timer performance 尋道時間：尋道所需要的時間，越短則讀取數(shù)據(jù)越快，但是如果時間增加，則可能機械部分即將發(fā)生故障；
power-on time 累計通電時間：指硬盤通電時間累計值。（單位：天/時/分/秒。休眠/掛起不計入？新購入的硬盤應(yīng)小于100hrs）；
spinup retry count 電機啟動失敗計數(shù)：電機啟動到指定轉(zhuǎn)速失敗的累計數(shù)值。如果失敗，則可能是動力系統(tǒng)產(chǎn)生故障；
power cycle count 電源開關(guān)計數(shù)：每次加電增加一次計數(shù)，新硬盤應(yīng)小于10次；
g-sensor error rate 墜落計數(shù)：異常加速度（例如墜落，拋擲）計數(shù)——磁頭會立即回到landing zone，并增加一次計數(shù)；
power-off retract count 異常斷電次數(shù)：磁頭在斷電前沒有完全回到landing zone的次數(shù)，每次異常斷電則增加一次計數(shù)；
load/unload cycle count 磁頭歸位次數(shù)：指工作時，磁頭每次回歸landing zone的次數(shù)。（ps：流言說某個linux系統(tǒng)——不點名，
在使用電池時候，會不斷強制磁頭歸為，而磁頭歸位次數(shù)最大值約為600k次，所以認(rèn)為linux會損壞硬盤，實際上不是這樣的）；
temperature 溫度：沒嘛好說的，硬盤溫度而已，理論上比工作環(huán)境高不了幾度。（sudo hddtemp /dev/sda）
reallocetion event count 重映射扇區(qū)操作次數(shù)：上邊的重映射扇區(qū)還記得吧？這個就是操作次數(shù)，成功的，失敗的都計數(shù)。
成功好說，也許硬盤有救，失敗了，也許硬盤就要報廢了；
current pending sector count 待映射扇區(qū)數(shù)：出現(xiàn)異常的扇區(qū)數(shù)量，待被映射的扇區(qū)數(shù)量。 
如果該異常扇區(qū)之后成功讀寫，則計數(shù)會減小，扇區(qū)也不會重新映射。讀錯誤不會重新映射，只有寫錯誤才會重新映射；
uncorrectable sector count 不可修復(fù)扇區(qū)數(shù)：所有讀/寫錯誤計數(shù)，非0就證明有壞道，硬盤報廢；
 
SSD固態(tài)硬盤多出的Attributes 信息解釋：
其中我們比較關(guān)注的有以下四點：
1、Media_Wearout_Indicator:    使用耗費，100為沒有任何耗費; 表示SSD上NAND的擦寫次數(shù)的程度，初始值為100，隨著擦寫次數(shù)的增加，
開始線性遞減，遞減速度按照擦寫次數(shù)從0到最大的比例。一旦這個值降低到 1，就不再降了，
同時表示SSD上面已經(jīng)有NAND的擦寫次數(shù)到達(dá)了最大次數(shù)。這個時候建議需要備份數(shù)據(jù)，以及更換SSD。
上面的機器為099，按照100滴血算，目前只耗了1滴血
2、Reallocated_Sector_Ct: 出廠后產(chǎn)生的壞塊個數(shù), 初始值為100，如果有壞塊，從1開始增加，每4個壞塊增加1
這里offer的機器還沒有任何壞塊
3、Host_Writes_32MiB: 已寫32MiB, 每寫入65536個扇區(qū)raw value增加1。這個扇區(qū)還是個數(shù)量單位，512字節(jié)
比如：這塊盤就是 1284966 * 65536 * 512 = 40155.1875 GB
注意到每個機器都有一塊盤寫的比較少，這塊盤就是hotspare盤。
每臺機器我們有7塊ssd盤。其中6塊盤做的raid 5,第7塊盤做的hotspare。
4、Available_Reservd_Space: SSD上剩余的保留空間, 初始值為100，表示100%，閥值為10，遞減到10表示保留空間已經(jīng)不能再減少

backblaze 建議主要監(jiān)控以下五個屬性的 RAW_VALUE 的值：
SMART 5 – Reallocated_Sector_Count.
SMART 187 – Reported_Uncorrectable_Errors.
SMART 188 – Command_Timeout.
SMART 197 – Current_Pending_Sector_Count.
SMART 198 – Offline_Uncorrectable.
如果發(fā)現(xiàn)該五項值中有大于0的情況，就說明該磁盤應(yīng)該對它進(jìn)行持續(xù)的關(guān)注了，
因為根據(jù)其經(jīng)驗這5項S.M.A.R.T.指標(biāo)的增長表明即將發(fā)生磁盤驅(qū)動器故障。

smart參數(shù)詳解：
https://www.cnblogs.com/york-hust/p/3380928.html

badblocks命令可以檢查磁盤裝置中損壞的區(qū)塊。執(zhí)行該指令時須指定所要檢查的磁盤裝置，及此裝置的磁盤區(qū)塊數(shù)。
語法：badblocks [-svw][-b ][-o ][磁盤裝置][磁盤區(qū)塊數(shù)][啟始區(qū)塊]
參數(shù)：  -b 指定磁盤的區(qū)塊大小，單位為字節(jié)。
        -o 將檢查的結(jié)果寫入指定的輸出文件。
        -s 在檢查時顯示進(jìn)度。
        -v 執(zhí)行時顯示詳細(xì)的信息。
        -w 在檢查時，執(zhí)行寫入測試。 
[磁盤裝置] 指定要檢查的磁盤裝置。
[磁盤區(qū)塊數(shù)] 指定磁盤裝置的區(qū)塊總數(shù)。 
[啟始區(qū)塊] 指定要從哪個區(qū)塊開始檢查。

badblocks -s//顯示進(jìn)度  -v//顯示執(zhí)行詳細(xì)情況  /dev/sda1
# badblocks -s -v /dev/sda
正在檢查從 0 到 244198583的塊
Checking for bad blocks (read-only test): ^C0.10% done, 0:04 elapsed
Interrupted at block 272896 
$badblocks -s//顯示進(jìn)度 -w//以寫去檢測 -v//顯示執(zhí)行詳細(xì)情況 /dev/sda2
# badblocks -w -s -v /dev/sda1
Checking for bad blocks in read-write mode
From block 0 to 25607577
Testing with pattern 0xaa: ^C0.73% done, 0:03 elapsed
注意，不能以寫的方式檢測已經(jīng)掛載的硬盤


使用hdparm測試   
測試硬盤讀寫速度
# hdparm -Tt /dev/sda
/dev/sda:
Timing cached reads:   
1918 MB in  2.00 seconds = 959.62 MB/sec
Timing buffered disk reads:  184 MB in  3.00 seconds =  61.26 MB/sec 

hdparm可檢測，顯示與設(shè)定IDE或SCSI硬盤的參數(shù)。

總結(jié)

以上是生活随笔為你收集整理的failed command: READ FPDMA QUEUED的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

综合教程

failed command: READ FPDMA QUEUED

總結(jié)