SMART sabit disk bozuk değil göre, ama dmesg hataları var


13

Bazen bilgisayarımı (Debian çalıştıran) önyükleme garip sorunları var. Bu yüzden "dmesg" komutunu verdim. Çıktısında birçok hata gördüm. Ancak, sabit disklerde genişletilmiş SMART testi çalıştırdığımda ("smartctl -t long / dev / sda" komutunu kullanarak), sonuç disklerimin bozuk olmamasıdır.

Bu hataların nedeni ne olabilir?

İşte hatalar:

   (...)
      [  505.918537] ata3.00: exception Emask 0x50 SAct 0x400 SErr 0x280900 action 0x6 frozen
      [  505.918549] ata3.00: irq_stat 0x08000000, interface fatal error
      [  505.918558] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [  505.918566] ata3.00: failed command: READ FPDMA QUEUED
      [  505.918579] ata3.00: cmd 60/40:50:20:5b:60/00:00:0b:00:00/40 tag 10 ncq 32768 in
               res 40/00:54:20:5b:60/00:00:0b:00:00/40 Emask 0x50 (ATA bus error)
      [  505.918586] ata3.00: status: { DRDY }
      [  505.918595] ata3: hard resetting link
      [  506.410055] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [  506.422648] ata3.00: configured for UDMA/133
      [  506.422679] ata3: EH complete
      [ 1633.123880] md: bind<sdb3>
      [ 1633.187966] RAID1 conf printout:
      [ 1633.187977]  --- wd:1 rd:2
      [ 1633.187984]  disk 0, wo:0, o:1, dev:sda3
      [ 1633.187989]  disk 1, wo:1, o:1, dev:sdb3
      [ 1633.188866] md: recovery of RAID array md0
      [ 1633.188871] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
      [ 1633.188875] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
      [ 1633.188890] md: using 128k window, over a total of 1943618560k.
      [ 1634.167341] ata3.00: exception Emask 0x50 SAct 0x7f80 SErr 0x280900 action 0x6 frozen
      [ 1634.167353] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1634.167361] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1634.167369] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167382] ata3.00: cmd 60/00:38:00:00:6f/02:00:01:00:00/40 tag 7 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167389] ata3.00: status: { DRDY }
      [ 1634.167395] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167407] ata3.00: cmd 60/00:40:00:02:6f/02:00:01:00:00/40 tag 8 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167413] ata3.00: status: { DRDY }
      [ 1634.167418] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167429] ata3.00: cmd 60/00:48:00:04:6f/02:00:01:00:00/40 tag 9 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167435] ata3.00: status: { DRDY }
      [ 1634.167439] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167451] ata3.00: cmd 60/00:50:00:06:6f/02:00:01:00:00/40 tag 10 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167457] ata3.00: status: { DRDY }
      [ 1634.167462] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167473] ata3.00: cmd 60/00:58:00:08:6f/02:00:01:00:00/40 tag 11 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167479] ata3.00: status: { DRDY }
      [ 1634.167484] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167495] ata3.00: cmd 60/00:60:00:0a:6f/02:00:01:00:00/40 tag 12 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167500] ata3.00: status: { DRDY }
      [ 1634.167505] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167516] ata3.00: cmd 60/80:68:00:0c:6f/00:00:01:00:00/40 tag 13 ncq 65536 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167522] ata3.00: status: { DRDY }
      [ 1634.167527] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167538] ata3.00: cmd 60/00:70:80:0c:6f/02:00:01:00:00/40 tag 14 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167544] ata3.00: status: { DRDY }
      [ 1634.167553] ata3: hard resetting link
      [ 1634.658816] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [ 1634.672645] ata3.00: configured for UDMA/133
      [ 1634.672696] ata3: EH complete
      [ 1637.687898] ata3.00: exception Emask 0x50 SAct 0x3ff000 SErr 0x280900 action 0x6 frozen
      [ 1637.687910] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1637.687918] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1637.687926] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.687940] ata3.00: cmd 60/00:60:80:a7:af/02:00:02:00:00/40 tag 12 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.687947] ata3.00: status: { DRDY }
      [ 1637.687953] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.687965] ata3.00: cmd 60/00:68:80:a9:af/02:00:02:00:00/40 tag 13 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.687971] ata3.00: status: { DRDY }
      [ 1637.687976] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.687987] ata3.00: cmd 60/80:70:80:ab:af/01:00:02:00:00/40 tag 14 ncq 196608 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.687993] ata3.00: status: { DRDY }
      [ 1637.687998] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688009] ata3.00: cmd 60/00:78:00:ad:af/02:00:02:00:00/40 tag 15 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688015] ata3.00: status: { DRDY }
      [ 1637.688020] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688031] ata3.00: cmd 60/80:80:00:af:af/00:00:02:00:00/40 tag 16 ncq 65536 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688037] ata3.00: status: { DRDY }
      [ 1637.688042] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688053] ata3.00: cmd 60/00:88:80:af:af/01:00:02:00:00/40 tag 17 ncq 131072 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688059] ata3.00: status: { DRDY }
      [ 1637.688064] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688075] ata3.00: cmd 60/80:90:80:b0:af/00:00:02:00:00/40 tag 18 ncq 65536 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688081] ata3.00: status: { DRDY }
      [ 1637.688085] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688096] ata3.00: cmd 60/00:98:00:b1:af/02:00:02:00:00/40 tag 19 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688102] ata3.00: status: { DRDY }
      [ 1637.688107] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688118] ata3.00: cmd 60/00:a0:00:b3:af/01:00:02:00:00/40 tag 20 ncq 131072 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688124] ata3.00: status: { DRDY }
      [ 1637.688129] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688140] ata3.00: cmd 60/00:a8:00:b4:af/01:00:02:00:00/40 tag 21 ncq 131072 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688146] ata3.00: status: { DRDY }
      [ 1637.688154] ata3: hard resetting link
      [ 1638.179398] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [ 1638.192977] ata3.00: configured for UDMA/133
      [ 1638.193029] ata3: EH complete
      [ 1640.259492] md: export_rdev(sdb1)
      [ 1640.326109] md: bind<sdb1>
      [ 1640.346712] RAID1 conf printout:
      [ 1640.346724]  --- wd:1 rd:2
      [ 1640.346731]  disk 0, wo:0, o:1, dev:sda1
      [ 1640.346736]  disk 1, wo:1, o:1, dev:sdb1
      [ 1640.346893] md: delaying recovery of md1 until md0 has finished (they share one or more physical units)
      [ 1657.987964] ata3.00: exception Emask 0x50 SAct 0x40000 SErr 0x280900 action 0x6 frozen
      [ 1657.987975] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1657.987984] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1657.987992] ata3.00: failed command: READ FPDMA QUEUED
      [ 1657.988006] ata3.00: cmd 60/00:90:00:30:2e/03:00:09:00:00/40 tag 18 ncq 393216 in
               res 40/00:94:00:30:2e/00:00:09:00:00/40 Emask 0x50 (ATA bus error)
      [ 1657.988013] ata3.00: status: { DRDY }
      [ 1657.988022] ata3: hard resetting link
      [ 1658.479548] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [ 1658.493107] ata3.00: configured for UDMA/133
      [ 1658.493147] ata3: EH complete
      [ 1670.547791] ata3: limiting SATA link speed to 1.5 Gbps
      [ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen
      [ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547846] ata3.00: status: { DRDY }
      [ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547863] ata3.00: cmd 60/80:08:80:20:2e/00:00:0c:00:00/40 tag 1 ncq 65536 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547869] ata3.00: status: { DRDY }
      [ 1670.547875] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547886] ata3.00: cmd 60/00:10:00:21:2e/02:00:0c:00:00/40 tag 2 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547892] ata3.00: status: { DRDY }
      [ 1670.547896] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547907] ata3.00: cmd 60/00:18:00:23:2e/02:00:0c:00:00/40 tag 3 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547913] ata3.00: status: { DRDY }
      [ 1670.547918] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547929] ata3.00: cmd 60/00:20:00:25:2e/01:00:0c:00:00/40 tag 4 ncq 131072 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547935] ata3.00: status: { DRDY }
      [ 1670.547940] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547951] ata3.00: cmd 60/00:28:00:26:2e/02:00:0c:00:00/40 tag 5 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547957] ata3.00: status: { DRDY }
      [ 1670.547961] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547972] ata3.00: cmd 60/00:30:00:28:2e/02:00:0c:00:00/40 tag 6 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547978] ata3.00: status: { DRDY }
      [ 1670.547987] ata3: hard resetting link
      [ 1671.039264] ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
      [ 1671.053386] ata3.00: configured for UDMA/133
      [ 1671.053444] ata3: EH complete
      [ 2422.512002] md: md0: recovery done.
      [ 2422.547344] md: recovery of RAID array md1
      [ 2422.547355] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
      [ 2422.547360] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
      [ 2422.547378] md: using 128k window, over a total of 4877312k.
      [ 2422.668465] RAID1 conf printout:
      [ 2422.668474]  --- wd:2 rd:2
      [ 2422.668480]  disk 0, wo:0, o:1, dev:sda3
      [ 2422.668486]  disk 1, wo:0, o:1, dev:sdb3
      [ 2469.990451] md: md1: recovery done.
      [ 2470.049986] RAID1 conf printout:
      [ 2470.049997]  --- wd:2 rd:2
      [ 2470.050003]  disk 0, wo:0, o:1, dev:sda1
      [ 2470.050009]  disk 1, wo:0, o:1, dev:sdb1
      [ 3304.445149] PM: Hibernation mode set to 'platform'
      [ 3304.782375] PM: Syncing filesystems ... done.
      [ 3307.028591] Freezing user space processes ... (elapsed 0.001 seconds) done.
      (...)

1
Bu kötü bir SATA veya güç kablosuyla veya belki de kötü bir güç kaynağıyla ilgili olabilir.
Thomas

1
Ayrıca donmuş ve sıfırlanması gereken kötü kontrolörler ile gördüm.
Stephen Harris

1
Bu soruya benzer ancak aynı olmayan dmesg çıktılarını içeren bir cevap ekledim (örn. (Sd 1: 0: 0: 0: çevrimdışı cihaza G / Ç'yi reddetme ve EXT4-fs uyarısı)) Bunların insanların sorun için Google'a yardım etmesine yardımcı olacağını düşünüyorum . Yanıt, unix.stackexchange.com/help/deleted-answers adresinde belirtilen nedenlerle eşleşmese de silindi . Ben / evde bir SSD monte sorunu vardı. Güç ve SATA kablosunu çıkarıp yeniden takmayı denedim, ancak hata devam etti. Neyse ki yedek bir SATA kablom vardı. SATA kablosunu değiştirdikten sonra herhangi bir hatam olmadı ve sorun tekrar oluşmadı.
htaccess

Yanıtlar:


22

İlk olarak, unutmayın SMART sürücü mutlaka sürücü anlamına gelmez sağlıklı olduğunu söyleyerek olduğu sağlıklı. SMART raporları mutlak bir gerçek değil , bir yardımdır .

İlgilendiğiniz tek şey neden değil, ne yapacağınızsa, son birkaç paragrafa ilerlemek için çekinmeyin; ancak, ara metin size neden önerdiğimin doğru eylem tarzı olduğunu düşündüğümü ve bunu yayınladığınızdan nasıl çıkaracağınızı söyleyecektir.

Bununla birlikte, bu hatalardan birinin bize ne söylediğine bakalım.

[ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen
[ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in
           res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547846] ata3.00: status: { DRDY }
[ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED

(Umarım birlikte gitmesi gereken parçaları aldım, ama bunlardan bir demet alıyordunuz, bu yüzden her iki şekilde de iyi olmalı.)

Linux ata Wiki bu hataları nasıl okunacağını açıklayan bir sayfası vardır . Özellikle,

  • Bir statusdeğeri DRDYvasıtası "Cihaz hazır. Normal olarak 1 olduğunda, OK." Durum değerini görmek DRDYtamamen normal ve beklenen bir durumdur .
  • SError gördüğünüz birden çok bileşen değerine sahiptir (bu özel snippet'te):
    • UnrecovData "Veri bütünlüğü hatası oluştu, arayüz kurtarılamadı"
    • HostInt "Ana bilgisayar veri yolu adaptörü dahili hatası"
    • 10B8B "10b - 8b kod çözme hatası oluştu"
    • BadCRC "Bağlantı katmanı CRC hatası oluştu"

Hem sinyal senkronizasyonu hem de hata tespitine yardımcı olmak için 8 biti 10 bit olarak kodlayan 10b8b kodlaması, sürücünün kendisinde değil, fiziksel kablolarda kullanılır. Sürücü büyük olasılıkla diğer FEC veya ECC kodlama biçimlerini kullanır ve buradaki bir hata normalde bir errordeğer olan UNC("düzeltilemeyen hata - genellikle diskteki bozuk sektörler nedeniyle") bir çeşit G / Ç hatası olarak görünür. , muhtemelen ressatır sonunda parantez içinde "ortam hatası" ("yazılım bir ortam hatası algıladı") . Bu ikincisi gördüğünüz şey değil, bu yüzden tamamen dışlayamayız, ancak olası görünmüyor.

"Bağlantı katmanı", sürücünün kendi denetleyicisi ile disk sürücüsü arabirim yongası ( bilgisayarınızın ana kartındaki güney köprünün bir parçası olabilir, ancak bir dış HBA'da bulunabilir) arasındaki fiziksel kablolar ve devre kartı izleridir .

HBA olarak da bilinen bir ana bilgisayar veri yolu adaptörü, depolama ekipmanına bağlanan devredir. Aynı zamanda modern sistemler ile biraz yanlış isim veren bir terim olan "disk denetleyici" olarak da bilinir. HBA'nın en görünür kısmı genellikle bağlantı portlarıdır, çoğu zaman bu günlerde SATA veya bir SAS form faktörü.

UnrecovDataVe HostIntbayraklar temelde "bir şey sadece korkunç yanlış gitti ve orada kurtarmanın yolu oldu ya iyileşme hiçbir girişim yapıldı" söylemektedir. Bunun tersi RecovData, "veri bütünlüğü hatası oluştuğunu, ancak arabirimin kurtarıldığını" gösterir. (Bir kenara, "host" HBA'ya atıfta bulunduğundan, bütün sistemi değil, muhtemelen HBAIntyerine kullanırdım HostInt.)

Her ikisinin de fiziksel bağlantı katmanına işaret ettiği 10B8Bve birleşimi, BadCRCbir kablolama sorunundan şüphelenmemi sağlıyor.

Bu şüphe, durum raporlaması dışında tamamen sürücünün içinde bulunan SMART kendi kendini testlerinin, üreticinin sonuçlarda raporlamayı garanti edecek kadar ciddi olduğunu düşündüğü hiçbir hata bulamadığı gerçeğiyle de desteklenmektedir. Sürücü veri depolama veya okuma konusunda sorun yaşıyorsa, özellikle uzun SMART otomatik testi bunu bildirmiş olmalıdır.

TL; DR:

Yapacağım ilk şey , SATA kablosunu her iki uçtan çıkarıp yeniden takmaktır; biraz gevşek olabilir, bu da ara sıra elektrik temasını kaybetmesine neden olabilir. Bunun sorunu çözüp çözmediğine bakın. Bunu yalnızca etkilenen diske değil, bilgisayarınızdaki tüm SATA kablolarına bile yapmaya değer olabilir. Bir off-board HBA kullanıyorsanız, bu kartı da çıkartacağım ve yeniden takacağım, çünkü kablolarla uğraşırken denemek kolay bir şey.

Bunu başaramazsanız , SATA kablosunu atmayı ve tercihen yüksek kaliteli bir kabloyla değiştirmeyi deneyin. Yüksek kaliteli bir kablo biraz daha pahalı olacak, ancak böyle baş ağrılarından kaçınmaya yardımcı olursa, genellikle küçük ekstra masraflara değer olduğunu düşünüyorum. Kimse depolama hatalarını görmekten hoşlanmaz!


2
SATA kablosunu çıkartıp yeniden taktım ve sorunu çözdü. Teşekkürler!
user983447

@ user983447 Sevindim yardımcı oldum!
CVn

0

Benim durumumda, iki farklı disk denetleyicisine iki disk taktığımı fark ettim: Birincisi PCI-Express ve ikincisi normal PCI. Her iki RAID diskini de aynı denetleyiciye taktığımda BadCRC hatasından kurtuldum.


1
Peki bu kontrolör öldüğünde, her iki diski de beraberinde getirir mi?
roaima

Evet, ancak diskin denetleyiciden ölmesi çok daha olasıdır. Ayrıca, PCI denetleyicisini KULLANMAMAK, ancak yüksek hızlı PCI-Express denetleyicisini kullanmak daha iyi bir fikir olacaktır.
PHZ.fi-Pharazon
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.