Sistem günlüğündeki bu disk hataları ne anlama geliyor?


13

İzleme sunucumu ilk kez yeniden başlattım ve aşağıdakiler ekranı doldurmaya başladı:

Jul 11 23:52:30 monit kernel: [   25.255908] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul 11 23:52:30 monit kernel: [   25.256170] ata1.00: BMDMA stat 0x24
Jul 11 23:52:30 monit kernel: [   25.256278] ata1.00: failed command: READ DMA
Jul 11 23:52:30 monit kernel: [   25.256410] ata1.00: cmd c8/00:c0:20:68:35/00:00:00:00:00/e0 tag 0 dma 98304 in
Jul 11 23:52:30 monit kernel: [   25.256416]          res 51/40:9f:41:68:35/00:00:00:00:00/e0 Emask 0x9 (media error)
Jul 11 23:52:30 monit kernel: [   25.256809] ata1.00: status: { DRDY ERR }
Jul 11 23:52:30 monit kernel: [   25.256933] ata1.00: error: { UNC }
Jul 11 23:52:30 monit kernel: [   25.304388] ata1.00: configured for UDMA/66
Jul 11 23:52:30 monit kernel: [   25.304430] ata1: EH complete

. . . 

Jul 11 23:52:30 monit kernel: [   25.552451] sd 0:0:0:0: [sda] Unhandled sense code
Jul 11 23:52:30 monit kernel: [   25.552462] sd 0:0:0:0: [sda]  Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jul 11 23:52:30 monit kernel: [   25.552475] sd 0:0:0:0: [sda]  Sense Key : Medium Error [current] [descriptor]
Jul 11 23:52:30 monit kernel: [   25.552490] Descriptor sense data with sense descriptors (in hex):
Jul 11 23:52:30 monit kernel: [   25.552498]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
Jul 11 23:52:30 monit kernel: [   25.552529]         00 35 68 41 
Jul 11 23:52:30 monit kernel: [   25.552543] sd 0:0:0:0: [sda]  Add. Sense: Unrecovered read error - auto reallocate failed
Jul 11 23:52:30 monit kernel: [   25.552559] sd 0:0:0:0: [sda] CDB: Read(10): 28 00 00 35 68 20 00 00 c0 00
Jul 11 23:52:30 monit kernel: [   25.552587] end_request: I/O error, dev sda, sector 3500097
Jul 11 23:52:30 monit kernel: [   25.556607] ata1: EH complete

HDD'yi (Veri Maliyeti> HDD Maliyeti) değiştirmem gerektiğini zaten biliyorum, ancak gerçekte neyin yanlış olduğunu kendi bilgim için bilmek istiyorum .

Evet, izleme sunucumuzda RAID yok, sadece bir HDD var ... Bana bakma ...


3
"Evet, izleme sunucumuzda RAID yok, sadece bir HDD var ... Bana bakma ..." - iyi yedeklemeleriniz varsa çok fazla görünmüyor.
Janne Pikkarainen

2
Umarım iyi yedekleriniz vardır. Muhtemelen onlara ihtiyacınız olacak. İzleme sunucusu bu kadar önemliyse, sabit sürücüyü en az bir RAID 1 ile değiştirmenin maliyeti kolayca doğrulanabilir olmalıdır.
Michael Hampton

1
RAID'iniz olmasa bile, tüm diskleriniz için SMART verilerini izliyor olmalısınız.
James Youngman

Yanıtlar:


16
sd 0:0:0:0: [sda]  Add. Sense: Unrecovered read error - auto reallocate failed

Sürücünün kötü sektörleri olduğu ve bunları yeniden tahsis edemediği anlaşılıyor (muhtemelen yedek sektörlerin bitmesi nedeniyle). Çıktısı smartctl -a /dev/sdasize sürücünün durumu hakkında daha fazla bilgi verir.


Ayrıca bu hatayı basit bir okumada meydana geldiğini gördüm (örneğin, cpdosyaya çalışırken ). Bu durumda, sektördeki dosyanın kötüye giden hasarı, verileri yeniden yapılandıramayacak kadar ciddiydi, bu nedenle "yeniden tahsis" hatası, verileri başka bir yerde depolamaya çalışmadan önce gerçekten meydana geldi.
Randall

12

Lassie "arf! Arf arf! Arf!" Diyor. Bu aptalca, çünkü bunun Timmy veya kuyularla ilgisi yok . Bu yüzden köpeklerden sysadmin tavsiyesi almıyorsunuz.

Sürücü size "Kurtarılamayan okuma hatası - otomatik yeniden konumlandırma başarısız" veriyor, bu da temel olarak "okumaya çalıştım, başarısız oldum, kurtarmaya çalıştım (sektörü birkaç kez daha okuyun, ECC'yi uygulayın ve verileri kırılmamış bir sektör) ve işe yaramadı ". Bu muhtemelen (mgorven'ın dediği gibi) diskin zaten yeniden tahsis edilmiş sektörlerle dolu olduğu anlamına gelir, çünkü disk bir süredir ölüyor, ama aynı zamanda sektörü hiç kurtaramayacağı anlamına da gelebilir (tekrarlanan okumalar) + ECC iyi görünümlü bir veri bloğu alamadı).

Her iki durumda da, evet, sürücü çok, çok kaktüs. Verileriniz de gerçekten sağlıklı görünmüyor.


1
Doğru - SMART verileri size kaç sektörün yeniden tahsis edildiğini de söyleyebilir.
James Youngman

3

Biliyorum bu eski, ama sadece biri hala bu yazı okuyorsa: "DD de kırık sektör (ler) okumaya çalışacağız" - gddrescue burada yararlıdır. Olmaz (tamam, ama sadece bir kez).


1

Bu kutunun uygun bir geri yüklemesine izin veren tam bir yedeğiniz yoksa, bu diskin bir dd resmini veya rsync kopyasını şimdi ++ oluşturun . Uyumlu ve çalışan bir yedek disk aramaya başlayın.

BTW, UDMA / 66, bu on yaşında bir PATA disk mi?


2
DD ayrıca bozuk sektör (ler) i de okumaya çalışacaktır.
Hennes

3
Genellikle en iyi etki için değil ... hata davranışı üzerinde daha iyi kontrol ile ddrescue adlı gelişmiş bir sürüm var.
rackandboneman

Her zaman vardır conv=noerror, ama o zaman kırık bir dosya sistemi haline ne üzerinde ne kadar iyi emin değilim. Muhtemelen veri dosyasını dosyaya göre okumaktan daha kötü değil, ama kesinlikle daha iyi değil ...
CVn

0

Daha önce de belirtildiği gibi, muhtemelen sürücünüzün ömrünün sonuna yaklaştığı, ancak hemen değil anlamına geldiği anlamına gelir - fsckdiskte bir çalıştırmalı ve hataları onarmaya çalışmalısınız ( kötü blokları düzeltmek için tavsiye için smartmontools wiki'ye bakın ) ve disk bir uzun süre.

Ancak çalışmaya başlamalısınız smartd( smartmontoolspaketin bir parçası olarak gelir ) ve raporlarını takip etmeli ve / veya e-posta bildirimleri ayarlamalısınız. Ayrıca, tarafından /etc/smartmontools/run.d/çağrılan komut dosyaları (in ) oluşturarak kendi özel bildirimlerinizi ekleyebilirsiniz smartd-runner.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.