Bu SMART kendi kendini test etme başarısız bir sürücüyü gösteriyor mu?


10

Bu SMART öz testinin sonuçlarının başarısız bir sürücüyü gösterip göstermediğini merak ediyorum, sonuçlarda 'tamamlandı: okuma hatası' ile gelen tek sürücü bu.

# smartctl -l selftest /dev/sde
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)   LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%      8981         976642822
# 2  Extended offline    Aborted by host               90%      8981         -
# 3  Extended offline    Completed: read failure       90%      8981         976642822
# 4  Extended offline    Interrupted (host reset)      90%      8977         -
# 5  Extended offline    Completed without error       00%       410         -

Sürücü, o SMART öz testinden elde edilen çıktı dışında herhangi bir arıza belirtisi göstermiyor. Bu, şu anda bir SMART kendi kendini test eden aynı sistemdeki farklı bir sürücüden gelen çıktıdır

# smartctl -l selftest /dev/sdc
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Self-test routine in progress 30%     15859         -
# 2  Extended offline    Completed without error       00%      9431         -
# 3  Extended offline    Completed without error       00%      8368         -


SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       1
  3 Spin_Up_Time            0x0027   176   175   021    Pre-fail  Always       -       4183
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       48
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   088   088   000    Old_age   Always       -       8982
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       46
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       34
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       13
194 Temperature_Celsius     0x0022   111   101   000    Old_age   Always       -       36
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       2

4
Ham sayaç içeren smartctl -a /dev/sdeetiketli bölümü çalıştırıp yayınlamanız çok daha yararlı olacaktır SMART Attributes Data Structure. Özellikle ilk orada Raw_Read_Error_Rateen iyi "kötü sürücü" göstergesi olan (ve muhtemelen senin durumunda! 0 olacak).
Chris S

1
Katma. . . . . . . . . .
Jeff Welling

1
Eklediğiniz veriler yeterince iyi görünüyor. Sürücü bir RAID dizisinin parçasıysa, bu konuda endişelenmem. Öncelikle önemli dosyalarınızı yedeklemelisiniz; şimdi başlamamak için iyi bir zaman.
Chris S

4
@Jeff Welling: Bu konuda bilgiç olmamakla birlikte, "yedeklemeniz" RAID dizisinde ise, bu bir "yedek" değilse, "kopya" dır. Şahsen, ben olsaydım, sürücü arızası belirtisinde sürücüyü değiştirirdim. Bugünlerde iyi bir sürüş için bile ne kadar az maliyet var, sigorta buna değer. Ayrıca, aynı gün (RAID10) dizisinde iki sürücü hatası yaşadım. Dizide olan 6 üzerinden. FWIW.
Kendall

1
@Kendall, dizinin yedeklemeler için kullanıldığı ve orijinallerin başka yerlerde olduğu anlamına geldiğini düşünüyorum. Bu durumda, iki sürücünün başarısız olması muhtemel olmadığı için şansım olursa (yeni sürücüler olmadıkça, bebek ölümleri yaygın bir sorundur ve yanma büyük dizilerde yaygın bir uygulamadır).
Chris S

Yanıtlar:


8

Umarım sürücüyü çoktan değiştirmişsinizdir, ancak henüz kimse doğrudan soruyu cevaplamamıştır ...

Her iki testte de belirtildiği gibi diskin aynı mantıksal kesimini Completed: read failureve her ikisi de aynı LBA'yı okuyamayan iki test yaptınız. Bu gerçekten de diskin bir arızası olduğunu gösterir ve garanti kapsamında değiştirilmesini sağlayabilirsiniz. Bu sektörde veri depolamaya çalışmak, sürücünün yazma işlemi sırasında arızalı olduğunu fark etmesine ve sektöre yeniden bakmasına neden olabilir veya olmayabilir, ancak sürücü fark etmez ve daha sonra verileri okuyamazsa, o.


4

Şüpheli bir sürücüde verileriniz risk almaya değer mi?

Eğer ben olsaydım, sürücüyü değiştirirdim ve SMART'ın bana büyük bir baş ağrısından kurtardığı için minnettar olurum.


Buna ek olarak, en azından sürücülerinizde haftada bir kez akıllı çalıştırmak için bir cron betiği kurarım ve daha sonra çıktıyı her hafta size bir raporda veya e-postayla göndermesini sağlarım, böylece çoğu zaman vaktinden önce tanımlayabilirsiniz hangi sürücüler arızadan kurtulmak ve yedeklemelerden geri yüklemek zorunda kalmamak için son ayaklarında olabilir. Birden fazla makineniz varsa, Nagios veya Munin gibi bir izleme aracı kullanıyorsa.
Wilshire

5
Hangi akıllı çıkışın başarısız bir sürücüyü gösterdiğini biliyorsanız, bunu yapmak daha kolay olur, başarısız bir sürücünün neyi gösterdiğini ve göstermediğini söylemek zordur.
Jeff Welling

4

Diğer cevaptaki yorumlara eklemek istiyorum, ancak temsilcinin eksikliğinden dolayı yapamam, şekil verin.

Bir cron betiği yapmanıza gerek yoktur , smartmontools paketinde tam olarak ne yapmak istediğinizi işleyen bir smartd arka plan programı vardır: SMART durumunun düzenli kontrolü. Tek ihtiyacınız olan bir yapılandırma oluşturmak ve hizmeti başlatmaktır. Smartmontools paketi ayrıca smartd'ın bir şey başarısız olmaya başladığında arayabileceği bazı örnek komut dosyaları içerir.


Bir cron betiği kullanmıyorum, smartd arka plan programı kullanıyorum. Sistem günlüğündeki notları tükürüyor, normalde başka sürücülerde görmediğim bazı satırları fark ettim ve kontrol ettiğimde kendi kendini test etmeye çalıştım. Daha önce hiç bu tür bir başarısızlık görmemiştim, bu yüzden buradaki insanların sahip olabileceğini düşündüm. Smartd'ın syslog çıktısı, onunla bir ton deneyiminiz yoksa oldukça şifreli, tam olarak size "Drive X ölüyor ve değiştirilmesi gerekiyor" demiyorsa da güzel olurdu :)
Jeff Welling

2

Durumunda ne yapacağım?

Her şeyden önce hangi dosyaların etkilendiğini öğreniyorum. Bunun nasıl yapılacağı konusunda bazı talimatlar var http://smartmontools.sourceforge.net/badblockhowto.html#e2_example1 Evet. Sizin durumunuz daha zor çünkü bir diziniz var. Ancak bu mümkün. Daha sonra, başarısız olan sektöre sıfır yazmak yerine, bu dosyanın yedeklendiğinden emin olun. İki şey olabilir. 1. Sürücü başarıyla bu sektöre sıfır yazar. Current_Pending_Sector, Reallocated_Sector_Ct sonra sıfır olmalıdır. 2. Sürücü bu sektöre yazamıyor. Daha sonra bu sektörü "yedek" bir alana yeniden aktarıyor.

Her durumda, sabit bir sürücü ile sonuçlanırsınız. Dosyanızı yedekten geri yüklemelisiniz (çünkü bir sektörün üzerine yazmışsınızdır). Ayrıca daha fazla hata olmadığından emin olmak için genişletilmiş kendi kendini sınamasını yeniden çalıştırmalısınız.

Sağlıklı kal!

PS: Bu yazının biraz eski olduğunu biliyorum. Ama ben gittim. Ve bence başka bir iyi cevap vermek iyi bir fikir.


1
kullanışlı bilgi! Bunu şimdi deneyeceğim
kerridge0

0

Sürücü muhtemelen çıkış yolundaydı. Sürücünün bir kısmından okuyamamak kesinlikle bir arıza durumudur ve diğer tipik disk hatası belirtileri olmadan gerçekleşmesi kesinlikle mümkündür. Bu tür şeyler genellikle geçici değildir; başka hiçbir belirti olmadan, zayıf bir kafa, çok hafif bir hizalama sorunu veya bir tepside (silindir?) arızalı bir alan olabilir.

Diğer alternatif, bir SMART hatası olmasıdır; gerçekten de buggy bellenimi olan bir sürücü çalıştırmak istemiyorsunuz.

SMART'tan herhangi bir hata gördüğünüzde, veri kaybını önlemek için yeni bir sürücü almanızın güçlü bir işaretidir. Kısmen erken uyarı sistemi olarak tasarlanmıştır.


0
  • En kısa sürede yedekleme!

  • Bu sürücü hala garanti kapsamındaysa,

    • satıcının kontrol özelliğini çalıştırın (genellikle bir önyükleme cd'si alabilirsiniz)
    • bu hata verirse bingo, geri gönder ve değiştirilmesini bekle
    • yedekten geri yükle
    • sorun çözüldü - END

  • Bu sürücünün garantisi yoksa vidalanmış olursunuz
    • hala umut var ...
    • Bu aslında bir okuma hatası olduğundan, ona yazamayacağınız anlamına gelmez
    • bir yedek oluşturduktan sonra yedeklemeyi geri yüklemeyi deneyebilirsiniz, çünkü okunamayan sektörleri üzerine gerçekten okuyabileceğiniz yeni verilerle yazacaktır (iyi, genellikle bu çalışır, arka planda sürücü çoğu zaman bu blokları yedek sektörlere yeniden eşleştirecektir )
    • badblocks aracı bunun için de kullanılabilir (zaten yedeklemeleriniz var, değil mi?)
      • bunu diski test etmek için kullanmazsınız (hiçbir zaman disklerle pek mantıklı değildir), ancak bu sektörlere birden çok kez yazmak için
    • akıllı testleri tekrar çalıştırabilirsiniz ve bu okunamayan sektörlerin "kendilerini düzeltme" şansı vardır
    • Sorun çözülmedi, sadece sürücüyü daha uzun ömürlü hale getirdiniz, muhtemelen kullanımına bağlı olarak bir yıl içinde normalden daha hızlı başarısız olacaktır, ancak hey diskler ucuzdur, verileriniz sizin için önemliyse yeni bir tane alın - END

1
Modern sabit sürücüler (yüzyılın başından beri olduğu gibi), "garanti yok" bölümünde açıkladığınız şekilde çalışmaz.
Chris S

3
Wikipedia'nın Kötü Sektör makalesiyle başlayın . Sabit diskler, mantıksal sektör adresini soyutlar ve iyi olduğunu düşündüğü sektörlerle eşleştirir. Bazı satıcı yardımcı programları (bazen sürücünün maruz kaldığı durumlara bağlı olarak SMART) yeniden eşlenen sektörler hakkında rapor verebilir. Kötü sektörler yazma işlemlerinde normal olarak algılanır. Genellikle yazıldıktan sonra tekrar okunabilir; genellikle kötü sektörlerde başarısız olan ilk yazma işlemidir. Bir sektör kötü olduğunda sonsuza kadar kötüdür, "düzeltmek" yoktur.
Chris S

1
Sanırım söylediklerinize aykırı bir şey söylemedim ama daha teknik olarak doğru hale getirmek için biraz açıkladım.
cstamas

2
İnsanların cevabınızı neden bu kadar düşük oy kullandığından emin değilim. Sanırım yerinde. Muhtemelen insanlar, lapa lapa bir sürüşü sürdürmeyi savunduğunuzu yanlış anladılar. Ancak OP'nin bir ev kullanıcısı olduğu düşünüldüğünde, yeni bir sürücünün maliyeti bugünün fiyatlarında bile çok endişe verici olabilir. Bunun oldukça eski bir soru olduğunu biliyorum, ama benden en azından +1 alırsınız. ;)
Markus

2
@cstamas: Cevabınızın yerinde olduğunu da kabul edebilirsin - eğer bir sürücü badblocks -wyeni kötü sektörler oluşturmadan tam bir çalışmadan (3x yazma, 3x okuma) hayatta kalırsa onu koruyacağım. Aksi halde bir yerde kullanmak için çok kırılmış.
mt_
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.