3Ware'in tw_cli'si “DEGRADED” diskine karşı “ECC-ERROR” ne anlama geliyor?


10

3ware 9650SE-16ML kartında üzgün bir RAID dizim var. Söyleyemediğim, sadece bir çift disk arızası (bummer!) Yaşadıysanız veya bunu yanlış okuyorsam. İlgili çıktı /c0 show all:

Port   Status           Unit   Size        Blocks        Serial
---------------------------------------------------------------
p0     DEGRADED         u0     931.51 GB   1953525168    5QJ07MAH            
p1     ECC-ERROR        u0     931.51 GB   1953525168    5QJ0DCW9            
p2     OK               u0     931.51 GB   1953525168    5QJ0DW9C            
p3     OK               u0     931.51 GB   1953525168    5QJ0CKXJ            

Ve başarısızlık (kimden show alarms):

Ctl  Date                        Severity  Alarm Message
------------------------------------------------------------------------------
c0   [Sun Nov 20 07:47:23 2011]  INFO      Rebuild started: unit=0
c0   [Sun Nov 20 08:20:12 2011]  ERROR     Drive ECC error reported: port=1, unit=0
c0   [Sun Nov 20 08:20:12 2011]  ERROR     Source drive error occurred: port=1, unit=0
c0   [Sun Nov 20 08:20:12 2011]  ERROR     Rebuild failed: unit=0
c0   [Sun Nov 20 08:20:12 2011]  INFO      Rebuild paused: unit=0

Ben düşünüyorum ne oldu p0 p1 bir ECC hatası (aka verilerim gitti) vardı sonra düşmüştü ve olduğunu. Ama ... belki değil? % 97 yeniden oluşturulmuş kalır, ancak bu hatayı geçemez.

Anlayabildiğim kadarıyla, önceki bir yönetici periyodik doğrulamayı kapattı, bu da bizi bu duruma soktu. Bu, çoğu kişinin 3Ware RAID'leriyle endişelenmesi gereken bir şey değil!

Güncelleme

Birkaç gün boyunca dövdükten sonra, IgnoreECC bitini yaptım ve yeniden oluşturdum, ancak verilerim barındırılıyor. Aylak.


Üzerinde önemli veriler varsa Dondurucu Kurtarma yöntemini deneyin .
Chris S

Dondurucu hilesine karşı değilim, ama sadece "sürücüm öldü" için değil, belirli bir arıza modu için değil mi?
Bill Weiss

DEGRADED etiketli disk REBUILD işleminin hedef diskidir.
wazoox

Yanıtlar:


7

ECC hatası, sürücüde en az bir okunamayan sektör olduğu anlamına gelir. Ancak, şanslıysanız, bu sektör gerçekte bu birimde bulunan dosya sistemi tarafından kullanılmayabilir, bu nedenle verilerinizi bu durumdaki diziden kopyalayabilirsiniz.

Yeniden oluşturma sırasında ECC hatalarını yok saymanın bazı seçenekleri de vardır:

/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off

Bununla birlikte, bu seçeneklerin kullanılması, kötü bir sektörden etkilenen RAID şeridinin bozulacağı anlamına gelir (bu durumda kartın tam olarak ne yapacağından emin değilsiniz - tüm şeridi sıfırlarla veya hatta rastgele verilerle değiştirebilir), bu nedenle “ kurtarılan ”dizisinin aslında algılanamayan bozulması olabilir (etkilenen şerit bazı veri dosyalarının ortasındaysa). Yeniden oluşturmaya çalışmadan önce verilerinizi diziden başka bir yere kopyalamak daha güvenli olabilir (en azından kötü alanı okumaya çalışırken hatalar almalısınız).

Daha önce okunamayan sektörleri yakalamak için dizinin zamanlanmış doğrulamasını ayarlamanız gerekir, böylece yeni başlayan bir sürücüyü değiştirebilirsiniz.


Şimdi ignoreECC bitini yapıyorum. Verilerim için harika görünmüyor.
Bill Weiss

1
Ve evet, dizilerin zaman zaman doğrulamasına izin vermeliyiz. Bunu kuran adamın performans nedenleriyle bunu kapattığını tahmin edeceğim :(
Bill Weiss

Bu, yeniden oluşturma sürecinden geçti, ancak verilerime isimlendirildi. Aylak. Bu bize doğrulamayı kapatmamızı öğretecek ...
Bill Weiss

4

DEGRADED durumuna geçmek için hiç fiziksel bir sürücü (p0) yaşamadım, ancak ECC-ERROR sürücüsünü veya hatta DEGRADED sürücüsünü çıkararak geri alabilirsiniz.

/c0 p1 remove

ve sonra yeniden tarama

/c0 rescan

onları baskın ünitesine geri koy

maint rebuild c0 u0 p1

ECC-ERROR i ile başarısız olan SATA Sürücüleri, tekrar başarısız olmadan önce sadece birkaç saat bile olsa dirilebildi.


3
Mevcut durumda p1 sürücüsünü çıkarmak, diziyi tamamen hortumlayacaktır.
Sergey Vlasov

Bunu p0 sürücü ile (kötü bir olduğu varsayımıyla) yaptım ve yeniden inşa etmeye çalışıyor, ancak sürücüyü hemen hemen DEGRADED olarak işaretledi. Aylak.
Bill Weiss

1
Bir adil, sürücü , bakınız, örneğin - yeniden sırasında bozulmuş olarak işaretlenmiş tutulur burada . Önemli olan dizi durumudur (YENİDEN YAPILMA veya başka bir şey?).
Sergey Vlasov

Hm. Aslında yeniden inşa ediyor ... Dört sürücünün hepsi çok yanıp sönüyor, bu iyi bir işaret, değil mi?
Bill Weiss

Stiiiiiil yeniden inşa ... 4 saat sonra% 37. Aylak.
Bill Weiss

2

Büyük olasılıkla verileriniz gitti. ECC hatası, bu diskten okurken kurtarılamaz bir hata anlamına gelir.

Yedeğiniz yoksa, dizinin geçerli durumunu dökümü deneyebilirsiniz. Bu, denetleyicinin veri kaybettiğini veya yalnızca boş bir alanı (dosya sistemine ilişkin herhangi bir görüşe sahip olmadığını) bilmediğinden mümkün olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.