Gerçek bir RAID 5 2 sürücü hatası deneyimi mi arıyorsunuz? [kapalı]


15

Herkesin büyük sürücülerde RAID 5 2 sürücü hatasıyla ilgili herhangi bir kişisel deneyimi olup olmadığını merak ediyorum?

Anladığım kadarıyla, teori şu ki, büyük 1-2 TB sürücülerde, bir sürücü baskın setinde arızalanırsa, her şeyi yeniden inşa etmesi gerekir, böylece diğer tüm sürücülere çok sert vurur ve başka bir arıza şansı artar, özellikle sürücüler aynı üretim partisinden geliyorsa. Ve başka bir sürücüyü kaybederseniz, tüm verileri kaybedersiniz.

Bu genellikle kabul ettiğim "RAID yedek değildir" ifadesinden sonra açıklanır.

Bunun teorisi mantıklı ve ben bunu anlıyorum, ama gerçekten oluyor mu?


Ne yazık ki, bunun canlı deneyimi ile yeni bir sorumuz var. :( superuser.com/questions/516844/…
Hennes

Yanıtlar:


15

Evet, başıma geldi. 4 (tüketici sınıfı) bir set WD 500 sürücü yaklaşık bir hafta boyunca kötüye gitti. İlkini değiştirmek için yavaştım ve diziyi çevrimdışına almadım ve ikincisi başarısız olduğunda tüm verilerimi kaybettim. Kalan iki iyi olanı tekrar kullandım ve bunlardan biri gelecek ay içinde başarısız oldu. Hepsi düzgün bir şekilde soğutuldu ve bakıldı. Sadece şimdi "kötü parti" söylemine inandığımı söyleyebilirim.

Ayrı bir olayda, farklı markaların ve modellerin birbirinden bir ay içinde başarısız olduğu 3 ayrı sürücüm vardı, ancak başarısız olmasının nedeninin yanlış havalandırma nedeniyle olduğundan eminim. Sürücülerinizi pişirmeyin!


3
Bir sonuç olarak, bir sürücünün kötü gittiği zaman için yedek bir oturma yapın. Ayrıca, sessiz yolsuzluğa dikkat edin ... sadece çalışıyormuş gibi davranan bir sürücüdeki verileri kaybetmek kolaydır.
Paul McMillan

Bu, bir RAID dizisinde aynı toplu işlemden olan sürücüleri yüklememeniz için başka bir nedendir - ilişkili başarısızlık sürelerine sahiptirler (bildiğiniz gibi, tranched subprime teminatlı ipotek menkul kıymetlerinin varsayılan oranları gibi).
Andrew Mao

4

Aslında bu benim başıma geldi, ancak bir sürücünün başarısız olmasının en yaygın yolu değildi. Baskın 5'te 4 500 gb harici sata sürücüm vardı. Ucuz bir IBM rafa monte sunucuya bağlandılar. Tüm kurulum merdivenlerin altına ve bir gün ya bir sıçan ya da tavşan sıkışmıştı, ancak bazı güç kabloları ve 2 sürücüden bir şeyler çiğnendi. Tüm sürücüler ucuz harici muhafazaları vardı, bu yüzden sanırım çok şaşırmamalıydım.


3

2 sürücüyü arka arkaya kaybedip kaybedemeyeceğinizi mi soruyorsunuz? Elbette, her şey olabilir. Raid 5, veri erişimi için mükemmel kullanılabilirlik ve performans artışı sağlar, ancak raid 5 hiçbir şeyi yedeklemez. Tek bir sürücü donanım kaybı nedeniyle verilerinizin kullanılmasını önlemeye yardımcı olur. Verilerinizin bir kopyası değildir. Eski bir kopyayı, eski bir düzeltmeyi veya yalnızca geçerli çalışmanızın bir kopyasını kurtaramazsınız. Ayrıca, veri bozulmasına karşı koruma sağlamaz. Sadece bir sürücüyü kaybetmekten ziyade yanlış gidebilecek daha çok şey var. Virüs tüm verilerinizi bozabilir, küçük kız kardeşi masaüstünüzdeki çöp kutusunu izleyip dosyaları atarken dolu olmasını ve aptal arkadaşının makinenize bir soda düşürmesini izlemeyi sever.

Ayrıca, sabit sürücü baskını denetleyicisini kaybedebileceğinizi unutmayın. Ve diziyi başka bir rastgele denetleyiciye taşıyamazsınız. Normalde aynısını kullanmak zorundasınız ve yine de bir şeyler ters gidebilir. Bazı raid kontrolörleri bilgileri gemide saklar ve diğer yapılandırma bilgilerini ekli diziye gönderir. Bu durum ortaya çıktığında bir kumardır.

Aynı soru SF'de: /server/2888/why-is-raid-not-a-backup

Daha fazla nedene mi ihtiyacınız var?

EDIT: Senin fikrin doğru ve herkes olabilir. Şahsen birden fazla sürücünün başarısız olduğunu görmedim, ama bazılarının birbirine çok yakın öldüğünü gördüm. Hiçbiri bu yeniden inşa penceresinde değildi, ama teknik olarak bir risk. Ancak, bir şeylerin olması ihtimaline karşı bir yedeğiniz var mı? haha. Bazı insanlar bu konuda zor yolu bazen öğrenir. Raid 6, çift eşlik ile bir sonraki seviyeye çıkar ve 2 sürücüye kadar kaybedebilir. Herhangi bir baskın kurulumunda, arıza olasılığı dizinin boyutu (sürücü sayısı) ve karmaşıklığı ile artar. Daha fazla sürücü = daha fazla olası arıza noktası


üzgünüm, tüm bunları anlıyorum, sadece kimseye olup olmadığını ve senaryonun ne olduğunu soruyorum?
Brian

3

Haklısınız, bir diski kaybedip yeniden oluşturursanız RAID-5 senaryosunda, sistemin RAID setindeki tüm kalan sürücülerin her kesimini başarıyla okuması gerekir. NetApp, bazı durumlar için (bazı türlerde 28 sürücüye kadar RAID setleri yapabilirler) ikinci bir başarısızlığa çarpma olasılığınızın her onda bir olabileceğini iddia ediyor. Böylece RAID-6 ile ilgili olduğuna inandığım bir "İkili Eşlik" yapıyorlar.

Açıkçası, bir RAID setinde ne kadar çok sürücünüz varsa ve ne kadar büyük olursa, bir soruna çarpma olasılığınız o kadar yüksektir. Küçük bir RAID seti (3-5 disk) için olasılıklar RAID-5 kullanımına karşı çok fazla değişmemiştir.

Ama her zaman yapabileceğim NetApp'larda Raid-DP yapıyorum.


+1 "Hayatta kalan tüm itici güçlerin her sektörünü başarıyla okumalı" gerçeğini hiç düşünmemiştim.
09:31

2

Kişisel deneyim yok , ama başlarına gelenlerin çığlıklarını dinledim. Herhangi bir depolama sistemi - tek bir sürücü, bir USB anahtarı, bant, büyük bir RAID kurulumu veya Amazon S3 - nihayetinde sizin için en uygun olmayan şekilde başarısız olacaktır. RAID 5 setini yeniden oluştururken ikinci bir hata, bunun gerçekleşme yollarından sadece biridir.

Bir yana, üçlü parite RAID desteği birkaç gün önce OpenSolaris'e entegre edildi - bu nedenle en az bir tedarikçi, parite RAID yeniden oluşturma sırasında iki ek hataya izin vermenin mühendislik çabalarına değer olduğunu düşünüyor.


1

Aslında bu gerçekleşir. Bu nedenle NetApp depolama çözümlerinin RAID 6 uygulaması vardır. Bu, yeniden oluşturma sırasında ikinci bir sürücüyü kaybetmeniz durumundadır.

Bir sonraki sayfa bağlantı metninde listelenen standart formülleri kullanarak bir hata olasılığını hesaplayabilirsiniz Daha fazla ve daha fazla sayıda veri sürücüsüne ölçeklendirildikçe, böyle bir arızanın olasılığı artar. Yeterli diskiniz varsa, çok sayıda veri hacmine sahip bir RAID 5 kullanıyorsanız bu sayıyı endişe verici bölgeye itebilirsiniz.

Size kişisel deneyimlerden, aynı kritik zaman diliminde aynı dizide iki sürücü arızası olabileceğini söyleyebilirim. Raid 6 beni yedeklemeden geri yüklemek zorunda bırakmadı.

Bu yardımcı olur umarım


1

İşte bir senaryo: RAID5 dizinizde bir sürücü başarısız oldu, ancak yedeklemeniz zaten oturuyordu veya yeni sabit disk siparişi sonunda geldi. Siz (veya belki bazı uzak minyonlar) hatalı olanı değiştirmek için elinizle taze sürücüye gidersiniz. Kötü etiketleme, yorgunluk veya sade aptallık nedeniyle, arızalı olanın yerine kalan iyi sürücülerden biri çıkarılır ... ve ikinci başarısızlığınız var.


1

Bunu veri kurtarma işinde olduğum için birkaç kez gördüm. Ve evet genellikle aynı anda başarısız oluyorlar, ancak bunun zorunlu olarak inşa edildiğinde bir şeyleri olduğuna inanmıyorum, çünkü aynı zamanda uyumsuz sürücülerle de olduğunu gördüm. Çoğu zaman bu tür bir arıza, fırtına fırtınası, elektrik dalgalanması veya elektrik kesintisinden kısa bir süre sonra ortaya çıkar.

Genellikle dalgalanma sürücülere veya RAID denetleyicisine zarar verir ve birkaç gün içinde arızalanmaya başlar. Aslında şu anda bir elektrik kesintisi sonra aynı anda iki sürücü başarısız oldu bir dizi kurtarma üzerinde çalışıyorum. (şu anda umutsuz görünüyor)

Küçük bir ipucu: Aşırı gerilim koruyucular ekipmanınızı gerçekten korumaz. Raid 5'inizi daima iyi bir UPS'ye bağlayın. Dizi UPS üzerinde iken bunu hiç görmedim.


1

Yanlışlıkla ikinci bir iyi sürücüyü tek parite kümesinden çıkarmak, iyi bir RAID uygulaması ile diziyi yok etmemelidir. ZFS RAID-Z'nin tekrar çevrimiçi olana kadar dizideki herhangi bir G / Ç'yi donduracağını biliyorum.


0

Başka bir senaryo: Uzaktaki bir minyon, yedekleme bandını bantlanmış sürücüden çıkarmak için sipariş edilir. Rafa gider ve bandı bantlanmış sürücüden dışarı çıkarmaz ... ancak aynı anda 2 (iki) HDD sürücü bölmelerinden çıkar ve voila: 2 sürücü hatası.

Bunun çok zorlandığını mı düşünüyorsun? Peki şimdi sadece bunu yapan ve şimdi bir sunucu yeniden inşa bakarak bir müşteriyim.

İyi olduğunu düşündüm o tapedrive ya da whatnot ;-) olan bandı yakmadı

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.