Benzer bir arıza süresi olasılığını azaltmak için yeni bir RAID 1 çiftinin bir diskinde 'koşmam' gerekir mi?


19

İki yeni 4 TB sabit disk RAID1 dizisi kuruyorum.

Daha önce bir yerde, RAID1 dizisini aynı anda satın alınan yeni özdeş sabit diskler oluşturmanın, benzer bir noktada başarısız olma şansını arttırdığını duydum.

Bu nedenle, sabit disklerden birini kısa bir süre içinde her ikisinin de başarısız olma olasılığını azaltmak amacıyla kendi başına bir süre (belki birkaç hafta) kullanmayı düşünüyorum. (kullanılmayan sürücünün çekmecede bağlantısı kesilir)

Bu makul bir yaklaşım gibi mi gözüküyor yoksa daha fazla zamanımı boşa harcıyorum mu?


2
Sıkça duyulan bir iddiadır, ancak henüz bunu destekleyen herhangi bir belge görmedim. Çok daha gerçek bir risk, disklerinizden birinin bir süre fark edilmeyen bazı kötü sektörler geliştirebilmesidir. Ancak diğer disk başarısız olduğunda, yeniden oluşturma sırasında bu kötü sektörleri fark edeceksiniz.
kasperd

8
Düzinelerce sürücü ile çalışıyorsanız, birkaç partiden kaynak almayı düşünebilirsiniz. İki sürücü seti için bunu yapmak zahmete değmez. Başarısızlık oranı benzer veya öngörülebilir değildir ... biri 3 ay sürebilir, diğeri 5 yıl sürebilir.
jlehtinen

Şahsen sadece iki sürücü ile baskın yapmazdım. Daha fazla sürücü kullanmak daha iyi kapasite sağlar. Örneğin, 3 sürücü 2 sürücünün aksine 8 TB toplam depolama alanı sağlar ve sadece 4 TB verir. Herhangi bir sürücü üç sette başarısız olabilir ve üç kaynaktan geliyorlarsa, aynı anda arıza oranları düşüktür.
15'te phyrfox

3
@phyrfox - RAID-5 (ve -6), uygulamasıyla uyumlu olmayabilir RAID-1'den farklı performans özelliklerine sahiptir. Büyük sürücülerde (özellikle tüketici kalitesinde sürücüler), daha yüksek RAID düzeyleri kullanacak olsaydım, diziyi tek bir disk arızasından sonra yeniden oluştururken kesinlikle ikinci bir disk hatasına karşı korumak için RAID-6 ile giderdim. Aynı anda satın alınan bir disk seti kullanarak 2 yıldır 5 disk RAID-6 dizisi çalıştırıyorum - bir disk bir ay içinde başarısız oldu, geri kalanların hiçbirinde herhangi bir sorun gösterilmedi.
Johnny

1
@phyrfox RAID5 megabayt başına maliyeti düşürür, ancak başarısız olacak daha fazla sürücü olduğu için bir hata yaşama şansını arttırır.
Caltor

Yanıtlar:


16

Zaman kaybı.

Arızayı tetikleyemez veya sürücüleri anlamlı bir şekilde strese sokamazsınız. RAID'iniz var ve bu iyi bir başlangıç. Arızaları meydana geldiklerinde gerçekten tespit etmek ve felakete karşı korumak için yedeklemeler izlemek için izleme yaptığınızdan emin olun.


2
Geleneksel HDS için katılıyorum, ama ssds için çok farklı bir hikaye. 4 TB SSD'lerin ucuz ve kullanılabilir hale gelmeden önce bu kayda değer olduğunu düşündüm ve okuyucular burada pas iplikten bahsettiğimizi fark etmiyorlar, ama belki o zamana kadar daha fazla yazacaklar.
symcbean

3
Evet - kesinlikle herhangi bir 'kurumsal' sürücü zaten küvet eğrisindeki erken yaşam hatalarını aşmak için test edilmiş olacaktır. Bir çift jeneratör satın alıp almadığınızı bilmeme rağmen, tavsiye% 66 ila% 33 arasında değişiyor, çünkü her ikisi de aynı anda yıpranmıyor. Ancak sürücülerde, MTBF'nin oldukça büyük bir standart sapması vardır, bu yüzden çok daha az endişe duymaktadır.
Sobrique

5

Bu konuda endişeleriniz varsa farklı markaları veya disk serilerini birlikte kullanmak daha iyi olabilir.

Ben var benzer tip ve yaş diskler bu bir sehir leend değil IMHO yüzden, kümeler halinde başarısız görülen.


1
Ben de var, ama MTBF ile ilgili bir şey yerine tehlikeli firmware aşağı oldu.
Sobrique

2

Büyük Soru - Ancak, otomobil farlarının aksine, bu zaman kaybıdır. 4 GB sürücüler için [bu örnekte WD Red] MTBF [arızalar arasındaki ortalama süre] derecesi 1.000.000 saattir. İki sürücünün bir aynada aynı anda kötü gitme olasılığı oldukça nadirdir. Bunun olduğunu gördüğümde, bunun nedeni ilk sürücünün fark etmeden başarısız olmasıydı. Yedeklemelerle korumak, önce bir sürücüyü yazmaktan daha yararlıdır. Sürücü türlerini karıştırırsanız, sürücülerin aynı hızda olduğundan emin olun. Paranoyaksanız, RAID 10 tam size göre.


MTBF, disklerin bağımsız olduğunu ve aynı RAID setinde bulunmadığını varsayar. Bunun zaman kaybı olmasının başka nedenleri de var, ancak üretici tarafından serbest bırakılan, gerçeklikle zayıf bir korelasyonu olan gülünç bir sayı bunlardan biri değil.
HopelessN00b

5
Bir HDD gerçekten arızalar arasında belirtilen ortalama süreye sahipse, garanti süreleri neden bu kadar kısa? 1M saat 114 yıl, vermek veya almak. WD Red Pro (partiden birini seçtiğim için) beş yıl garanti ile geliyor. Ortalama başarısızlığın yarısını alsanız bile , Western Digital , belirtilen MTBF döneminin onda birinden daha fazlasının güvenilir olacağına hala inanmıyor . Şimdi hangisine inanmaya daha meyilli olursunuz; yükümlülükleri olmayan rastgele bir istatistik veya paranın gerçekte nerede olduğu? (Garanti döner, geri ödemeler, refurbs ve değiştirmeler gerçek para ister.)
Bir CVn

1
@ MichaelKjörling: MTBF'yi garanti altına alırlarsa, garanti altındaki sürücülerin% 50'sinden fazlasını (evet, dağıtımda uzun kuyruk) değiştireceklerdi. Elbette paranın nerede olduğuna bakmalısınız, ancak MTBF'nin garantiden daha büyük bir büyüklük sırası olduğuna ve bunun olduğuna inanmak için birkaç tane olduğuna inanmak için hiçbir neden göremiyorum.
Ben Voigt

@ MichaelKjörling 100k saatlik yayınlanmış bir MTBF ile 1k saatlik çalışmadan sonra sürekli aşınan bir donanım gördüm. Yeni nesil donanım, 200 bin saatlik MTBF yayınladı. Yeni donanımın ilk partisi 48 saat boyunca çalıştığında% 50'den fazlası başarısız olmuştur.
kasperd

1

Teoride mantıklı olsa da, veriler work insürücünüze olan ihtiyacı desteklemez .
Sadece birkaç hafta gerçekten bir etki yaratmaz, sadece iki sürücüye bakıldığında arıza yüzdeleri gerçekten çalışmaz.

Aynı modeldeki sürücüler söz konusu olduğunda daha normalize edilmiş arıza oranlarının bir göstergesi olsa da .

Yaşa bağlı sonuçların çoğu tahrik vintajlarından etkilenir ... İlginçtir, bu sonuçlarımızı değiştirmez. Yaşa bağlı sonuçların aksine , makalenin geri kalanında gösterilen tüm sonuçların nüfus karışımından önemli ölçüde etkilenmediğini not ediyoruz . (benimkini vurgula)

Bu nedenle, sadece küçük bir başarısızlık alt kümesi olan yaşa bağlı arızalar, sürücü vintajları ile bir şekilde ilişkilendirilebilir. Ancak başarısızlıkların çoğu yapamaz.
Buna, belirli bir yıl için% 8'e varan genel başarısızlık yüzdelerini eklerseniz, aynı yıl içinde her iki sürücünün de başarısız olma olasılığı düşüktür, aynı haftada başarısız olmaları ihmal edilebilir.
Ve bu sadece yaşa bağlı başarısızlıklara değil, olası her başarısızlığa bakarsanız.

Riski en aza indirmek istiyorsanız, ancak farklı bir vintage iki sürücü.
Güvence istiyorsanız, bir sigorta satın alın.
Ve ewwhite en cevabı zaten belirtilmiş, yedekleme ve izleme şarttır.


0

Bu genellikle deneyimlerime göre SSD'ler için HDD'lerden daha fazla bir argüman. SSD'lerin yazma döngüleri sınırlıdır, bu nedenle aynı modelin iki SSD'si olan bir RAID1 kullanırsanız, her ikisinin de aynı anda yazma döngüleri bitmesi gerekir.

Genel arızalara gelince, kütle titreşimi, statik veya yüksek ısı gibi ciddi bir sorununuz yoksa; 2 sürücüden 2'sinin aynı anda arızalandığını sanmıyorum.

4 TB gibi daha büyük sürücülere sahip RAID1 (ve RAID10) ile ilgili temel bir sorun, yeniden oluşturmadır. 2 sürücü aynası ile, bir sürücü arızalandığında, diğer sürücü iş yükünün iki katını taşır. Sonra yeniden oluşturduğunuzda, bu sürücü daha fazla yük alıyor. Bu sürücüde yanlış bir şey varsa, özellikle yük altında 4 TB'lık bir aynanın yeniden inşa edilmesinin uzun sürebileceği düşünülürse, bu koşullarda başarısız olması muhtemeldir.


0

Yapabilirsiniz, ama çok fazla yardımcı olmaz.

Örneğin, giriş gücünde bir iğne varsa, aynı iğne her iki diski de öldürür.

Önemli olan: iyi bir yedeğe sahip olmanız gerekir. Raid iyi bir yedek oluşturmaz. Aslında, iyi bir yedeğiniz varsa, belki bir yansıtma baskını kesinlikle gerekli değildir (eğer bir sistemin çökmesini tolere edebilirseniz 2-3 yıl).


3
RAID, verileri yedeklemekle ilgili değil, kullanılabilirlikle ilgilidir. Burada önemli olan, sürücüdeki verileri korumak için değil, bir sürücü arızalandığında sistemi kullanılabilir tutmaktır.
HopelessN00b

@ HopelessN00b Cevapta açıklamaya çalıştığım tam da bu, belki yeterince açık değildim?
peterh - Monica

Sonunda cümleniz suları çamurluyor.
HopelessN00b

@ HopelessN00b Raid ayrıca disk arızalarından kaynaklanan veri kaybından korur. Bu genellikle yanlış bir sonuca yol açar, yedek olarak kullanılabilir. Ancak baskını kullanmak ve yedekleri kullanmak, bunlar duruma bağlı şeylerdir. Profesyonel bir sistem ortamının bile her ikisine de ihtiyaç duymadığı durumlar vardır. Bana göre, amaç hem deneyimsiz bir sisteme zorlamak değil, hem de diskleri yansıtmanın ve verilerini yedeklemenin farklı problemler için farklı çözümler olduğunu açıkça belirtmektir.
peterh - Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.