Büyük NAS için RAID yapılandırması


13

24 1 TB disk NAS kutusu oluşturmayı düşünüyorum, ancak en iyi sürücü yapılandırmasının ne olduğundan emin değilim. Areca ARC-1280ML-2G denetleyicisini kullanmaya ve 24 sürücüyü de asmaya çalışıyorum.

Üzerinde depoladığımız veri türü nedeniyle hepsinin tek bir birim olarak monte edilmesini istiyorum. Sahip olduğumuz çılgın bir fikir, 6 adet 4 diskli RAID 5 birimini yapılandırmak, ardından bu 6 birimden daha fazla RAID 5 yazılımı yapmaktı. Bu, herhangi bir birimin bizim üzerimizde ölebileceği ve hala veri kaybetmeyeceğimiz anlamına gelir.

Bunun bir Ar-Ge projesi olduğunu, hızlı ve yüksek oranda kullanılabilir olması için onlarca terabayt depolamaya ihtiyaç duyacağımız yaklaşan bir uygulamamız olduğunu belirtmeliyim. Ancak ilk Ar-Ge aşaması için bazı riskleri kabul edebiliriz.

Bu tür bir konfigürasyon için en iyi çözüm nedir? 24 1 TB'lık disklerde, birden fazla aynı anda başarısız olur (veya bir ilk arızanın ardından birimi yeniden oluşturmak için gereken süre içinde), bu yüzden iyi bir çözüm bulmakta sorun yaşıyorum.

Yanıtlar:


10

İstediğiniz için zaten bir RAID seviyesi var; RAID 10 olarak adlandırılıyor.

Profesyonel ve tüketici seviyesi sürücüler için MTBF son yıllarda büyüklük sıralarında arttı, düzeltilemez hata oranı nispeten sabit kaldı. Bu oran 10 ^ 14 bit olarak tahmin edilir, bu nedenle tüketici SATA sürücüleri için 12 terabayt okuma başına bir bit kaynağı .

Bu nedenle, 24Tb sürücünüzden her geçişinizde, istatistiksel olarak en az 2 tek bit hatasıyla karşılaşırsınız. Bu hataların her biri bir RAID5 yeniden oluşturmayı tetikler ve daha da kötüsü, yeniden oluşturma sırasında ikinci bir hata çift hataya neden olur.


Düzeltilemez hata oranı ile ilgili mükemmel noktalar, ancak 3. paragrafta, "istatistiksel olarak karşılaşacaksınız ..." ifadesini eklemelisiniz, çünkü hepimiz okuma hatalarının (veya eksikliklerinin) kesin olmadığını biliyoruz
Matt Simmons

Yeniden inşa etmeden önce tekrar okumaya çalışmaz mı?
Antoine Benkemoun

Antoine: Tabii, ama gerçekten okunamıyorsa, pariteden veri almak için yeniden oluşturulması gerekecek, IIRC.
Matt Simmons

@Antonie, bunlar okunamayan okuma hataları, yani sürücüler ECC mantığı tarafından düzeltilemeyen hatalar (hataları 1: 10 ^ 14'ten önemli ölçüde daha yüksek bir oranda düzeltir)
Dave Cheney

Bunlar yazma hatalarından kaynaklanan hatalar mı? ikinci okumanın başarılı bir şekilde gerçekleşmesini engelleyen nedir?
Antoine Benkemoun

11

Bu benim günlük işim ... Linux depolama sunucuları oluşturmak.

  • Areca kartı iyi. RAID-6'da kullanabilirsiniz, makul güvenlik sağlayacaktır. İsteğe bağlı Pil yedekleme birimini de satın alın.
  • Masaüstü sürücüleri değil, kurumsal sınıftaki diskleri kullanın . Sunucunuzda 400 dolar daha harcayacaksınız, ancak buna değer. İki yedek sürücü satın alın. Bununla uğraşmayın, aynı modelin disklerini kullanın.
  • Dosya sistemi için XFS kullanın . Şaka yapmamak, ext3 ve arkadaşlar 16TB + dosya sistemleri için işe yaramazlar. Ciddi bir çökme durumunda bile, xfs_repair 20 TB'lık bir hacimde oldukça hızlı olacaktır (15 dakika, artık yok).
  • Tercihen, LVM2 kullanın , fazla değiştirmeyi planlamasanız bile depolama yönetimini kolaylaştıracaktır.
  • areca yönetim aracını kurun ve size sağlık kontrolü içeren günlük bir e-posta göndermek için bir cron işi yazın.
  • Yedeklemeyi unutmayın . RAID bir yedek değildir; Birisi önemli bir dosyayı silerse, uygun bir yedekleme olmadan kurtaramazsınız. Şahsen bir ay geçmişi olan özel bir sunucuya tüm önemli verileri kaydetmek için rdiff-backup kullanın; ayrıca dosya sunucunuzda iki RAID birimi oluşturabilir ve diğerini yedekleyebilirsiniz.

6

vay, RAID5 üzerinden RAID5? Performans sorunlarını tartışmak ister misiniz? Sen gerekecek ton . Onları asmak için ev sahibi yavru parite, o parite 3 sürücüye yazma ve daha sonra bu parite parite hesaplamak ve bu kümenin 4. sürücüye yazma yavru olacak. VAOV!

RAID10 hakkında konuşalım. Temelde RAID 1, ancak sürücülerinizi ikiye böldünüz ve aynalayın. 2 sürücüyü kaybedebileceğiniz ve hala iyi olabileceğiniz için hataya dayanıklıdır, ayrıca performans olağanüstüdür.

Eğer çılgınca bir alana ihtiyacınız yoksa, ancak daha iyi bir şey olmayan bir 24TB diziniz var, ancak kesinlikle olumlu olması gerekiyorsa, RAID60'ı düşünebilirsiniz. Aslında, yansıtılmış sürücü kümelerini kullanan RAID6'dır. Sürücülerinizin yarısını kaybedeceksiniz ve performans kötü olacak, ancak verilerin orada olacağı neredeyse garanti edilecek.

Gerçekten, RAID10 ile giderdim. İyi performans gösterir ve iyi çalışır. Evan'ın ikinci olarak muhtemelen bu kadar çok diskten dev RAID setlerini çıkarmamanız gerektiğine inanıyorum, çünkü dediği gibi, fsck ve chkdsk gibi şeyler sonsuza kadar sürecek ve daha da önemlisi aklımda, çünkü bir okuma hatasının istatistiksel olasılığı bireysel disk boyutunda olduğu gibi artar. Set başına 7-10 disk tavsiye ederim. Bu sayıda iğ ile çok iyi boyutta 3 RAID birimi oluşturabilirsiniz.

Hangisini seçerseniz seçin, diziyi değiştirmenizi beklemektense hemen yeniden oluşturmaya başlayabilmeniz için birkaç diski etkin yedeklerde bırakmayı unutmayın. Bir disk ölür ölmez saat başka bir disk için geçiyor.


@Matt: RAID setlerinin boyutundan bahsetmiyorum-- Dosya sisteminin boyutundan bahsediyorum. Eğer bir dosya sistemi kontrolü çalıştırmak zorunda bilgisayar OS dosya sistemi, vb "bozuk" Çünkü büyük olursa olsun, dosya sisteminin türü, büyük kesintiler istiyor o tek bir dosya sistemi kullanarak
Evan Anderson

@Evan - Üzgünüm, benim hatam. Ama bu da buna karşı başka bir argüman.
Matt Simmons

@Matt: Neye karşı bir tartışma? RAID kapsayıcılarının düzeni ve bu RAID kapsayıcılarındaki dosya sistemi sayısı dikey kaygılardır. Sen yok olması tek bir RAID kapta tek dosya sistemi olması ve bir dosya sistemi birçok işletim sistemlerinde çoklu RAID kapları yayılabilir.
Evan Anderson

Her ikisinde de haklısın. Kabul ediyoruz. Çok büyük dosya sistemleri yapmamalısınız çünkü kontrol zamanı kötüdür. Ayrıca aşırı büyük baskın hacimleri yapmamalısınız çünkü okuma hatasının istatistiksel olasılığı artar.
Matt Simmons

2

Neden RAID 1 + 0 olmasın? Her şey kontrolör seviyesinde ele alınır ...


1

"Ar-Ge" dediğini biliyorum, ama aynı zamanda "oldukça ulaşılabilir" dedin. Bunu yapmak için hazır bir SAN teçhizatı satın almaya karşı bir DIY çözümünün "tasarruflarını" sorgulayacağım. DIY çözümünüzle ilgili bir sorun olduğunda, yardım için kimseyle iletişim kurmayacağınız vazgeçilmez bir konumda olacaksınız. Kesinti süresi saat başına ne kadara mal olur? Bazı orta seviyeli SAN ekipmanlarının maliyetini kesinti giderlerinde oldukça hızlı bir şekilde yiyebilir ve doğru veri kaybı ile ilişkili masrafları göz ardı edebilirsiniz.

Alttaki disk hakkında ne yaparsanız yapın, bu kadar büyük bir dosya sistemi oluşturmazdım.

Dosya sistemi bozulması gerçek bir olasılıktır (RAID denetleyicisi sorunu, işletim sistemi hataları, vb.). Bu kadar büyük bir birimde, dosya sistemi denetimi sonsuza kadar sürecektir. Tek bir dosya sistemi olarak görünmek için mantıksal olarak birleştirilebilen birden fazla birim kullanmanızı şiddetle tavsiye ederim (çeşitli yollarla - işletim sisteminden bahsetmediniz, bu yüzden size özel fikirler veremem). Bazı dosya sistemi bozulmalarınız varsa, mantıksal birimin bir kısmını kaybedersiniz, ancak yine de "çalışır durumda" olursunuz.

Örnek olarak: Windows dünyasında, CHKDSK'yi dosyalarla dolu 20 TB NTFS biriminde çalıştırmak YAVAŞ olacak . Bu tür bir ortamda, birden çok daha küçük NTFS birimi oluşturabilir ve bunları mantıksal olarak DFS ile tek bir ad alanında birleştirebilirim.


1

wazoox, cevaplar iyidir Ona daha fazla artı puan vermek için temsilcisi yok, ama aşağıdakileri eklerdim.

RAID 6 veya 10 disk başına en az 2 canlı eşlik diski, en fazla 16, yani baskının yeniden yapılandırmanızdan performansın etkileneceği bir gün sürebilir. Eğer yıkımla yaşayamazsanız, o zaman onun aynalı çizgiler olması gerekir.

Linux yoluna gidiyorsanız, bir donanım baskını kartı kullanırım (pil yedeklemeli) veya disk muhafazasında bir baskın denetleyicim olurdu. Xfs'nin Linux'ta tercih edilen dosya sistemi olduğunu kabul ediyorum, ancak xfs_check'i çalıştırmanız gerekiyorsa xfs'de yaklaşık 50 TB'lık dosya sistemlerinin 16GB'tan fazla RAM aldığını unutmayın.

Ciddi bir NetApp gibi iyi bir NAS kutusunu uzun vadede çok daha az iş oldukları için düşünürdüm, depolama yöneticilerinin zamanının şirket için ne kadar değerli olduğuna bağlıdır.

Nfs / samba'nın iyi performans göstermesi biraz karanlık bir sanattır, 10GB eter mi yoksa sadece 1GB / sn'lik toplamlar mı kullanacaksınız? (Broadcomm kartları özellikle 10GB olanlar almayın).

LVM2 bir beyin değildir, ancak hızlı olmadığı için ek çekim kullanmayın.

Bunun yedeklerinin biraz zaman alacağını unutmayın.

Sistemin üretime geçmeden önce nasıl başarısız olabileceğini test edin ve sizin ve iş arkadaşlarınızın, her şey ters gittiğinde belgeleri bulabilecekleri bir yere yazmasını sağlayın.


1

Okuma / yazma oranınıza bağlıdır. Çok sayıda HP MSA70 harici 25 diskli SAS sürücü kasası kullanıyoruz ve her zaman tek bir RAID6 dizisi olarak oluşturuyoruz, çünkü okuma yazma oranımız% 99:% 1 olduğundan R6'nın yazmadaki en yavaş ( hala oldukça hızlı, sadece diğerlerine göre iyi değil). Bu şekilde 23 disk değerine sahip verilerimiz var, ÇOK iyi, rastgele okuma ve genel okuma bant genişliği avantajlarında olduğu gibi çok iyi var ve iki disk arızasından kurtulabilir.

Kaba bir kılavuz olarak, bir RAID5 dizisi bir dizide yaklaşık 14 diskten fazla olmamalıdır, ancak bir RAID6 54 diske kadar iyi olmalıdır - tabii ki dizi ne kadar büyükse, okuma ve yazma performansı ve daha yavaş yeniden yapılanmalar alacak, ancak iyi bir değiş tokuş olabilir.


0

Başlangıç ​​için iki bekleme diski eklerdim.

RAID 5 veya 6 rasgele okumalar veya büyük sıralı okumalar ve yazma işlemleri için uygundur. Çok sayıda küçük yazı alacaksanız, RAID 5+ küçük yazılara 4 kez vurduğundan RAID 10 ile devam edin.

Yazma önbelleğini açacaksanız, bir pil ile yedeklemeyi unutmayın.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.