ECC belleğin önemi


11

ECC bellek modüllerinin kritik olmayan bir sunucuda bulunması önemli midir?

Kendime rastgele, kritik olmayan birçok şey için özel bir oyuncak sunucusu almayı düşünüyordum. Sporadik yeniden başlatmalar önemli değil. Bir sağlayıcıya bakıyorum ama fiyatlar delicesine ucuz. Donanımları herhangi bir ciddi sunucu kutusu için bir şaka gibi geliyor: masaüstü işlemcileri, ECC olmayan RAM, isimsiz kasa, hotswap SATA HDD yok, vb.

Herhangi bir "ciddi" sunucu için verilen ECC bellek almak, bu yüzden "oyuncak" cihazlar için büyük bir anlaşma olup olmadığını merak ediyorum.


3
ECC belleğini soruyorsunuz, ancak SATA sürücülerini kullanmaktan mutluluk duyuyorsunuz. Çok ilginç.
John Gardeniers

3
@JohnGardeniers Görüyorsunuz, bu yılda bir kez sabit bir HDD anlamına gelse bile, birkaç saat çalışmama ve baskın kurtarmayı önemsemiyorum. Ancak günlük / haftalık sorun yaşamak sinir bozucu olacaktır. Evet, aslında boş zamanlarımda bu durumda çalışma
süremden

6
@JohnGardeniers: SATA sürücüleri SCSI / SAS HDD'lerden daha güvenilir değildir: usenix.org/event/fast07/tech/schroeder/schroeder.pdf
Hubert

Yanıtlar:


11

CERN IT personeli ( Data Integrity ) tarafından yayınlanan veriler , RAM'den gelen hata miktarının oldukça düşük olduğunu düşündürmektedir. Yine de verilerinizi ve donanım maliyetini ağırlıklandırmanız gerekir.

StorageMojo'da bununla ilgili daha fazla bilgi edinebilirsiniz .


10

ECC RAM temel olarak RAM'den okurken ve yazarken oluşan hataları önlemeye yardımcı olur. Aslında bir hata olma şansı oldukça küçük ama sıfır değil. Kritik görevler yapmıyorsanız ECC RAM olmadan uzaklaşabileceğinizi söyleyebilirim - dediğim gibi ECC'nin önleyeceği bir hatayla karşılaşma şansı gerçekten çok küçük.


6

Kritik olmayan sunucu nedir? Başarısız olabilecek biri?

ECC RAM, bellek güvenilirliği temel olduğunda önemlidir.

Bellek boyutlarının büyümesiyle iki şey büyür:

  • yazılımın belleğe güvenmesi, esp. sunucu yazılımı (örneğin önbelleğe alma)
  • hafıza hatası olasılığı (p = num_bits * p_bit_failure)

Bu ECC ilgili istihbarat sunumu Bu gerçekleri bildiriyor:

  • 4GB belleği 24x7 çalıştıran bir sunucu için ortalama bellek hatası oranı yılda 150 kez
  • Bellek modülü başına yılda 4000 düzeltilebilir hata
  • Hız aşırtma ve sistem yaşı hata oranlarını büyük ölçüde artırır
  • Tekrarlayan başarısızlıklar yaygındır ve hızlı bir şekilde gerçekleşir (% 97 ilk başarısızlığın 10 günü içinde ortaya çıkar) => çığ etkisi
  • Ömrü 3 ila 5 yıl olan bir ECC sunucusu için, sistem hatası olasılığı düzeltilemez bellek hatası% 0.001'den az

WISC tarafından yakın zamanda yapılan bir başka araştırma ECC'nin bu ZFS sistemleri için gerekli olduğunu göstermektedir:

ZFS'nin bellek bozulmaları için hiçbir önlemi yoktur: hatalı veri blokları kullanıcıya geri gönderilir veya diske yazılır, dosya sistemi işlemleri başarısız olur ve çoğu kez tüm sistem çöküyor.

Diğer dosya sistemlerinin bu veri bozulmasına ZFS kadar duyarlı olduğu unutulmamalıdır.

ECC, sizi mümkün olduğunda bu sorunlara girmekten alıkoyan şeydir ve feci durumlarda, çok geç olmadan sizi bu durum hakkında uyaran şeydir.


1

Bu o kadar da önemli değil. % 99.999 kesintisiz çalışma süresine ihtiyacınız varsa, bunun için endişelenirsiniz. Bunun dışında bellek hataları alacağınızdan daha sık yeniden başlatırsınız.


1

Google tarafından 2009 yılında yapılan bu çalışma, megabit başına milyar cihaz saati başına 25000 ila 70000 hata arasında bir hata oranı buldu. Bu, 8GiB (kullanılmış) RAM için saatte yaklaşık 1.7 ila 4.8 hata olduğu anlamına gelir.

Bitflips var olan bir şeydir ve veri bütünlüğü önemli olduğu anda göz ardı edilmemelidir.

Sizin durumunuzda (rastgele, kritik olmayan şeyler) muhtemelen aşırıya kaçabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.