ECC RAM'i masaüstü PC'lerde kullanmanın kesin veya ölçülebilir bir avantajı var mı?


21

İstikrarlı makineler üretmeye çok dikkat ediyorum - kazalardan, yeniden başlatmalardan, komik davranışlardan vs. kesinlikle nefret ediyorum - ve böylece hata düzeltme aka ECC RAM büyük bir sorunu çözüyor gibi görünüyor: bellek hataları.

Ama gerçekten çalışıyor mu? Ölçülebilir bir avantaj var mı, örneğin daha az çökme veya başka davranışlar?

Maliyetin yanı sıra, neden yeni bir PC yapımı için ECC belleği kullanmıyorsunuz? ECC özelliği neden sunucu / iş istasyonu sınıfı makineler için çoğunlukla mevcut ve destekleniyor, ancak tüketici odaklı anakartlarda desteklenmiyor?


1
Evet, ECC'ler yumuşak hatalara karşı gerçekten yararlıdır. Hata hafıza erişimindeyse, yumuşak bir hata sistemin çökmesine neden olabilir. Tek bir yumuşak hatanın milyar dolarlık bir sektörü durdurduğu bildirildi. İşte bunun için ayrıntılı bir referans .
user984260 12:15

Yanıtlar:


10

ECC ram'ı sunucularda birkaç yıldır kullanıyorum. ECC, makinenizi yoğun bir şekilde kullanırken, "günde 12-16 saatten fazla olduğu" gibi parlar. ECC'siz kurduğum küçük beyaz kutu sunucularında, er ya da geç, yeniden başlatma gerektiren "sorunlar" geliştirildi, ancak ECC makinelerinde bu sorunlar olmadı .

Yani cevabım şudur: Bilgisayarınızı çok kullanıyorsanız , muhtemelen evet. Bilgisayarınızı 7/24 kullanıyorsanız, olması gereken bir bilgisayar olmalıdır.

ECC'yi destekleyen bazı anakartlar var. Genellikle şeylerin "daha yüksek" ucundadır, ancak küçük bir araştırma ile bunları çeşitli üreticilerden bulabilirsiniz. Diğer tek husus, BIOS'ta ECC desteğini etkinleştirmeyi hatırlamaktır.


Google bu konuda çok etkilendi. Bunun günümüz sistemlerini gerçekten nasıl etkilediğini görmek için http://blogs.zdnet.com/storage/?p=638 adresine bakın .


8
"ECC olmadan kurduğum küçük beyaz kutu sunucuları, er ya da geç, yeniden başlatma gerektiren" sorunlar "geliştirdi" - bu benim zevklerim için biraz apocryphal / voodoo hesaplamaları ..
Jeff Atwood

4
Ve bunun farkında olmadığımı mı düşünüyorsun? Aynı yazılımı, aynı donanım üzerinde garip sorunları olan (posta yanlış teslim edildi) başka şekilde nasıl açıklayabilirsiniz , ancak tüm RAM'leri değiştirdikten sonra sorunlar kendiliğinden çözülür ? Fikri de sevmiyorum, ancak değişmesi gereken tek önemli bileşen olduğu göz önüne alındığında ve ECC güncellemesinden sonra kaybolan sorunlarla eşleşmemesi gerektiğinden, bunu göz ardı etmek zor ...
Avery Payne

1
Ayrıca bahsetmeyi de unuttum - RAM, ECC yükseltmesinden önce bir kez değiştirildi ve sorun devam etti. Belki de mobo için kötü bir izdi. Belki de tahtadaki bir tasarım hatasıydı. Sanırım, görüş açıklarında, her birinin bir EE'nin ortaya çıkmasını ve kapsamı araştırmasını gerektirecek başka birçok konu olabileceğini düşünüyorum, ancak günün sonunda ECC, konuyu başka bir nedenden ötürü ortadan kaldırarak yaptı RAM'den alınan verilerin% 100 tutarlı bir durumda olduğundan emin olun. Jeff, voodoo olduğuna katılıyorum ... Bundan hoşlanmadım, ama işte orada.
Avery Payne

1
@Jeff Atwood - şey ... sonuçta voodoo oldu, bunun bilgisayarınıza geldiğini görmemeniz anlamında
Avery Payne

6

Yalnızca sunucu gerektirdiğinde ECC'nin kullanılmaya değer olduğunu düşünüyorum . Vikipedi :

Bilgisayar sistemlerinde hata tespiti ve düzeltilmesi moda girip çıkıyor gibi görünüyor. Seymour Cray, neden CDC 6600'den ayrıldığını sorduğunda ünlü "çiftler için parite" dedi. CDC 7600'e eşliği dahil etti ve "Çok sayıda çiftçinin bilgisayar satın aldığını öğrendim" dedi.

İnternet üzerinde kesin bir kaynak bulamıyorum; bu durum, gigabayt başına ayda bir bitlik bir hata olduğunu ve bunun saçma olduğunu; Sunucular uzaktan gerçekleseydi , tüm dünyada sol ve sağ çöküyordu .

Gerçek sunucu yöneticilerinin bir MetaFilter dizisinden bazı vurgular :

Bence ECC havalı bir şey, fakat hem sunucuyla hem de sunucusuz sunucular vardı ve hiçbir şekilde bir şey yapıp, hiçbir şey yapmadım.

ECC RAM'in amacını anlıyorum ama konuyu değil. Demek istediğim, kozmik ışın biti sayılmasından kaynaklanan hiçbir sorunu fark etmedim. Birden fazla yıl kullanım süresi olan kişisel bilgi işlem / derleme sunucularında bile. Bitlerin dönmediğini söylememek değil, kesinlikle önemli değil.

Tecrübelerime göre, burada ve orada birkaç makinenin bulunduğu çiftlikleri işletiyorsanız, EC3 ile düzeltilebilecek bir sorun yaşamaya devam etmek için Ext3'ün her tarafınıza sessizce kusması daha olasıdır.

Şahsen, ECC'nin biraz kargo kültürü olduğunu düşünüyorum, ancak maliyet primi çok yüksek olmadığı sürece büyük bir etli sunucularda makul bir sigorta poliçesi.


Sola ve sağa çarpmak? O kadar kötü olacağını sanmıyorum. İlginçtir: "sola ve sağa çarpmak" ... Fakat şunu düşünün: tahsis edilmemiş RAM'de (çok sayıda, az kullanılan sunucularda) veya tahsis edilmiş bellekte serbest bırakılmadan ve yeniden tahsis edilmeden önce tekrar çalıştırılmayacak veya referans alınmayacak gibi olabilir (örn. Ölü kodda bir hata varsa, ses çıkarır mı ?.)
Chris W. Rea

Ayrıca Google’ın bellek hataları hakkında söyleyecek bir şeyleri olup olmadığını da merak ediyorum. Bir ton server işletiyorlar. Ne kadar sunucunun kapalı kalma süresinin, fritz'deki güç kaynaklarının aksine RAM hatalarına atfedilebileceğini merak ediyorum ...
Chris W. Rea

3

Kritik sistemler için düşündük. Bir sorun ortaya çıkar, heck nasıl yazılım bütünlüğünü kontrol etmek için kullanılan programda bellek bütünlüğünü kontrol etmek için kullanılan program bellek hatalarına eğilimli olabilir? Temelde yapamazsınız ve başarısızlık modu analizi / başarısızlık azaltma işlemini zorlaştırır, bu nedenle ECC bir azaltma mekanizmasıdır.

Bu, eğer sorun varsa, kozmik ışınları suçlayabileceğiniz durumlardan biridir ;)


2

ECC koçunu "kritik görev" uygulamaları için düşünürdüm. Bir sunucu hatası önemli miktarda para kaybetmenize (veya insanları ya da her neyse öldürmenize) neden olacaksa, ECC ramına yol açın. Temel olarak, bir hata durumunda kaybedeceğinize karşı ECC koçunun maliyetini tartın.

Ancak ne karar verirseniz verin, MemTest86 + 'yı gece boyunca çalıştırmanızı tavsiye ederim (veya tüm adres alanı boyunca birkaç geçiş yapacak kadar uzun). Isıyı (kelimenin tam anlamıyla) yükseltebiliyorsanız, bu, sistem sıcakken ramınızın nasıl bir performans göstereceğine dair bir fikir verecektir.

MemTest'te yepyeni RAM hata gösterdim. Ayrıca, MemTest'in tespit ettiği zaman içinde "iyi" bir ram hatası yaptım. Harika bir araç ve yeni bir sistemde çalıştırdığım ilk şeylerden biri.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.