ECC DIMM'lere sahip Dell PowerEdge R710 Bios'ta “Gelişmiş ECC” biyografilerini kullanmalı mıyım?


15

Çift Intel Xeon E5503 işlemcili bir Dell PowerEdge R710'um var. 96GB (12x8GB) ECC DIMM'lere sahiptir. BIOS'unda, bellek "Gelişmiş ECC" için yapılandırılmıştır.

Sorum şu: DIMM'lerim zaten ECC ise, BIOS'taki bu "Gelişmiş ECC" modunu etkinleştirmek anlamlı mı yoksa "Optimize edilmiş" duruma geçmem mi gerekiyor?

Dell bu modları şöyle tarif eder:

Gelişmiş ECC Modu Bu mod, iki MCH kullanır ve bunları 128 bitlik bir veri yolu DIMM'i taklit etmek için “bağlar”. Bu öncelikle x8 DRAM teknolojisine dayanan DIMM'ler için Tek Aygıtlı Veri Düzeltme (SDDC) elde etmek için kullanılır. SDDC, her bellek modunda x4 tabanlı DIMM'lerle desteklenir. Bir MCH tamamen kullanılmaz ve bu kanala takılan herhangi bir bellek POST sırasında bir uyarı mesajı oluşturur.

Bellek Optimize Edilmiş Mod Bu modda, MCH'ler birbirinden bağımsız çalışır; örneğin, biri boşta olabilir, biri yazma işlemi gerçekleştirebilir ve diğeri okuma işlemi için hazırlanıyor olabilir. Bellek bir, iki veya üç kanala takılmış olabilir. Bellek için optimize edilmiş modun performans avantajını tam olarak anlamak için, CPU başına üç kanalın tümü doldurulmalıdır. Bu, 3GB, 6GB veya 12GB gibi bazı 'atipik' bellek yapılandırmalarının en iyi performansı vereceği anlamına gelir. Belirli RAS özellikleri gerekmedikçe bu önerilen moddur.

Dell PowerEdge R710 Sistemleri Donanım Kullanıcı El Kitabı (PDF)

Yanıtlar:


24

Bir fark yaratır, sadece x4 veya x8 cihazlarda RAS (Güvenilirlik, Kullanılabilirlik ve Servis) özelliklerine ihtiyacınız varsa ve ihtiyaçlarınız için ödünleşmeleri anlarsanız mantıklı olacaktır. Daha fazla ayrıntı Dell teknik incelemesinde açıklanabilir Dell ™ PowerEdge ™ Sunucuları 2009 - Bellek .

Ayrıca, R710'a özgü ayrıntılara sahip yapılandırma ve düzen, PowerEdge R710 Teknik Kılavuzunda mevcuttur - (Google bunu bağlantı için itibarım olmadığı için Google).

Dikkat edilmesi gereken önemli nokta, yongadaki ECC ile Dell'in Tek Aygıt Veri Düzeltme BIOS'u (SDDC) tarafından sağlanan "Gelişmiş ECC" arasındaki farktır. Her ikisine de performans etkisi olacak. ECC çip üzerine yazma sırasında hatalardan kurtulacaktır. Bununla birlikte, SDDC bir adım daha ileri gider ve tüm çipin arızalanabilmesi ve yine de kurtarılabilir olması için bitleri düzenler. Bir örnek ve ayrıntılara bakın SDDC E7500 Yonga Seti

Sorunlar, performansınızın ve / veya güvenilirliğinizin makinenizi özel kullanımınız için en büyük endişe kaynağı olup olmadığıdır. Bir çip arızası bu makinede kritik veri veya kullanım kaybına neden olacaksa ve uygulamada yedekli değilse, Gelişmiş ECC gitmek için harika bir yol olabilir. Ancak, bunu sizin için daha önemli olabilecek bir performans etkisiyle yaparsınız.

Tek bir Microsoft SQL Server uygulaması için Dell PowerEdge sunucularında her ikisini de uyguladım. Daha fazla yardım edebilirsem, bana bildirmek için yorum yap.

Umarım yardımcı olur.

DÜZENLEME: Kapsam boşluğu / ECC uygulamaları

Evet, her ikisini de uygulasanız bile bir kapsam boşluğu var. Özellikle yüksek kullanılabilirlikli sunucular kümesini kullandığınız için, IMHO Gelişmiş ECC'yi kullanmalısınız. Kümelenmiş cihazların avantajlarına kıyasla performans etkiniz minimumdur. Crucial'a göre ECC bellekte performansta sadece % 2'lik bir düşüş var genel .

Boşluk, ortaya çıkan hata türlerine ve her birinin hataları nasıl ele alacağına daha spesifik olacaktır. Özel durumunuzda veri kaybına dönüşmemelidir. Bu bir Enterprise DBMS olduğundan ve hatalar olduğundan, veri kaybını önlemek için eşzamanlılık sorunları yazılım düzeyinde yönetilir. Düzgün yapılandırılmış bir DBMS'deki değişikliklerin ayrıntılı bir geçmişi tutulur ve bunu kullanan yazılım, ciddi bir hata oluşursa, işlemin "geri alınması" için genellikle kurulum yapabilir.

ECC Uygulamaları

ECC bellek okuma / yazmadaki bit hatalarını düzeltmeye çalışacaktır. Bununla birlikte, hata daha önemliyse, ECC bile kurtarılamayacak ve bu da potansiyel veri kaybına neden olacaktır . ECC hakkında ServerFault / ECC ram nedir ve neden daha iyi? Hakkında daha fazla tartışma var.

ECC_Memory'deki Wikipedia'ya göre

ECC bellek, tek bit hatalarından arınmış bir bellek sistemini etkin bir şekilde korur ...

SDDC

Yukarıdaki E7500 yonga seti belgesine başvurursanız (Intel'in 55xx / 56xx'in oturum açma / ortaklık gerektirdiğini unutmayın , ancak fikir benzerdir, bu yüzden başlangıçta bağlantı vermedim), SDDC'yi ve nasıl mümkün olduğunu açıklar. Temel olarak, belleğe yazılan sözcükleri, her sözcüğün yalnızca tek bir bit hatası içereceği şekilde yazılmasını sağlayan bir teknik kullanır, yani sözcük tek bit hatasından (yukarıdaki gibi) kurtarılabilir olmalıdır. Şimdi bu kelime başına, bu nedenle her kelimeyi düzelterek x4 cihazlarda 4-bit hatalardan (kelime başına 1) ve x8 cihazlarda 8-bit hatalardan (hala kelime başına 1) kurtulabilir.

Ek hatalar, daha fazla bit hataları, toplam bellek arızası, kanal arızası, veriyolu arızası vb. Yine de korkunç sorunlara neden olabilir, ancak bu yüzden bir kümeniz ve bir Enterprise DBMS'niz var.

Kısacası, her şeyi etkinleştirdiyseniz ve hata düzeltme algoritmalarını düzeltmek için çok fazla bit hatası varsa, yine de hata kapsama boşluğu gibi bir hataya sahip olacaksınız. Bunlar son derece nadir olabilir.


Daha spesifik olmak gerekirse bu, Oracle DB kümesini çalıştıran 3 özdeş R710'lardan oluşan bir settir. Bu nedenle, tek bir makinenin mevcudiyeti en önemli şey değildir. Ancak, veri bozulması rahatsız edici. R710 teknik rehberini gördüm. Bellek hakkında fazla bir bilgi yoktu. Dim-on ECC ile dimm çiplerindeki hataları tespit eder / düzeltir? Ancak, Gelişmiş ECC tüm dimm için hataları algılar / düzeltir mi? Bu durumda, bu 2 yöntem arasında bir kapsam boşluğu var mı?
Mxx

@Mxx Açıklamayı denemek için cevabımı güncelledim. Bir Oracle DB kümesi çalıştırdığınız için IMHO, veri kaybınız olacağından şüpheliyim. Nadiren bir arıza durumunda, DBMS veri kaybını ve diğer sorunları önlemek için oluşturulur. Küme için durumunuz, performansın önemsiz olması gerektiği için Gelişmiş ECC'yi etkinleştiririm, ancak endişeleriniz varsa yük altında test edebilirsiniz.
Matthew Reid

Cevabınız için çok teşekkür ederim. Üzgünüm, ama hala bir şey hakkında net değilim. "Gelişmiş ECC" beni karartılmış ECC'nin yapamayacağı şeyden ne koruyabilir? Eğer dbms kullanıyorsanız, üç kanallı bellek yapılandırmasının performans avantajını elde etmek için biyografileri "optimize edilmiş moda" geçirmek mantıklı olmaz ve karartılmış ECC ve Oracle'ın kendi doğrulaması ile korunur mu?
Mxx

@ Herhalde tam olarak garanti edilmediğini düşünüyorum. Bununla birlikte, Gelişmiş ECC seçeneği Açık olarak, müdahale olmadan daha fazla hatayı düzeltebilirsiniz (genel olarak biraz hata olasılığı düşük) ve performans isabeti düşük olmalıdır. DBMS'de düzeltmeye çalışmak kesinlikle daha düşüktür. DBMS verilerinizi kaydedebiliyor olsa da, son kullanıcı deneyimi hala bir yazılım çökmesinde ve / veya potansiyel olarak büyük bir işlemin geri alınmasında sunulabilir. Çipin arızalı olup olmadığını ve hata sıklığını arttırdığını izleme ile düşünüyorum, Gelişmiş ECC size DIMM'i temiz bir şekilde değiştirmeniz için zaman verebilir.
Matthew Reid
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.