GPGPU hızlandırma için Nvidia K20X vs GeForce Titan


10

Ben özellikle DGEMM bileşeni için, akademik bilgi işlem için bu iki grafik kartı arasındaki farkı anlamaya çalışıyorum.

Ham istatistiklere bakarsak, her ikisi de aynı GK110 yongasına sahip, neredeyse her kategoride karşılaştırılabilir istatistiklere sahip ve inanıyorum ki, aynı çekirdek mimariye sahip. Herhangi bir indirimden önce K20X bir Titan'ın maliyetinin yaklaşık 4 katıdır. Verimlilik açısından bakıldığında Titan'ın K20X'lerin üzerinde kullanılması çok mantıklı görünüyor.

Buradaki farkı anlamakta zorlanıyorum, kimse durumu aydınlatabilir mi?

Bir not olarak, bu kartları bir raf sunucusu için satın almak için arıyorum ve ölene kadar temelde tam eğimde çalıştırmak; ancak, özellikle tek bir iş için birden fazla GPU kullanmanın etkinliğini görmüyorum.

Yanıtlar:


13

Bazı farklılıklar vardır, ancak bunlar mutlaka donanım veya teknik özelliklerde değildir. Bunun forumlardan veya haber bültenlerinden edindiğim tüm bilgiler olduğunu unutmayın, bu yüzden hepsini bir tane tuzla alın.

Birincisi "ölçeklenebilirlik ve güvenilirlik" ( kaynak ). K20, bir küme sistemine oturacak ve 7/24 tam eğimde çalışacak şekilde tasarlanmıştır. Titan, oyun oynamak için daha fazla tasarlanmıştır, bu nedenle bu görev döngüsünde çalışacaktır, ancak bu şekilde kullanılırsa uzun süreli ömür sorunları yaşayabilir.

Sürücüler de farklı, ancak büyük farklardan emin değilim. Kartların tasarımına odaklanan fark, muhtemelen bu cephedeki Tesla kartları için nispeten küçük performans kazançlarına yol açıyor.

"Tesla'ya özgü bazı özellikler şunları içerir:

  • InfiniBand performansı için NVIDIA GPUDirect RDMA
  • MPI için Hyper-Q (CUDA Akışları için Hyper-Q, GeForce GTX TITAN'da desteklenir)
  • Tüm dahili ve harici kayıtlar ve anılar için ECC koruması
  • GPU ve küme yönetimi için Bright Computing, Ganglia gibi desteklenen araçlar. "( Kaynak )

Bu, ana farkın ölçeklenebilirlikleri olduğu gerçeğine işaret ediyor. Ofisinizde bir masaüstünde koşmak istiyorsanız, fiyat farkı için K20 üzerinde bir Titan'a karşı tartışmak zor olurdu. Birden fazla K20'nin ekstra performansına ihtiyacınız varsa, kendinize bir HPC merkezi bulun ve sunucularıyla zaman kazanın.

Düzenle:

ECC'ye biraz daha baktıktan sonra, bu cevabı Titan'da değil K20'de olmanın etkilerini göstermek için güncelliyoruz. Aşağıdaki bilgiler burada bulunan bilgilerin bir ifadesidir .

ECC, DRAM üzerinde hata denetimi yapar ve GPU'ya kaydolur. Yumuşak hatalar, biraz yanlış aktarıldığında / saklandığında ortaya çıkar. Devreler ne kadar hızlı ve yakınsa, yumuşak bir hatanın olasılığı da o kadar yüksek olur. Bir çift bağlantılı ODE veya bir doğrusal sistem çözüyorsanız, tek bir sayının bir bit kapalı olması sonuçları yeniden üretilemez bir şekilde önemli ölçüde değiştirebilir. CPU'daki standart RAM ve önbelleklerin çoğu, ECC kullanılarak bu hatalar için hata kontrolünden geçirilir.

Öte yandan GPU'lar, bellek veriyolları CPU'ndakilerden çok daha hızlı olmasına rağmen genel olarak ECC'ye sahip değildir. Bunun nedeni, ekrandaki bir pikselin bir kare için biraz kapalı olması durumunda, programın kalitesinin düşmemesidir. Bu hatalar da orantılı değildir. Bu nedenle, bu özellik atlanarak çok fazla chip emlak (ve maliyet) kaydedilebilir. Bu ekstra karmaşıklık, Tesla hattının ekstra maliyetinin büyük bir kısmına neden olabilir.


3
Harika cevap +1! Bu özelliklerin bu kadar pahalı olduğuna inanmak zor. Bağlantılı Nvidia sitesinden "GeForce ile geliştirin, Tesla ile konuşlandırın" satırı önemli konuları özetliyor. Şimdilik en iyi çözüm, birkaç GeForces satın almak ve konuşmak için mavi dumandan vazgeçene kadar onları zorlamak gibi görünüyor.
Ophion

3
"Ancak bu, Oakridge'de kullanılmalarını engellemedi." OLCF'nin "Titan" adlı Cray XK7'si GTX Titan'ı değil Tesla K20 GPU'ları kullanıyor. NVidia, GTX Titan'ın bir ekonomi otomobilinin Formula-1 otomobilinin "teknolojisine" sahip olduğunu söylerken kullanılan aynı kelime dağarcığı olan "OLCF Titan" teknolojisine sahip olduğunu söylüyor. (GTX Titan performansı oldukça iyi, ancak ECC'si yok ve bildiğim büyük kurulumlarda kullanılmıyor.)
Jed Brown

1
Benim hatam, makaleyi yanlış yorumladım. Yanıltıcı olmamak için cevabı güncelleyeceğim.
Godric Seer

2

Kanımca, fark çoğunlukla pazar segmentasyonu gibi görünüyor. Eğer bir bilim insanıysanız, NVidia, K20X ile kullanılabilen RAM'i düzeltmek için çok fazla hata yapmadan bir GPGPU kullandığınız için kağıdınızın reddedileceğinden korkmanızı istiyor. Benzer şekilde bir şirket iseniz, hesaplamalarınızın mümkün olduğunca hata düzeltilmemesi şüphesiyle dava açılma olasılığınız düşükse, 4x ödemek isteyebilirsiniz. Bireysel oyuncular veya hobisi olan GPGPU'lara Titan satılıyor çünkü daha az paraları var ve bu yollarla ikna etmek daha zor.


2
Sadece ECC ile hesaplamalar yaptım, ECC olmayan sistemlerin ve mantıksal kesme noktalarının başarısızlıklarını gösteren iyi bir makaleniz var mı?
Ophion


BenC'nin mükemmel bağlantısının yönetici özetini isteyenler için: ECC'nin düzelteceği yumuşak hatalar son derece nadirdir ve kağıt, daha yüksek hız için Tesla'daki ECC'yi kapatmayı öneren kadar ileri gider. Uyarı: Bu aslında tüketici GPU'larıyla test edilmedi.
yarı ekstrinsik

0

Gerçekten çalıştırdığınız uygulamaya bağlıdır. GPUGRID.net ECC'si olmayan makinelerde çalışır ve her şey yolundadır. Sonuçlar diğer platformlarda olduğu kadar iyidir. Acellera ayrıca GeForce kartlarıyla donanım satıyor ve çok az durumda GPU'lar başarısız oldu. GeForce ihtiyacınız olan her şey.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.