GPU'yu yüksek sıcaklıklarda çalıştırmanın kart için kötü olduğu kanıtlanabilir mi?


11

Grafik kartınızı 80 ° C ile 90 ° C (176 ° F ve 194 ° F) arasında sürekli çalıştırırsanız, ekran kartı gerçekten kötüdür? Yani kartın ömrünü kısaltır mı? Bu kanıtlanabilir mi? Yoksa sadece varsayımlar mı?

GPU'lar için güvenlik kapatmasının normalde 90 ° C (194 ° F) olduğunu anlıyorum.


'Güvenlik kapatması', sıcaklığın nerede ölçüldüğüne ve devrenin hangi proses ve maksimum sıcaklıkla tasarlandığına bağlıdır. Bir süre önce, belirli bir nesil Intel CPU'ların maksimum nominal sıcaklığı 110 ° C olduğunu hatırlıyorum, bu da bazı donanım meraklılarını endişelendirdi çünkü cipslerin kendilerini yok edeceğini düşündüler. Spoiler: Etmediler.
Joren Vaes

1
Bence bu soru, bu diğer soru ile yoğun bir şekilde ic-ürün-yaşam boyu-kavşak-sıcaklık-fonksiyonu ile ilgilidir . Bu sorunun sonucu, oda sıcaklığının her 15 ° C üzerindeki bir IC'nin yaşam beklentisini yarıya indirmesidir. Bu nedenle, 80 ° C ile karşılaştırıldığında 90 ° C'de bir grafik kartı kullanmak ömrünü ~% 37 oranında azaltacaktır (bu nedenle yaşam beklentisi 80 ° C ile 8 yıl ise, bunun yerine 90 ° C ile ~ 5 yıl)
Harry Svensson

1
Arhennius Yasası% 50 daha düşük MTBF / 10'C artışına daha yakın, ancak dielektrikler için 1000 saat @ 85 saat veya 105 saat gibi çok daha düşük bir MTBF ile başladıkları dikkate alınacak başka faktörler var, bu yüzden 105'C dereceli kapaklar kullandıklarından veya daha iyi.
Tony Stewart Sunnyskyguy EE75

Yanıtlar:


21

Başarısızlık mekanizmalarını inceleyelim ve ısıdan nasıl etkilendiklerini görelim. Bir arıza mekanizmasının sıcaklıkla daha hızlı gerçekleşmesi nedeniyle, GPU'nun daha hızlı başarısız olmayacağını hatırlamak çok önemlidir! Oda sıcaklığında 100 yıl süren bir alt bileşen sıcaksa sadece 20 yıl sürüyorsa, ancak başka bir alt bileşen başlamak için sadece 1 yıl sürüyorsa (ancak ısıdan etkilenmiyorsa), ürününüzün ömrü neredeyse değişmeyecektir. sıcaklık.

Uzmanlığım olmadığı için Simeon'un bahsettiği bisiklet konusunu görmezden geleceğim.

Pano seviyesinde, kafa ile 'kırılacak' bir ana bileşen düşünebilirim: Elektrolitik kapasitörler. Bu kapasitörler kurur ve ısı uygulandığında daha hızlı kurudukları iyi anlaşılır. (tantal kapasitörler de daha kısa bir ömre sahip olma eğilimindedir, ancak bunun ısı ile nasıl değiştiğini bilmiyorum).

Peki ya silikon?

Burada, anladığım kadarıyla, başarısızlığa neden olabilecek birkaç şey var. Burada en önemlilerinden biri elektromigrasyon. Bir devrede, metal parçalarından geçen elektronlar aslında fiziksel olarak atomlar etrafında hareket edecektir. Bu o kadar kötüye gidebilir ki, iletkenlerde boşluklara neden olur ve bu da arızaya neden olabilir.

Bu görüntü iyi bir örnek verir (Tatiana Kozlova, Henny W. Zandbergen; Ni nanobridjlarda elektromigrasyonun yerinde TEM gözlemi):

resim açıklamasını buraya girin

Bu işlem sıcaklıkla birlikte katlanarak artar ve bu nedenle sıcaklık daha yüksekse ve elektromigrasyon ana arıza nedeniyse çip daha az zaman alacaktır.

Anter mekanizması, devrenin içinde transistörlerin geçit delip geçeceği oksit bozulmasıdır. Bu aynı zamanda sıcaklığa da bağlıdır. Ancak, voltajın burada çok daha büyük bir etkisi vardır.

Ayrıca katkı maddelerinin kayması veya sıcak taşıyıcı enjeksiyonundan dolayı VT kayması da vardır. Dopant kayması sıcaklıkla artar (ancak bu çok yavaş bir süreç olduğu için dijital devrelerle ilgili bir sorun olması pek olası değildir). Sıcak taşıyıcı enjeksiyonunun sıcaklığa bağlılığından emin değilim, ama yine de voltajın burada çok daha önemli bir faktör olduğunu düşünüyorum.

Ama sonra önemli bir soru var: Bu, ömrünü ne kadar azaltır? Bunu bilerek, grafik kartınızın her zaman serin kaldığından emin misiniz? Tasarım aşamasında bir hata yapılmadıkça tahminim hayır. Devreler bu en kötü durum göz önünde bulundurularak tasarlanır ve üreticinin nominal kullanım ömrü sınırlarına zorlandıklarında hayatta kalacakları şekilde yapılır. İnsanların overclock devreleri durumunda: Devreyi sabit tutmak için sıklıkla kullandıkları voltajdaki artış (devreleri biraz hızlandırabileceğinden) sıcaklığın kendisinden çok daha fazla zarar verecektir. Ek olarak, voltajdaki bu artış, akımda bir artışa yol açacak ve bu da elektromigrasyon sorunlarını önemli ölçüde hızlandıracaktır.


2
Bunlar harika görüntüler, elektro göçün fiziksel olarak nasıl görüneceğini hep merak ettim.
Cursorkeys

9

Evet , ısının elektrikli bileşenleri bozduğu kanıtlanmıştır . Metaller ısındığında genişler, lehim (elektrik devresi bağlantıları için kullanılır) bir metal alaşımıdır, bu nedenle ısıtıldığında genişler. Sürekli ısıtma ve soğutma, eklemlerin sürekli genişlemesine ve büzülmesine neden olarak çatlamaya ve nihayetinde eklemin bozulmasına neden olabilir.

                                                      Arıza oranı ve Sıcaklık grafiği

Yukarıdaki grafik Arrhenius'Law'ın ısıdaki artış ve yarı iletken arızası arasında nasıl bir korelasyon verdiğini göstermektedir . Bu makale ısının elektronik bileşenler üzerindeki etkilerini detaylandırmaktadır. Bilgi alanımın biraz dışında olan elektron düzeyindeki şeylerle daha fazla ilgilenir


1
Genişletme ve daralma dediğin için bisikletin kötü olduğuna inanabilirim, ancak yüksek yükte ve dolayısıyla her zaman yüksek sıcaklıkta koşmada bir sorun var mı?
Colin

Ben bir IC tasarımcısıyım, bu yüzden tahta seviyesi arıza modları hakkında çok az bilgim var, ancak her zaman bir şeyleri tamir ederken (hobi olarak) genişleme döngüsü nedeniyle henüz bir başarısızlığa rastlamadım, bu yüzden ne kadar önemli olduğunu sorgulamalıyım diğer mekanizmalarla karşılaştırılır.
Joren Vaes

1
@Colin "her zaman yüksek yük" diye bir şey yoktur; GPU'nuzda sadece bitcoin madenciliği yapmadığınız sürece, diğerlerinden daha fazla yükün olduğu saniyeler olacaktır. Soğutmanın GPU'larda oldukça güçlü olması gerektiğinden, bu zaten belirtilen sorunlara yol açar. Bakınız: XBox ölüm çemberi.
Marcus Müller

@ MarcusMüller kesinlikle var. Ve yükün kesinlikle sabit olmaması önemli değil. Bisiklet sürmek için delta temp önemlidir. Tasarlanan sıcaklıklar içinde% 95-100 yükte (yani hesaplama) zamanın% 99'unu çalıştıran bir kart, varsayımsal çevrim hasarına çok daha az duyarlı olacaktır, aynı kart% 0 ile% 100 arasında çılgınca% 50 arasında salınmaktadır. if (yani oyunlar).
Dan M.

6

Bir yarı iletkenin birleşme sıcaklığındaki artış ile MTBF'nin (Arıza Arasındaki Ortalama Süre) azalması arasındaki ilişki iyi anlaşılmıştır.

Micron'un bu teknik notu bundan bahsediyor

Uygulamada, bağlantı sıcaklığı ~ 125˚C'ye yaklaştığında ve aşıldığında arıza oranı katlanarak artar, bu nedenle bu sıcaklığın çok altında çalıştırıyorsanız, küçük artışlar o kadar kritik olmayabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.