Modern işlemcilerin, üretim hatalarını telafi etmek için mantık birimlerinde yedeklilik var mı?


10

Modern işlemciler milyarlarca transistörden oluşur ve yeni üretim teknolojileri en azından ilk aylarda verim ile ilgili problemlere sahiptir, ancak sanırım yıllar sonra bile her zaman hatalı çipler olacaktır.

Büyük bloklarda (örneğin önbellek) sadece bazı bölümlerini devre dışı bırakma ve kullanılabilir bellek miktarını azaltma olasılığı olduğunu biliyorum (böylece en azından çipi atmak yerine daha düşük bir fiyata satabilirsiniz). Fakat mantık birimleri için benzer bir şey var mı? Dispetching için birden fazla ALU olduğunu biliyorum, ancak bu bir üretim hatası varsa bunlardan birini devre dışı bırakmak için bir şey mi? Yoksa ek yedek ALU'lar var mı? Çünkü benim için fabların mantık parçalarında hatalı bir transistörün olduğu her çipi attığına inanmak zorken, tam bir ALU'yu devre dışı bırakmak elde edilebilir işleme gücünü önemli ölçüde azaltacaktır.


Sadece tahminim. Silikon gofret üretiminin fiyatı büyük miktarlarda nispeten düşüktür ve kasaya yerleştirilmeden önce test edebilirsiniz, böylece nispeten düşük arıza oranına sahip tam yongalar üretebilirsiniz. > Fiyatın% 50'si saf pazarlamadır. Ayrıca, aynı aile içindeki birçok işlemci varyasyonunun aynı topolojide yapıldığını ve sadece bazı kapalı özelliklerde / çekirdeklerde / önbelleklerde (yazdığınız gibi) farklı olduğunu düşünüyorum, bu nedenle üreticinin bile düşük üretim hatası oranını korumak için büyük bir boşluğu var. hasarlı birimler. Ama diyelim ki, aynı çekirdek için birkaç ayrılmış ALU'ya sahip olduklarından şüpheliyim.
siklon125

Bunun en bilinen örneği, devre dışı bir FPU ile DX ile aynı kalıp olan Intel 486SX idi. Ama bunun modern halinin ne olduğunu duymak isterim.
pjc50

Şüpheliyim. Çağdaş işlemciler hızında düşük seviyeli yedekliliğe izin vermek için gereken mantık ve tasarım süresi buna değmez. Blok düzeyinde (çekirdek, fpu, önbellek) artıklık veya sadece blok devre dışı bırakma, verimi önemli ölçüde artırmak için fazlasıyla yeterli olacaktır. Ve mevcut işlemci fiyatları ve gofret boyutlarında% 5'lik bir verim bile karlı olabilir.
Edgar Brown

Yani, bir ALU kullanılabilir olmadığında, çekirdeği devre dışı bırakırlar. Evet, bir ihtimal olabilir. Buradaki birinin gerçekten bilmesini umuyordum.
jusaca

1
Evet, çekirdeği devre dışı bırakırlar. "Binning" denilen bir uygulamadır.
DKNguyen

Yanıtlar:


3

Diğerlerinin söylediği gibi, bir çekirdek içinde yedek ALU mantığını görmek zordur.

Üretimi optimize etmek için bir çekirdek tasarlanmıştır. Yedekli bir ALU için herhangi bir ek mantık performansı etkileyecek ve artan alan tüm çekirdeği yavaşlatacaktır. Teknoloji geliştikçe silikon küçüldü ve çekirdekleri daha hızlı hale getirdi, ancak esasen aynı fikri mülkiyeti kullandı. Neden üretim çekirdeklerinin üretim verimini arttırması için yer olduğu zaman yedek ALU'lar var?

2011 yılında Intel, 16 aktif ve 16 yedekli en az 32 çekirdek için patent başvurusunda bulundu. Patent başarısız olan çekirdekler, yedek bir çekirdeğin içeri girmesine izin veren daha yüksek sıcaklıklara sahip olacaktır.

Görevlerin gerektirdiği şekilde yüksek güçlü ve düşük güçlü çekirdeklere sahip olabilirsiniz. Veya daha yüksek sıcaklık seviyeleri tarafından algılanan kötü bir çekirdeği kapatın. Isıyı azaltmak için göbekleri dama tahtası şeklinde çalıştırın.

Intel Patent: Çok Çekirdekli İşlemcinin Güvenilirliğini Artırma


Bu çok mantıklı geliyor, bir çekirdek içindeki yedek silikon alanların sahip olabileceği performans etkisini düşünmedim. Tüm çekirdeklerin devre dışı bırakılması, diğer cevapların da ima ettiği gibi, gidilecek yol gibi görünüyor.
jusaca

5

Mantıkta değil.

Ancak büyük anılar (SRAM) varsa, 'artıklık' olan bir bellek kullanmak yaygındır. Bunlar, genellikle birkaç satır veya sütun olmak üzere bir alanın yerini alacak şekilde programlanabilen özel mantığa sahiptir.

Test sırasında arızalı alan algılanır ve ardından arızalı bellek, arızalı yerlerin yerini alacak şekilde programlanır.

Ancak bu 'değiştirme', OTP (Bir Kerelik Programlanabilir) bitler veya değerini tutan başka bir bellek kullanılarak ayarlanmalıdır. Bu nedenle, bu bellekler sadece böyle bir 'kalıcı bellek' özelliğine sahip yongalarda kullanılır veya bu tür bir programlama özelliğinin de eklenmesi gerekir;


Bu OTP bitlerinin bir sigortayı veya bir şeyi yakmak gibi elektronik olarak programlandığını mı düşünüyorsunuz, yoksa büyük üreticiler doğrudan lazer kırparak kalıp üzerine gitmek zorunda mı?
jusaca

1
OTP, elektronik olarak programlanabilen (EEPROM gibi ancak daha sonra kalıcı olarak) çip üzerindeki sigortalardır. Son kullanıcılar bunları seri numaraları, Ethernet adresi, şifreleme anahtarları vb. İçin de yakabilir
Oldfart

4

Bu, basit MCU'lar veya tipik tek çekirdekli işlemciler için kesinlikle geçerli değildir. Yedek bloklara sahip olmanın bedeli buna değmez ve bu işlemciler en son gravür işlemlerini kullanmazlar ve büyük silikon alanlara ihtiyaç duymazlar, bu nedenle verim yeterince iyidir.

Bununla birlikte, silikon alanının oldukça büyük olduğu ve daha yüksek kusur oranlarına yol açabilecek daha ince gravür işlemleri kullanan bazı çok çekirdekli işlemciler için yapılır. Bu işlemcilerde, kusurlu olduklarında tüm çekirdekler devre dışı bırakılabilir (bunlar oldukça büyük mantık bloklarıdır, ALU'dan çok daha fazlasını içerir). İşlemci daha sonra alt uç modeli olarak satılmaktadır.

Kaynak: /skeptics/15704/are-low-spec-computer-parts-just-faulty-high-spec-computer-parts


3

Kesinlikle sorunuza cevap veremem. Etkinleştirilebilen veya etkinleştirilemeyen çok ince taneli bir "özellik seti" haline geldiğinden ve olası tüm özelliklerin Kartezyen ürünü, olası CPU modellerinin sayısız olmasını sağlayacağından, 1 çekirdekten daha küçük birimleri devre dışı bırakmak pek mantıklı değildir. Orada bir sürü işlemci modellerinin, zaten kesinlikle daha onlara değil yardım 10-100 kez olacak yapma!

Başka bir yönü, milyarlarca transistörün (çoğunlukla) önbellek yapımında kullanılması ve arızalı transistörler için üreticiler, kalıp önbelleklerinin bir kısmı devre dışı bırakılmış CPU'ları kesinlikle satmaktadır (örneğin bkz. AMD Thorton ve AMD Barton).

Ama sana güvendiğim bir kişiden duyduğum bir fıkra anlatabilirim. Uzun zaman önce meraklı bir hız aşırtmacıydım. Benim günlerimde, tercih edilen overclock yapılabilen CPU AMD Athlon Thoroughbred idi:

Athlon Safkan

Özel soğutma çözümlerini monte ederken, soğutucu doğrudan takılırken, doğrudan kalıba bastırırken çok dikkatli olmak zorundaydı . Düzensiz basınç uyguladıysanız, önce bir köşeye kuvvet uyguladıysanız, kalıplar köşelerde kolayca çatlamaktan dolayı kötüydü.

Bu kişi tam olarak aynı şeyi yapmıştı, bir köşenin önemli bir kısmı gitmişti, ancak CPU, çok düşük bellek performansında da olsa mucizevi bir şekilde iyi çalışıyordu. Köşede sadece L2 önbellek vardı, bu yüzden bu bölüm gittiğinde, önbellek protokolü bir şekilde şimdi çok kusurlu kalıp üzerinde çalışıyordu. Muhtemelen bu bölümdeki tüm sorgular için önbellek kayıplarını bildiriyordu, bu yüzden CPU sadece L1 önbelleğine (veya L2'nin sadece bir kısmına) indirildi, bu yüzden çoğu testte çok daha yavaştı, ancak sıkı döngülerde neredeyse aynı performansa sahipti.

Düşünce aynı hat olarak, olabilir bir ALU kusurlu ve bir şekilde geri o işi reddettiğini sinyal verebilen eğer CPU o yapılabilir olabilir diğer ALU taraftaki geri düşen yeteneğine sahip. Bunun CPU üreticileri tarafından yapılıp yapılmadığı bilinmiyor (ve bundan şüpheliyim), ancak önbellek örneği (15 yıl öncesinden) kesinlikle yapılabilir olduğunu gösteriyor.


Bu kesinlikle çok etkileyici ve hatta bir tür dinamik süreç gibi görünüyor, çünkü sistem hatalı çip parçasını kendi başına tespit etti. Soruyu sorduğumda, üretim hattındaki bir test sistemi göz önünde bulundurularak daha fazla tespit edindim. Ama bu hikaye kesinlikle ilginç;)
jusaca
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.