Bir CPU'nun tek bir küçük resimde milyarlarca transistör olduğunu bildiğimiz gibi, transistörlerden biri kırılırsa ne olur?
CPU'nun herhangi bir otomatik kurtarma mekanizması var mı?
Bir CPU'nun tek bir küçük resimde milyarlarca transistör olduğunu bildiğimiz gibi, transistörlerden biri kırılırsa ne olur?
CPU'nun herhangi bir otomatik kurtarma mekanizması var mı?
Yanıtlar:
Çok basit, satmadan ve kötü olanları atmadan önce onları test ediyoruz.
Bunu yapmanın birçok yolu vardır - farklı insanlar farklı bir şey yaparlar, genellikle aşağıdakilerin bir kombinasyonunu kullanırlar:
bazı testler yeterince hızlı olduklarından emin olmak için hızlıdır.
diğer testler, çipteki parmak arası terliklerin bir kısmını veya tamamını dev seri kaydırma kayıtlarına dönüştüren bir mod içerir, bilinen verileri bu zincirlere saatlendiririz, ardından çipi bir saat boyunca çalıştırırız ve ardından yeni sonuçları geri tarar ve eşleşip eşleşmediklerini kontrol ederiz. tahmin edilen sonuçlarımız - otomatik test araçları, çip üzerindeki her rastgele kapıyı veya transistörü test edecek minimum "tarama vektörleri" setini oluşturur - diğer vektörler ram bloklarının özel testlerini yapar,
diğerleri harici kabloların doğru bağlandığını test eder
sağlıksız miktarda akım çekmediğinden emin oluruz
Test süresi paraya mal oluyor, bazen kötü olanları atmak için paketlenmeden önce bariz ölü cipsler için bazı basit testler yapıyoruz ve daha sonra paketleme yapıldıktan sonra daha fazla test yapıyoruz
Başkalarının söylediklerini biraz genişletmek için: Doğrulama var ve bundan sonra cipslerin sınıflandırılması var.
CPU'lardaki transistörler sorunlarını daha yüksek frekanslarda gösterme eğilimindedir, bu nedenle bir CPU yapmak ve daha sonra birkaç farklı ürün olarak pazarlamak yaygındır. Ucuz CPU'lar aslında pahalı CPU'nun hasarlı versiyonlarıdır. Başka bir seçenek CPU'nun belirli bölümlerini devre dışı bırakmaktır. Örneğin AMD, BArton çekirdeği ile işlemciler yaptı. Ayrıca Thorton çekirdekli işlemciler sattı. Thorton yeni bir çekirdek değildi. Bunun yerine, L2 önbelleğinin yarısı arızalı ve devre dışı bırakıldı. Bu şekilde AMD, aksi takdirde boşa harcanacak CPU'larda biraz iyileşme sağladı.
Aynı şey AMD'nin 3 temel işlemcisinde de oldu. Başlangıçta 4 çekirdek işlemciydi, ancak çekirdeklerden birinin kusurlu olduğu belirlendi, bu yüzden devre dışı bırakıldı.
Sorunuzun cevabı "Hayır". Şu anda donanım arızaları için otomatik kurtarma yöntemi yoktur.
Üreticiler, gofretlerinden mümkün olan en iyi verimi (dolar) elde etmek için süreçlerini tasarlarlar. Transistörleri daraltarak, daha az alana daha fazla işlevsellik sığdırabilirler. Bu, gofret başına daha fazla yonga (aynı işlevselliğe sahip) olarak düşünülebilir. Çip boyutu küçüldükçe, onlardan daha fazlasını bir gofretten çıkarabilirsiniz, ancak küçüldükçe daha fazla kötüleşir. Üreticiler bunu kabul eder ve sürekli olarak fişleri küçültmek için teknoloji zarfını zorlarlar. Onlara zarfın kenarında olduklarını söyleyen şey kötü çiplerdir.
Bir şirket, özellik boyutunu eski özellik boyutunun% 70'ine çekebilirse, bir gofret üzerindeki yonga sayısının yaklaşık 2 katını alabilir. Eski süreçte verimleri% 95 (bir gofrette 100 üzerinden 95 iyi cips cipsi) ve yeni süreçte verimleri% 75 ise (bir gofrette 200 üzerinden 150 iyi cips) yeni süreç.
Küçük düğümlerde, SRAM gibi belleğiniz yoksa her "transistör" 2 kapıdır. Biri işe yaramazsa, sadece yavaş bir sürücünüz var. SRAM için, eğer geçmezse, sadece satır "darbe". Transistör üzerindeki FET'lerin her ikisi de başarısız olursa, çok pahalı bir kum parçanız olur, ancak şahsen hiç olmadı. Modern FinFET'ler çok küçüktür, litografi ve olasılığın doğası nedeniyle bir dizi üretim problemi (esas olarak güçlükler) vardır. Yeni süreçlerdeki ilk şeylerin FPGA'lar olduğunu göreceksiniz çünkü kötü hücreleri "patlatabilir" ve yönlendirme grafiğini değiştirebilirsiniz. Sana sayıları veremem, ama x86 dünyasının nasıl bir şey yaptığını tahmin edebilirsin, işler nadiren mükemmel gider.
İşte bir XOR hücresinin düzenini gösteren bir örnek:
Sol / sağ yeşil çubuklar kanatçıklar ve kırmızı poli. Maviler 1. seviyede renkli metaldir.
Ticari CPU'ların bir otomatik keşif mekanizması yoktur, ancak akademide ve özel uygulama CPU'larında yüzen şeyler vardır. Kötü kapılar nedeniyle ortaya çıkan saat sorunlarını çözmek için asenkron mimarileri kullanan bazı özel bileşenler yaptım, ancak bir deliğin oksitinin sadece bir yavaş transistör aldığınız sıcak bir taşıyıcı olarak imha edilmesi.
Görünüşe göre zamanlar değişti. Bu sorudaki beş yaşındaki cevapların çoğu artık sanat durumunu yansıtmıyor ve bazıları o zaman doğru değildi.
Transistörler ve silikon üzerindeki diğer cihazlar, IC'nin aşırı ısınmaması koşuluyla üretimden sonra oldukça kararlıdır.
İşte şimdi hataları en aza indirmek için modern bir IC üretim sürecinde yapılanlar:
İşlemcinin resmi spesifikasyonundaki programlama hatalarının belirli bir transistörün arızalarından daha olasıdır.
Ortak CPU'ların bir otomatik keşif yeteneği gibi bir şeyleri olmasa da , kendi kendini sıfırlayan CPU'lar üzerinde kozmik ışınlara karşı bir önlem olarak da çalışmalar yapılmıştır . Kozmik ışınlar bir CPU veya RAM'de bit döndürmeye neden olacak kadar enerji yayabilir.
Yorumlarda belirtildiği gibi, kritik görev sistemleri, uzun süredir doğrulama için birden fazla CPU'ya güvenmiştir. Uzay mekiği, 1976 yılında geri , bir örnek olarak, aynı programı koştu ve güvenliğini sağlamak için tüm uçuş kontrol kararları üzerinde "oy" dördü beş bilgisayarları kullandı.
Modern işlemci transistörlerinin çoğu FET'lerdir. Bunlar, aşırı yüklenmeye başlarken kaynak / drenaj direnci kazanma avantajına sahiptir. Bu, yüksek güçlü MOSFET'lerin birçoğunu paralel koyarak yapılmasına izin veren bir faktördür. Yük otomatik olarak dağıtılır. Bu, sorunları dağıtmaya yardımcı olan bir faktör olabilir. Ama bence bundan daha basit.
Çoğu elektronik parçada olduğu gibi, bunları spec içinde sürerseniz, bir süre dayanırlar. Mikroişlemci yapıldığında, maliyet için iki faktör vardır. Sadece silikon üzerindeki boşluk ve karmaşıklık nedeniyle gerçek verim. Üretim sonrası tüm talaşlar çalışmaz. Ancak, bir kez yapıldıktan ve doğrulamayı yapıştırdıktan sonra, transistörlerin iyi olduğunu bilirsiniz. Spesifikasyonlar dahilinde kullanılırsa, iyi kalma ihtimalleri vardır.
Aynı çipin neden bazen farklı hızlarda satıldığını merak ettiniz mi? Ve bazen aynı GPU yonga mimarisinin farklı sayıda iç ünite ile satıldığını fark ettiniz mi?
Bir donanım arızasını silikon seviyesinde düzeltmenin bir yolu yoktur, ancak zamanla tasarımcılar verimi artırma problemiyle başa çıkmayı öğrendiler . Öngörü olmadan, verim yalnızca üretim kalitesine bağlıdır. Ancak, zekiyseniz, bazı kötü yongaları kurtarabilirsiniz.
Örneğin, az çok bağımsız çalışan 18 çekirdekli bir çip tasarımınız olduğunu varsayalım. Test sırasında mükemmel talaşları sıralar ve A18 modeli olarak serbest bırakırsınız. Çoğu başarısız çipin sadece bir hatası vardır, bu nedenle hatalı çekirdek devre dışı kaldığı sürece iyi çalışırlar. Bunları A17 modeli olarak biraz daha düşük bir fiyata satıyorsunuz ve iki kötü çekirdeğe sahip olanlar A16 modeli olarak daha düşük bir fiyata satılıyor.
Aynı şey bir çipin hız değeri için de geçerlidir. Mükemmel üretilen yongalar, tasarım spesifikasyonunun ötesindeki hızlarda çalışabilir, ancak sorunlu yongalar olmayabilir. Bunlar daha düşük hızlarda satılmaktadır.
Bu yöntem, toplam verimi önemli ölçüde artıracaktır ve bu nedenle oldukça yaygın olarak görülmektedir. Örneğin, PlayStation 3'ün donanımında 8 SPE birimi vardır, ancak verim sorunlarını hesaba katmak için biri devre dışı bırakılır.
CPU'nun herhangi bir otomatik kurtarma mekanizması var mı?
Yukarıda açıklandığı gibi hayır. Ancak, önbellekleri, özellikle L2 ve L3, içinde ekstra RAM olabilir. Parça fabrikada test edildiğinde, bozuk RAM blokları çıkarılabilir ve ekstra RAM blokları kullanılabilir.
Genel olarak hayır, kötü transistörleri yonga ekranından kapatırsınız ve bundan sonra nispeten küçük bir kayıp yüzdesi beklersiniz. Çip işi onlarca yıldır bu işi yönetmek için çok sayıda hile var (ve evet, bazen hilelerden biri sadece kötü parçaların dışarı çıkmasına ve ücretsiz olarak değiştirilmesine veya müşterilerin mutsuz olmasına izin vermektir).
Radyasyonla sertleştirilmiş ortamlar (boşluk) için muhtemelen üç oylama kullanırsınız, her "bit" in aslında bir tane yapmak için oy veren üç biti vardır. bit ayarını belirlemek sadece üçte iki oy alır. bu yüzden diğer üçüncüsündeki transistörler kötüleşebilir ve sonunda toplam dozda olacaktır. ancak asıl endişe, tek bir olayı üzmek. Bu çipler ve sistemler bu ortamlar için yukarıdan aşağıya, silikon, donanım, yazılım vb.
COTS'un zaman zaman hıçkırması ve başarısız olması bekleniyor.
Bir mucize gibi görünebilir, ancak transistör arızalarının miktarını azaltmak için kullanılan bir dizi mekanizma vardır. Bununla birlikte, transistörün yaşadığı arıza tipine ve nerede olduğuna bağlı olarak, CPU bazen belirli koşullar altında hala kullanılabilir olabilir veya olmayabilir.
Şu anda, genellikle otomatik kurtarma mekanizması yerleşik değildir, ancak bu sorunu en aza indirgemek için yeniden yapılandırılabilir bilgi işlem, artıklık ve diğer teknikler hakkında çok fazla araştırma vardır.