Daha yeni işlemciler neden aynı saat hızında daha hızlı?


38

Örneğin, neden 2.66 GHz'lik bir çift çekirdekli Core i5, aynı zamanda çift çekirdekli olan 2.66 GHz Çekirdekli 2 Duo'dan daha hızlı olsun?

Bu, bilgiyi daha az saat döngüsünde işleyebilecek yeni talimatlar nedeniyle midir? Başka hangi mimari değişiklikler var?

Bu soru sıklıkla ortaya çıkıyor ve cevaplar genellikle aynı. Bu yazı, bu soru için kesin, kanonik bir cevap vermek içindir. Ek bilgi eklemek için cevapları düzenlemek için çekinmeyin.



Hem atılımlar hem de David'in harika cevapları vay… Hangisini doğru seçeceğimi bilmiyorum: P
agz

Ayrıca daha iyi komut seti ve daha fazla kayıt. örneğin, MMX (şimdiye kadar çok eski) ve x86_64 (AMD x86_64'ü icat ettiğinde 64 bit modundayken bazı uyumluluk artırma geliştirmeleri eklediler.
ctrl-alt-delor

X86 mimarisinin gerçek büyük iyileştirmeleri için, yeni bir komut seti gereklidir, ancak bu yapılsaydı, artık bir x86 olmazdı. Bir PowerPC, mips, Alpha,… veya ARM olurdu.
ctrl-alt-delor

Yanıtlar:


30

Genellikle yeni talimatlar yüzünden değil. Bunun nedeni, işlemcinin aynı talimatları uygulamak için daha az talimat döngüsü gerektirmesidir. Bu, birçok nedenden dolayı olabilir:

  1. Büyük önbellek, hafıza için daha az zaman harcanması demektir.

  2. Daha fazla yürütme birimi, bir talimat üzerinde çalışmaya başlamak için bekleyen daha az zaman demektir.

  3. Daha iyi dal kestirimi, hiçbir zaman yürütülmemesi gereken spesifik olarak talimatların yerine getirilmesiyle daha az zaman harcanması demektir.

  4. Yürütme birimi iyileştirmeleri, talimatların tamamlanmasını bekleyen daha az zaman demektir.

  5. Daha kısa boru hatları, boru hatları daha hızlı doluyor demektir.

Ve bunun gibi.


Core mimarisinin 14-15 aşamalı bir boru hattına ( ref ) ve Nehalem / Sandy Bridge'de kabaca 14-17 aşamalı bir boru hattına ( ref ) sahip olduğuna inanıyorum .
Atılım

Daha kısa boru hatlarının dolması kolaydır ve boru hattı basmalarının cezalarını azaltır. Daha uzun boru hatları genellikle daha yüksek saat hızlarına izin verir.
David Schwartz

Demek istediğim, boru hattı derinliğinin kendisinin aynı kaldığını veya arttığını düşünüyorum . Ayrıca Intel 64 ve IA-32 SW Dev El Kitaplarında , bir boru hattı değişikliğinin son sözü Vol. 1, Ch. 2.2.3 / 2.2.4 (Intel Core / Atom mikro mimarileri).
Çıkış

2
Saat hızlarını arttırma çabası, daha uzun boru hatlarına neden oldu. NetBurst döneminin sonuna doğru saçma sapan (en fazla 31 aşama!). Bugünlerde, her iki yönde de avantaj ve dezavantajları olan hassas bir mühendislik kararı.
David Schwartz

ayrıca şube tahmin iyileştirmeleri, talimat yeniden düzenleme / optimizasyon / mux birim iyileştirmeleri, minyatürleştirme (azaltılmış ısı) ve kalıp tasarımı (iyileştirilmiş tek kalıp yolları / devreleri, vb.), ...
Shaun Wilson

40

Yüksek performans sunmak için bir işlemci tasarlamak, sadece saat oranını arttırmaktan çok daha fazlasıdır. Moore yasaları ile mümkün kılınan ve modern işlemcilerin tasarımına aracı olan performansı arttırmanın başka yolları da var.

Saat oranları süresiz olarak artamaz.

  • İlk bakışta, bir işlemcinin daha yüksek saat hızlarında elde edilen performans artışları ile birbiri ardına bir talimat akışı yürütmesi görünebilir. Ancak, yalnızca saat hızını artırmak yeterli değildir. Saat tüketimi arttıkça güç tüketimi ve ısı çıkışı artar.

  • Çok yüksek saat hızlarıyla, CPU çekirdek voltajında önemli bir artış gerekli hale gelir. TDP, V çekirdeğinin karesiyle arttığından , sonunda aşırı güç tüketimi, ısı çıkışı ve soğutma gereksinimlerinin saat hızında daha fazla artışları önlediği bir noktaya ulaşıyoruz. Bu sınıra 2004 yılında, Pentium 4 Prescott günlerinde ulaşılmıştır . Güç verimliliğindeki son gelişmeler yardımcı olsa da, saat hızında önemli artışlar artık mümkün değil. Bakınız: İşlemci üreticileri neden işlemcilerin saat hızını yükseltmeyi bıraktı?

Stoktaki saat grafikleri, yılların en yeni meraklısı bilgisayarlarında hızlanıyor.
Stoktaki saat grafikleri, yılların en yeni meraklısı bilgisayarlarında hızlanıyor. Görüntü kaynağı

  • Moore yasası sayesinde , entegre bir devrede bulunan transistörlerin sayısının her 18 ila 24 ayda bir, özellikle de kalıp büzüşmelerinin iki katına çıktığını belirten bir gözlem , performansı artıran çeşitli teknikler uygulanmıştır. Bu teknikler yıllar içinde rafine edilmiş ve iyileştirilmiş olup, belirli bir süre boyunca daha fazla talimatın alınmasını sağlamıştır. Bu teknikler aşağıda tartışılmaktadır.

Görünüşte sıralı talimat akışları genellikle paralelleştirilebilir.

  • Her ne kadar bir program birbiri ardına çalıştırmak için bir dizi talimattan oluşabilse de, bu talimatlar veya bunların parçaları aynı anda çok sık olarak gerçekleştirilebilir. Buna öğretim düzeyinde paralellik (ILP) denir . ILP'yi kullanmak yüksek performans elde etmek için hayati öneme sahiptir ve modern işlemciler bunu yapmak için sayısız teknik kullanırlar.

Boru hatları, talimatları paralel olarak gerçekleştirilebilecek daha küçük parçalara böler.

  • Her bir talimat, her biri işlemcinin ayrı bir parçası tarafından yürütülen bir dizi aşamaya bölünebilir. Talimat boru hattı , her talimatın tamamen bitmesini beklemek zorunda kalmadan bu adımların birbiri ardına adım atmasını sağlar. Boru hattı, daha yüksek saat hızları sağlar: her saat döngüsünde her komutun bir adımının tamamlanmasıyla, her döngü için tüm talimatların bir kerede tamamlanmış olması gerekenden daha az zamana ihtiyaç duyulur.

  • Klasik RISC boru hattı komut getirme, talimat kod çözme, talimat yürütme, bellek erişimi ve geri yazma: Beş aşamadan içerir. Modern işlemciler, daha fazla aşamada daha derin bir boru hattı oluşturarak (ve her aşama daha küçük ve tamamlanması daha az zaman aldığı için ulaşılabilir saat hızlarının arttırılması) yürütmeyi daha fazla aşamaya ayırıyor, ancak bu model, boru hattının nasıl çalıştığının temel bir anlayışını sağlamalıdır.

Beş aşamalı komut hattının diyagramı
Görüntü kaynağı

Ancak, boru hattı programın doğru şekilde yürütülmesini sağlamak için çözülmesi gereken tehlikelere neden olabilir.

  • Her bir talimatın farklı bölümleri aynı anda yürütüldüğünden, doğru yürütmeyi engelleyen çatışmalar olabilir. Bunlara tehlike denir . Üç tür tehlike vardır: veri, yapısal ve kontrol.

  • Talimatlar aynı verileri aynı anda veya yanlış sırada okuyup değiştirdiğinde, potansiyel olarak yanlış sonuçlara yol açan veri tehlikeleri ortaya çıkar. Yapısal tehlikeler , birden fazla komutun işlemcinin belirli bir bölümünü aynı anda kullanması gerektiğinde ortaya çıkar. Koşullu bir dal talimatı ile karşılaşıldığında kontrol tehlikeleri ortaya çıkar.

  • Bu tehlikeler çeşitli şekillerde çözülebilir. En basit çözüm, doğru sonuçları elde etmek için boru hattındaki bir ya da talimatın uygulanmasını geçici olarak bekleterek boru hattını basitçe durdurmaktır. Bu, mümkün olduğu kadar önlenir, çünkü performansı düşürür. Veri tehlikeleri için, işlemsel iletme gibi teknikler duraklamaları azaltmak için kullanılır. Kontrol tehlikeleri, özel işlem gerektiren ve bir sonraki bölümde ele alınan dal tahmini ile ele alınmaktadır .

Şube tahmini, tüm boru hattını bozabilecek kontrol tehlikelerini çözmek için kullanılır.

  • Koşullu bir dalla karşılaşıldığında ortaya çıkan kontrol tehlikeleri özellikle ciddidir. Şubeler, belirli bir koşulun doğru veya yanlış olup olmadığına bağlı olarak, uygulama akışında talimat akışındaki bir sonraki komut yerine, programın başka bir yerinde devam etme olasılığını ortaya koymaktadır.

  • Bir sonraki çalıştırma talimatı, dal durumu değerlendirilinceye kadar belirlenemediğinden, yokluğunda bir dalın ardından boru hattına herhangi bir talimat eklenemez. Bu nedenle, boru hattı boşaltılır ( temizlenir ); bu, boru hattında olduğu kadar neredeyse saat döngüsünü boşa harcar. Dallar programlarda çok sık meydana gelme eğilimindedir, bu nedenle kontrol tehlikeleri işlemci performansını ciddi şekilde etkileyebilir.

  • Şube tahmini , şubenin alınıp alınmayacağını tahmin ederek bu sorunu giderir. Bunu yapmanın en basit yolu, dalların daima alındığını veya alınmadığını varsaymaktır. Bununla birlikte, modern işlemciler daha yüksek tahmin doğruluğu için çok daha karmaşık teknikler kullanır. Temel olarak, işlemci önceki dalları takip eder ve bu bilgiyi bir sonraki çalıştırma talimatını tahmin etmek için çeşitli şekillerde kullanır. Ardından boru hattı, tahmine dayalı doğru konumdaki talimatlarla beslenebilir.

  • Elbette, tahmin yanlışsa, branşın bırakılmasından sonra boru hattından ne gibi talimatlar getirildiyse boru hattının temizlenmesi. Sonuç olarak, boru hattının uzadığı ve uzadığı için, dal kestiricisinin doğruluğu giderek daha kritik hale gelmektedir. Özel branş tahmin teknikleri bu cevabın kapsamı dışındadır.

Önbellek hafıza erişimini hızlandırmak için kullanılır.

  • Modern işlemciler talimatları ve işlem verilerini ana bellekte erişilebilenden çok daha hızlı gerçekleştirebilirler. İşlemcinin RAM'e erişmesi gerektiğinde, veriler mevcut oluncaya kadar yürütme uzun süre boyunca durur. Bu etkiyi azaltmak için, önbellek adı verilen küçük yüksek hızlı bellek alanları işlemciye dahil edilir.

  • İşlemci kalıbında mevcut sınırlı alan nedeniyle, önbellekler çok sınırlı boyuttadır. Bu sınırlı kapasiteden en iyi şekilde yararlanmak için, önbellekler yalnızca en son veya sık erişilen verileri ( geçici konum ) depolar . Hafıza erişimleri belirli alanlarda ( mekansal konum ) kümelenme eğiliminde olduğundan , yakın zamanda erişilenlere yakın veri blokları da önbellekte saklanır. Bakınız: Referansın yeri

  • Ayrıca, daha büyük önbelleklerin daha küçük önbelleklerden daha yavaş olma eğiliminde olması nedeniyle, performansı en iyi duruma getirmek için önbellekler de çeşitli boyutlarda düzenlenir. Örneğin, bir işlemci yalnızca 32 KB boyutunda bir seviye 1 (L1) önbelleğe sahip olabilirken, seviye 3 (L3) ön belleği birkaç megabayt büyük olabilir. Önbelleğin boyutu ve işlemcinin tam önbellekteki verilerin değiştirilmesini nasıl yönettiğini etkileyen önbelleğin birliği , bir önbellekten elde edilen performans kazançlarını önemli ölçüde etkiler.

Sıra dışı çalıştırma, önce bağımsız talimatların uygulanmasına izin vererek tehlikelerden kaynaklanan tezgahları azaltır.

  • Bir komut akışındaki her komut birbirine bağlı değildir. Örneğin, her ne kadar a + b = cdaha önce yürütülmelidir c + d = e, a + b = cve d + e = fbağımsızdır ve aynı anda uygulanabilir.

  • Sıra dışı çalıştırma, bir talimat dururken diğer, bağımsız talimatların yürütülmesine izin vermek için bu gerçeğin avantajlarından yararlanır. Birbiri ardına adım adım yürütmek için talimatlar istemek yerine,bağımsız talimatların herhangi bir sırada yürütülmesine izin vermek için zamanlama donanımı eklenir. Talimatlar edilir sevk bir kullanım kuyruğuna ve verilen gerekli veri kullanılabilir işlemcinin uygun bir parçasına. Bu şekilde, daha önceki bir talimattaki verileri beklemekte olan talimatlar daha sonra bağımsız olan talimatları birleştirmez.

Sipariş dışı infaz şeması
Görüntü kaynağı

  • Sıra dışı yürütmeyi gerçekleştirmek için birkaç yeni ve genişletilmiş veri yapısı gerekir. Yukarıda belirtilen talimat kuyruğu, rezervasyon istasyonu , yürütme için gerekli olan veri mevcut olana kadar talimatları tutmak için kullanılır. Yeniden sipariş tamponu (ROB) talimatları doğru sırayla tamamlanmış böylece, alındıkları sıraya göre, devam eden talimatların durumunu izlemek için kullanılır. Bir kayıt dosyası kendisi için gerekli olan mimari ile sağlanan register sayısı ötesinde kayıt yeniden adlandırma nedeniyle mimarisi tarafından sağlanan kayıtları sınırlı sayıda paylaşmak için ihtiyaca bağlı hale gelmesini aksi bağımsız talimatları önlemeye yardımcı olur.

Superscalar mimarileri, bir komut akışı içinde birden fazla komutun aynı anda yürütülmesine izin verir.

  • Yukarıda tartışılan teknikler sadece talimat boru hattının performansını arttırır. Bu teknikler tek başına saat döngüsü başına birden fazla komutun tamamlanmasına izin vermez. Bununla birlikte, bir talimat akışında bireysel komutları birbirine bağlı olmadıklarında (yukarıdaki sıra dışı çalıştırma bölümünde tartışıldığı gibi) paralel olarak yürütmek çoğu zaman mümkündür.

  • Superscalar mimarileri , talimatların bir kerede birden fazla işlevsel birime gönderilmesine izin vererek bu talimat düzeyinde paralellikten yararlanır. İşlemci, talimatların eşzamanlı olarak gönderilebileceği belirli bir tipte (ALU'lar gibi) birden fazla fonksiyonel birime ve / veya farklı tipte işlevsel birimlere (kayan nokta ve tamsayı birimler gibi) sahip olabilir.

  • Süper ölçekli bir işlemcide, talimatlar sıra dışı bir tasarımda olduğu gibi planlanır, ancak şimdi aynı anda farklı talimatların verilmesini ve uygulanmasını sağlayan birden fazla sayıdaki bağlantı noktası vardır . Genişletilmiş talimat kod çözme devresi, işlemcinin her saat döngüsünde bir seferde birkaç talimat okumasını ve bunlar arasındaki ilişkileri belirlemesini sağlar. Modern bir yüksek performanslı işlemci, her bir talimatın ne yaptığına bağlı olarak, saat döngüsü başına sekiz adede kadar talimat zamanlayabilir. İşlemcilerin saat döngüsü başına çoklu talimatları nasıl tamamlayabilecekleri budur. Bakınız: AnandTech'teki Haswell yürütme motoru

Haswell yürütme motorunun şeması
Görüntü kaynağı

  • Bununla birlikte, süperskalar mimarileri tasarlamak ve optimize etmek çok zordur. Talimatlar arasındaki bağımlılıkları kontrol etmek, eşzamanlı talimat sayısı arttıkça boyutu katlanarak ölçeklenebilen çok karmaşık bir mantık gerektirir. Ayrıca, uygulamaya bağlı olarak, her komut akışında aynı anda gerçekleştirilebilecek sınırlı sayıda talimat vardır, bu nedenle ILP'nin daha büyük avantajlarından faydalanma çabaları azalan getirilerden muzdariptir.

Daha az zamanda karmaşık işlemleri gerçekleştiren daha gelişmiş talimatlar eklenir.

  • Transistör bütçeleri arttıkça, karmaşık işlemlerin, aksi takdirde harcayacakları zamanın bir kısmında gerçekleştirilmesine izin veren daha gelişmiş talimatlar uygulamak mümkün hale gelir. Örnekler , aynı anda birden fazla veri parçası üzerinde hesaplamalar yapan SSE ve AVX gibi vektör komut kümelerini ve veri şifreleme ve şifre çözme işlemlerini hızlandıran AES komut kümesini içerir.

  • Bu karmaşık işlemleri gerçekleştirmek için modern işlemciler mikro işlemleri (μops) kullanır . Karmaşık talimatlar, özel bir tamponun içinde depolanan ve ayrı ayrı yürütülmesi planlanan μop dizilerine dönüştürülür (veri bağımlılıklarının izin verdiği ölçüde). Bu, ILP'den yararlanmak için işlemciye daha fazla alan sağlar. Performansı daha da arttırmak için, yakın zamanda kodu çözülmüş μops'leri saklamak için özel bir cop önbellek kullanılabilir, böylece yakın zamanda yürütülen talimatlar için μops hızla aranabilir.

  • Ancak, bu talimatların eklenmesi performansı otomatik olarak arttırmaz. Yeni talimatlar ancak bunları kullanmak için bir uygulama yazıldığında performansı artırabilir. Bu talimatların benimsenmesi, onları kullanan uygulamaların, onları desteklemeyen eski işlemciler üzerinde çalışmayacağı gerçeği nedeniyle engellenmektedir.


Peki, bu teknikler zaman içinde işlemci performansını nasıl arttırıyor?

  • Boru hatları yıllar geçtikçe daha uzadı, bu da her aşamayı tamamlamak için gereken zaman miktarını azalttı ve böylece daha yüksek saat hızları sağladı. Bununla birlikte, diğer şeylerin yanı sıra, daha uzun boru hatları yanlış dal tahmini için cezayı artırır, bu nedenle boru hattı çok uzun olamaz. Çok yüksek saat hızlarına ulaşmaya çalışırken, Pentium 4 işlemci Prescott'ta 31 aşamaya kadar çok uzun boru hatları kullandı . Performans açıklarını azaltmak için , işlemci başarısız olsalar bile talimatları yerine getirmeye çalışacak ve başarılı olana kadar denemeye devam edecektir . Bu, çok yüksek güç tüketimine neden oldu ve hiper iş parçacıklığından elde edilen performansı düşürdü . Yeni işlemciler artık bu kadar uzun zamandır boru hatları kullanmıyor, özellikle saat hızı ölçeklendirmesi bir duvara ulaştığından;Haswell , 14 ila 19 aşama arasında değişen bir boru hattı kullanır ve düşük güç mimarileri daha kısa boru hatları kullanır (Intel Atom Silvermont'un 12 ila 14 aşaması vardır).

  • Şube tahmininin doğruluğu, daha gelişmiş mimarilerle gelişti, yanlış öngörüldüğünden kaynaklanan boru hattı boşaltma sıklığını azalttı ve aynı anda daha fazla talimatın uygulanmasına izin verdi. Bugünün işlemcilerinde boru hatlarının uzunluğu göz önüne alındığında, bu yüksek performansın sürdürülmesi için kritik öneme sahiptir.

  • Artan transistör bütçeleriyle, işlemciye daha büyük ve daha etkili önbellek gömülebilir, böylece bellek erişimi nedeniyle duraklamalar azalır. Bellek erişimleri, modern sistemlerde tamamlamak için 200'den fazla döngü gerektirebilir, bu nedenle ana belleğe erişme ihtiyacını mümkün olduğunca azaltmak önemlidir.

  • Daha yeni işlemciler, daha gelişmiş süperskalar yürütme mantığı ve eşzamanlı olarak daha fazla komutun kodunun çözülmesine ve yürütülmesine izin veren "daha geniş" tasarımları sayesinde ILP'den daha iyi yararlanabiliyor. Haswell mimarisi dört komut kodunu çözmek ve bir saat döngüsünde 8 mikro işlemleri gönderebilir. Transistör bütçelerinin arttırılması, tam sayı ALU gibi daha işlevsel birimlerin işlemci çekirdeğine dahil edilmesine izin verir. Rezervasyon istasyonu, yeniden sipariş tamponu ve kayıt dosyası gibi sıra dışı ve üst ölçek uygulamalarında kullanılan anahtar veri yapıları, işlemcinin ILP'lerinden yararlanmak için daha geniş bir talimat penceresi aramasını sağlayan yeni tasarımlarla genişletilir. Bu, günümüz işlemcilerinde performans artışlarının ardındaki ana itici güçtür.

  • Daha yeni işlemcilere daha karmaşık talimatlar dahil edilmiştir ve artan sayıda uygulama performansı arttırmak için bu talimatları kullanır. Derleyici teknolojisindeki gelişmeler, komut seçiminde iyileştirmeler ve otomatik vektörleştirme dahil , bu talimatların daha etkin kullanılmasını sağlar.

  • Yukarıdakilere ek olarak, daha önce kuzey köprüsü, bellek denetleyicisi ve PCIe şeritleri gibi CPU'ya harici parçaların daha fazla entegrasyonu, G / Ç ve bellek gecikmesini azaltır. Bu, diğer cihazlardan verilere erişimde yaşanan gecikmelerden kaynaklanan duraklamaları azaltarak verimi artırır.


6
Bu iyi bir blog yazısı yapabilir.
Mokubai

Enerji verimliliğindeki iyileştirmeler aynı zamanda güç duvarına verilen bir faktördür.
Paul A. Clayton

Artık saatin ne kadar hızlı olduğu değil, saat döngüsü başına kaç talimatın işlenebileceği ile ilgili. Bir işlemci, bellekten önbelleğe kadar 4x kadar veri işlemek için bant genişliğine sahipse, daha yavaş bir saati olsa bile, bu işlemci etkili bir şekilde 4x daha hızlıdır. İşte bu yüzden AMD, Intel'in ürün performansını eşleştirmeye çalışırken çok sorun
yaşıyor

18

Mutlak kesin referans Intel 64 ve IA-32 Mimarileri Yazılım Geliştirici El Kitapları'dır . Mimariler arasındaki değişiklikleri detaylandırıyorlar ve x86 mimarisini anlamak için harika bir kaynak.

1 - 3C arasındaki ciltleri indirmenizi tavsiye ederim (bu sayfadaki ilk indirme bağlantısı). Cilt 1 Bölüm 2.2 istediğiniz bilgilere sahiptir.


Çekirdek'den Nehalem / Sandy Bridge mikro mimarisine kadar geçen bölümde gördüğüm bazı genel farklılıklar:

  • Gelişmiş dal kestirimi, yanlış öngörüden daha hızlı iyileşme
  • HyperThreading Teknolojisi
  • Entegre bellek denetleyicisi, yeni önbellek araştırması
  • daha hızlı kayan nokta özel durum işleme (yalnızca Sandy Bridge)
  • LEA bant genişliği iyileştirme (yalnızca Sandy Bridge)
  • AVX komut uzantıları (yalnızca Sandy Bridge)

Listenin tamamı yukarıda verilen bağlantıda bulunabilir (Cilt 1, Bölüm 2.2).


0

Daha önce söylenen her şey doğrudur, ancak bir dereceye kadar. Cevabım kısa: Yeni nesil işlemciler "daha hızlı", çünkü daha büyük ve daha iyi organize önbelleklere sahipler . Bu bilgisayar performansındaki ana faktördür. Daha kantitatif düşünceler için, bkz. " Linux Magazine: HPC'de performansı artıran şey "

Kısacası, çoğu yaygın uygulama için (SPEC koleksiyonunda olduğu gibi), sınırlayıcı faktör hafızadır. Gerçek bir sürekli hesaplama çalışıyorsa, önbelleklerin tümü verilerle yüklenir, ancak her önbellek kaçağı CPU yürütme borusunun durmasına ve beklemesine neden olur. Sorun şu ki, CPU boru hattının ne kadar karmaşık olduğu farketmeksizin, veya daha iyi talimatlar olsa da, talimat seviyesi paralelliği hala oldukça sınırlıdır (bazı özel olarak optimize edilmiş önceden yerleştirilmiş durumlar hariç). Kritik bir bağımlılık bulunduğunda, tüm paralellik beş-on CPU saatinde sona ererken, yüzlerce CPU saati bir caheline çıkarmak ve ana bellekten yeni bir tane yüklemek zorunda kalıyor. Böylece işlemci hiçbir şey yapmadan bekler. Bu konsept, multicores için de geçerlidir.

Eğer biri "daha hızlı" bir bilgisayar istiyorsa, satın alabileceğiniz en büyük önbelleğe sahip bir CPU ile satın alın.


-1

Çünkü çok fazla lot talimatlarını geliştiriyorlar İşlemci Her Döngü Başına (saat) CPU'nun daha yüksek yürütme birimleri (hesaplama birimleri) dahil ederek yapabileceği bir şeydir. sıra dışı işlemler ve şube tahmini, daha sonra düşük gecikme süresiyle birlikte daha fazla önbellek ekleyin. Daha yüksek bant genişliği önbelleği. Şimdi ve tekrar yeni talimatlar ekleyin. Talimat Başına (CPI) İstenen Döngüleri Azaltın

Saat hızları, temel bir bileşen olan bir CPU'nun performansının sadece bir kısmıdır, ancak ne yazık ki, yöntem düğümleri son on yıl boyunca bir duvara çarpıyordu, hiçbir şey beş -5.2Ghz'den daha fazlasını alamazdı; kuru buz veya sıvı azot kullanmadan.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.