Ne yaparsanız yapın, bir hücresel otomat için bir sonraki durumu hesaplamak, otomatta hücreler olduğundan daha fazla hesaplama ister. Böylece sabit bir zaman elde etmek için, hücreler kadar bilgi işlem çekirdeğine ihtiyacınız vardır.
GPU'da bunların sayısı şu anda en az birkaç bin iken, bir sonraki durumun hesaplanması o kadar basittir ki, sonucun IO'ya bağlı olmasını bekliyorum, yani sadece gerekli zamana çok iyi bir şekilde veri hareketi gerekli (ve iyi bir yaklaşım değilse, ya uygulamanın verimsiz olması ya da mimarinin uygun olmaması, ancak bu çok şaşırtıcı olacaktır).
FPGA için soru daha zordur ve muhtemelen mevcut bellek ve hesaplama birimlerinin karışımına bağlı olacaktır. Çok uzak değilsem, tüm birimleri meşgul etmek için yeterli belleğiniz olmayacak ve harici belleğe güveniyorsanız, GPU ile aynı koltuğunuzda, bellek bant genişliği sınırlayıcı faktör olacak ve ben Sonuç GPU'ya göre bir avantaj olmadığı için şaşıracaksınız. (FPGA ile çalışırken, yıllar önce, şimdi doğru bir karışımla FPGA modelleri olabileceğini unutmayın).
ASIC daha fazla esneklik sunar. Kolayca sistolik gibi bir uygulamaya sahip olabilirsiniz (ancak çift yönlü veri akışı ile, bazı sistolik genellikle tek yönlü veri akışı ile sınırlıdır), her fiziksel hücre bir mantıksaldır: bir miktar bellek ve bir sonraki durumunu hesaplamak için gerekli mantık ve düzenlenir böylece fiziksel komşusu mantıklıdır. Belli ki sabit zaman dilimindesiniz. Hangi sert makrolara sahip olduğunuza bağlı olarak, biraz daha az belirgin olmak ve birkaç mantıksal olanı yeniden gruplayan fiziksel hücrelere sahip olmak daha iyi olabilir. Amaç, bir çipte yapılanı en üst düzeye çıkarmak, diğer bir deyişle, iletişim ihtiyaçlarınız hücre sayısıyla orantılı olduğu anda çipin dışıyla iletişimi en aza indirgemek, bant genişliği sınırlı olacaktır. Evet, bu, her adım için tüm hücrelere bakmanız gerektiğinde, muhtemelen GPU'dan çok daha iyi değilsin. (Tam özel, yalnızca daha iyi entegrasyon, yani yonga başına daha fazla hücre sağlar).
Özet: - tüm ara durumlara bakmak istiyorsanız, GPU en etkili yaklaşımdır - eğer yapmazsanız, daha iyi bir şey elde etmek için ASIC'yi haklı çıkarmak için hacme ihtiyacınız vardır, FPGA muhtemelen eğer yeterli avantaj sunmazsa herhangi biri.