Ana sorun, sıralama algoritmalarının (1) çok fazla esnekliğe ihtiyaç duyması ve (2) yine de donanım kullanarak hızlandırmanın çok zor olacağıdır.
Bir şey, sıralama algoritmalarının zaten işlemcinin bellek bant genişliğini aşacak kadar hızlı olmasıdır - işlemci, zamanın büyük bir bölümünü, verilerin ana belleğe ileri ve geri gitmesini bekleyerek harcayacaktır. Donanım hızlandırmalı bir sıralama yardımcı işlemcisi veya özel bir sıralama talimatı aynı soruna sahip olacaktır.
Bu bellek bant genişliğinin ele alınış şekli, daha iyi "yerellik" e sahip daha iyi algoritmalar ve veri yapıları kullanmaktır ve bu alanda, özellikle "önbellek kayıtsız algoritmalar" ile ilgili hala önemli çalışmalar yapılmaktadır (çalıştıkları anlamdan habersizdirler) önbellek ayrıntılarına bakılmaksızın, "önbellek farkında" algoritmalar belirli bir önbellek sayfası boyutu vb. için ayarlanır).
Aksine, medya uygulamaları (ses ve grafikler, özellikle 3D grafikler) bazı çok tekrar eden yapılardan yararlanır - elbette esneklik vardır, ancak büyük ve çok iyi yapılandırılmış bir temel üzerine inşa edilmiştir. Bu, grafik hızlandırmanın Blitting (yapılandırılabilir ancak yine de çok yapılandırılmış bir blok kopyalama işlemi) ve çizgi / çokgen çizimi gibi şeylerle basit başlamasına izin verdi. Grafikler ve ses işleme daha karmaşık hale geldikçe, vektör işlemleri optimizasyon için bariz bir hedef haline geldi - önce MMX (tamsayı vektörleri) sonra SSE (şamandıra vektörleri). Eski sabit işlevli 3D grafik boru hattı 3D grafik donanımına taşındığında bir 3D grafik motorunun nasıl çalıştığı konusunda oldukça iyi tanımlanmış bir yapı olduğu anlamına geliyordu.
Yine de 3D grafikler ile, bir zamanlar donanımda yapılanlar şimdi esneklik için yazılımda yapılır - gölgelendiriciler yazılımdır, örneğin, farklı malzemelerin görünümünü veren çok çeşitli farklı gölgelendiriciler elde ederiz. Ancak, bu yazılım hala genel yazılımdan çok daha yapılandırılmış bir şekilde çalışır ve bu nedenle yine de çok daha özel bir donanım platformu kullanabilir. Bu nedenle grafik kartınız artık fizikten şifreleri kırmaya kadar - aynı modele uyan uygulamalar ve modern grafik işlemcilerin sağladığı talimat setleri kullanılarak verimli bir şekilde uygulanabilen uygulamalar için her şeyi hızlandırabilir.
Grafik işlemcileri artık dijital sinyal işlemcilerinin manevi veya gerçek torunlarıdır ve dijital sinyallerle (örneğin ses) uğraşmak için bir tür özel işlemcidir (ve muhtemelen hala).
Hangi nihai noktaya yol açar - sıralama algoritmaları olabilir donanım hızlandırılabilir. Verilerinize bağlı olarak, işlemciniz MMX veya SSE (tek komutlu çoklu veri) talimatları kullanılarak işlenebilir, ancak bellek bant genişliği sorunu nedeniyle büyük olasılıkla fazla bir şey yoktur - belki biraz daha güç tasarruflu olabilirsiniz yine de bu şekilde. Ancak, grafik donanımınızı da kullanabilirsiniz. Bu şekilde, grafik kartları için genellikle çok daha iyi bellek bant genişliğinden yararlanabilirsiniz. Her türlü bu şekilde değiştiremezsiniz, ancak kesinlikle mümkün ve muhtemelen uygun olduğunda yapılır.
IOW çeşitli ekonomik ve pratik konulardan dolayı, sıralama gibi nispeten dar bir görevi hızlandırmak için özel olarak donanım tasarlamak gerçekten mantıklı değil. Daha geniş bir görev yelpazesini hızlandıran veya mevcut hızlandırma donanımını daha geniş bir görev yelpazesine uygulanabilir kılan bir özellik genellikle çok daha mantıklıdır.