Windows'da R için GPU Hızlandırılmış Veri İşleme


11

Şu anda veri analizi için R'yi yoğun olarak kullanan Big Data hakkında bir makale alıyorum. Oyun nedenleriyle bilgisayarımda bir GTX1070 var. Bu yüzden, öğretmenlerimin bana yaptıkları bazı şeylerin işlenmesini hızlandırmak için bunu kullanabilmemin gerçekten harika olacağını düşündüm, ancak bunu yapmak hiç de kolay görünmüyor. GpuR, CUDA, Rtools ve birkaç diğer bit ve bobs yükledim ve örneğin genomik ifade verilerinden gpuMatrix nesneleri oluşturmak için alabilirim, ancak henüz her ikisi de gpuMatrix nesneleri ile çalışan bir işlev bulmadım ve ayrıca performansta gözle görülür bir fark sağlar. Belki de bu sadece gpuR paketinin doğasında var olan sınırlamalarla ilgilidir - diğer bazı paketler, daha çok aradığım şey gibi görünecek işlevlere sahip olmaktan bahsediyor gibi görünüyor,

Bu paketlerin neredeyse tamamı yalnızca Linux içindir, Windows için R için GPU desteği uygulamak özellikle zor mu? Yoksa Windows'ta bunu yapmak için bu kadar az paket bulunmasının başka bir nedeni var mı? Bir anlamda merak ediyorum, ama gerçekten işe yaraması da çok güzel olurdu. Windows için çok az kullanılabilirlik beni şaşırtıyor, genellikle tam tersi.


1
Windows'da GPU bilgi işlemin programlama dilinden bağımsız olarak zor olduğunu gördüm. Araçların Linux veya OS X'te geliştirilme eğilimi vardır. Örneğin, Linux Mint Cinnamon (şu anda en sevdiğim dağıtımım, çünkü her şey işe yarıyor) ile çift önyükleme sistemini deneyebilirsiniz.
Adrian Keister

Yanıtlar:


4

Deneyimlerime göre, R için GPU işlemeyi ayarlamak zor, bir Windows makinesinde kurmak daha da zor. Ek olarak, GPU işleme yalnızca çok özel hesaplama türleri için kullanılabilir.

GPU işlemeyi sadece bunun için ayarlamak istiyorsanız, cevabım oldukça işe yaramaz.

Ancak sisteminizin ve kodunuzun genel performans optimizasyonunu önemsiyorsanız, aşağıdaki adımları kontrol etmenizi öneririz:

  • Makinenizde otomatik olarak çok çekirdekli işlemeye olanak tanıdığı için Base R yerine Microsoft R Open kullanın.

  • Kodunuzu vektörleştirin

  • Veri çerçeveleri yerine data.table gibi kütüphaneleri kullanın

  • Nesneleri büyütmekten kaçının

Genel olarak, R'nin performansı büyük ölçüde kod kalitenize bağlıdır. Neler yapabileceğiniz ve yapmanız gerekenlere dair çok iyi bir özet, Patrick Burns tarafından R Inferno'da verilmiştir.


Yorum için teşekkürler. cevabı buna göre değiştirdim.
jd1338

O zaman yorumum artık kullanışlı değil.
42-
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.