«simd» etiketlenmiş sorular

12
Tensorflow'u SSE4.2 ve AVX talimatları ile nasıl derleyebilirim?
Bu, Tensorflow'un çalışıp çalışmadığını kontrol etmek için bir komut dosyası çalıştırıldığında alınan mesajdır: I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcublas.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcudnn.so.5 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcufft.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcuda.so.1 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA …


8
64 bit tam sayıdaki paketlenmiş 8 bit tam sayıları paralel olarak 1, donanım SIMD'siz SWAR çıkarma
Ben 8 elementli paketlenmiş 8 bitlik tamsayılar dizisi olarak yorumladığım 64 bitlik bir tamsayı varsa. Ben 1başka bir elemanın sonucunu etkileyen bir eleman sonucu olmadan taşma işlerken her paketli tamsayı sabit çıkarmak gerekir . Şu anda bu kodu var ve çalışıyor ama paralel olarak her paketlenmiş 8-bit tamsayı çıkarma yapar …
77 c++  c  bit-manipulation  simd  swar 

1
Std yapmak için modern yaklaşım :: vektör hizalanmış bellek ayırmak
Aşağıdaki soru cevaplar eski ancak, ilgili ve kullanıcı gelen açıklama edilir Marc Glisse yeterince ele olabilir bu soruna 17 C ++ yana yeni yaklaşımlar olduğunu öne sürüldü. Hala tüm verilere erişirken, SIMD için düzgün çalışan hizalanmış bellek almaya çalışıyorum. Intel'de, kayan bir tür vektörü oluşturur ve boyutumu __m2568 kat azaltırsam, …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.