Hızlı Fourier Dönüşümünün Ölçeklenebilirliği (FFT)


12

Hızlı Fourier Dönüşümü'nü (FFT), örneğin PDE çözücülerle bağlantılı olarak, düzgün örneklenmiş veriler üzerinde kullanmak için, FFT'nin bir ) algoritması olduğu iyi bilinmektedir . N (yani çok büyük) için paralel işlendiğinde FFT ölçeği ne kadar iyi ?O(nlog(n)n


1
Biraz kafam karıştı. Veri noktası sayısı arttıkça yürütme süresinin sabit sayıda işlemci için nasıl ölçeklendiğinden, sayı veya işlemciler arttıkça yürütme süresinin sabit sayıda veri noktası için nasıl ölçeklendiğinden veya yürütme süresinin bir veri noktası sayısı arttıkça işlemci başına veri noktalarının sabit oranı?
Geoff Oxberry

Hem zayıf hem de güçlü ölçeklendirme.
Allan P. Engsig-Karup

Yanıtlar:


8

Bu, kanıtlanmış kanıtlardan daha anekdot niteliğindeki kanıtlardır, ancak FFTW gibi mevcut FFT uygulamalarının ölçeklendirme yetenekleri için bir sınırları olduğu görülmektedir.

kO(107)

Ancak buradaki eve götürme mesajı, FFT'nin ölçeklendirilmesi gerektiğidir; bununla birlikte, bazen bir algoritmanın performansının teorik olarak değerlendirilmesinden gerçek bir HPC platformundaki pratik uygulamasına geçildiğinde beklenmedik sınırlamalar ve etkileşimler ortaya çıkabilir.



5

ndd

Google Akademik'te "paralel FFT" veya "psödospektral ölçeklenebilirlik" araması, değerlendirmek için kalifiye olmadığım çok sayıda bilgi sağlar. Ancak bu, pratikte nelerin gerçekleştirilebileceğine dair son zamanlarda güzel bir örnek gibi görünüyor:

Sıvı türbülansı için ölçeklenebilir paralel psödospektral hesaplamalar için hibrit bir MPI-OpenMP şeması

Öz:

Dağıtılmış bellek paralelliğinde MPI ve paylaşılan bellek paralelliğinde OpenMP kullanan hibrit bir şema sunulmuştur. Çalışma, ortaya çıkan petascale, yüksek çekirdek sayısı, büyük ölçüde paralel işleme sistemleri üzerinde akışkan türbülansının psödospektral hesaplamalarında olağanüstü yüksek Reynolds sayıları elde etme arzusuyla motive edilir. Hibrit uygulama, iyi test edilmiş ölçeklenebilir MPI-paralelleştirilmiş psödospektral koddan türetilir ve bu kodu arttırır. Melez paradigma, psödospektral ızgaraların alan ayrışması için yeni bir resme yol açar; bu, diğer şeylerin yanı sıra, sayısal takdir yetkileri. Hibrit uygulamanın detayları verilmiştir, ve performans testleri yöntemin faydasını göstermektedir. Hibrid şemanın, maksimum ortalama verimliliği% 83 olan ~ 20000 işlem çekirdeğine kadar ideal ölçeklenebilirliğe ulaştığı gösterilmiştir. İki farklı platformda kod performansını optimize etmek için optimum sayıda MPI işlemi ve OpenMP iş parçacığının nasıl seçileceğini gösteren veriler sunulmaktadır.


1

O(n)

O(logn)

O(n)


1
FFT'de önemli miktarda iletişim vardır, ancak sonucu tek bir düğümde toplamak kesinlikle gerekli değildir (veya arzu edilir). FFT'nin çok yaygın bir kullanımı, türbülansın doğrudan sayısal simülasyonundadır, burada simülasyonun geri kalanı Fourier uzayında gerçekleştirilirken, gerçek uzayda doğrusal olmayan konveksiyon terimini uygulamak için kullanılır. Bu kesinlikle sonucun serileştirilmesini gerektirmez. Genel olarak paralel hesaplamada, "büyük" veriler her zaman dağıtılmış biçimde saklanmalı ve analiz edilmelidir.
Jed Brown
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.