«performance» etiketlenmiş sorular

Algoritmaların, veri yapılarının, dillerin ve kütüphanelerin yürütme hızı ve bellek kullanımı hakkında sorular.

4
Çok fazla veriyle nasıl başa çıkılır?
Plazma dinamiği simülasyonlarımız genellikle çok fazla bilgi üretir. Simülasyonlar sırasında en az 10 özellik için (8192x1024x1024x1500) kadar büyük bir ızgaraya (x, y, z, t) çeşitli fiziksel özellikler kaydederiz. Bu bilgi simülasyon tamamlandıktan sonra işlenir. Onunla biz mülklerin filmlerini yapmak, Fourier analizi yapabilir, ortalama özellikleri hesaplar. Bu kadar basit bilgi dökümü, …


5
Sonlu elemanlar matrisleri için seyreklik yapısının hesaplanması
Soru: Sonlu elemanlar matrisinin seyreklik yapısını doğru ve verimli bir şekilde hesaplamak için hangi yöntemler mevcuttur? Bilgi: Ben Poisson Basınç Denklemi çözücü üzerinde çalışıyorum, Galerkin yöntemi kuadratik Lagrange temelli, C ile yazılmış ve seyrek matris depolama ve KSP rutinleri için PETSc kullanarak. PETSc'yi verimli bir şekilde kullanmak için, belleği global …

3
İşaretçi ile türetilmiş bir dizi kullanılırken fortran'da bellek kullanımı
Bu örnek programda aynı şeyi (en azından öyle düşünüyorum) iki farklı şekilde yapıyorum. Bunu Linux bilgisayarımda çalıştırıyorum ve üstte bellek kullanımını izliyorum. Gfortran kullanarak, birinci şekilde ("1" ve "2" arasında) kullanılan belleğin 8.2GB, ikinci şekilde ("2" ve "3" arasında) bellek kullanımının 3.0GB olduğunu düşünüyorum. Intel derleyici ile fark daha da …

4
Kütüphane fonksiyonları için FLOP sayımı
Basit bir fonksiyondaki FLOP sayısını değerlendirirken, genellikle temel aritmetik operatörleri ifade eden ifadeden aşağı inilebilir. Bununla birlikte, bölünmeyi bile içeren matematiksel ifadeler söz konusu olduğunda, bunu yapamaz ve sadece toplama ve çarpma ile fonksiyonlardan FLOP sayımları ile karşılaştırmayı bekleyebiliriz. İşlem bir kütüphanede uygulandığında durum daha da kötüdür. Bu nedenle, özel …

2
Python'da çok büyük ve seyrek bir bitişiklik matrisinin tüm özdeğerlerini hesaplamanın en hızlı yolu nedir?
Scipy.sparse.linalg.eigsh kullanmaktan çok büyük ve seyrek bir bitişiklik matrisinin tüm özdeğerlerini ve özvektörlerini hesaplamanın daha hızlı bir yolu olup olmadığını anlamaya çalışıyorum. matrisin simetri özellikleri. Bir bitişiklik matrisi de ikiliktir, bu da beni daha hızlı bir yol olduğunu düşündürüyor. Rastgele 1000x1000 seyrek bitişiklik matrisi oluşturdum ve x230 ubuntu 13.04 dizüstü …


3
Hangi uygulama örneklerinde, ek ön koşullandırma şemaları çarpımsal olanlardan daha üstündür?
Hem alan ayrışması (DD) hem de çoklu-ızgara (MG) yöntemlerinde, blok güncellemelerinin veya kaba düzeltmelerin uygulanmasını katkı veya çoklayıcı olarak oluşturabilir . Noktasal çözücüler için, Jacobi ve Gauss-Seidel iterasyonları arasındaki fark budur. için gibi çarpma özelliği daha yumuşak olarak uygulanır.Ax=bAx=bAx = bS(xold,b)=xnewS(xold,b)=xnewS(x^{old}, b) = x^{new} xi+1=Sn(Sn−1(...,S1(xi,b)...,b),b)xi+1=Sn(Sn−1(...,S1(xi,b)...,b),b) x_{i+1} = S_n(S_{n-1}( ..., S_1(x_i, …

2
Bilimsel kod performansının altında yatan yapı nedir?
Farklı donanım ve yazılım yapılandırmalarına sahip iki bilgisayarı düşünün. Her platformda aynı seri Navier-Stokes kodunu çalıştırırken, bilgisayar 1 ve 2 için bir yinelemenin gerçekleştirilmesi sırasıyla x ve y zaman alır. Bu durumda, , bilgisayar 1 ile bilgisayar 2 arasındaki yineleme zamanı farkıdır.Δ = x - yΔ=x-y\Delta = x-y büyüklüğünü etkileyen …

1
HPC'de yerel bellek / hesaplama, ağ gecikmesi ve bant genişliği titreşimi için istatistiksel modeller
Paralel hesaplama sıklıkla belirleyici bir yerel hesaplama oranı, gecikme yükü ve ağ bant genişliği kullanılarak modellenir. Gerçekte, bunlar mekânsal olarak değişken ve deterministik değildir. Skinner ve Kramer (2005) gibi çalışmalar çok modlu dağılımları gözlemlemektedir, ancak performans analizi her zaman deterministik veya Gauss dağılımlarını kullanmaktadır (sadece yanlış değil, negatif gecikme pozitif …


3
GPGPU hızlandırma için Nvidia K20X vs GeForce Titan
Ben özellikle DGEMM bileşeni için, akademik bilgi işlem için bu iki grafik kartı arasındaki farkı anlamaya çalışıyorum. Ham istatistiklere bakarsak, her ikisi de aynı GK110 yongasına sahip, neredeyse her kategoride karşılaştırılabilir istatistiklere sahip ve inanıyorum ki, aynı çekirdek mimariye sahip. Herhangi bir indirimden önce K20X bir Titan'ın maliyetinin yaklaşık 4 …


3
Kayan nokta işlemleri ve veri aktarımlarının mevcut ve gelecekteki enerji maliyetlerini modellemek için literatür referansları
CPU, bellek, ağ ve depolama üzerinden kayan nokta işlemlerinin ve veri aktarımlarının mevcut ve gelecekteki enerji maliyetlerini modellemek için en önemli literatür ve slayt referanslarını arıyorum. Bu soruyu topluluk wiki'si olarak işaretledim ve her yanıtı aşağıdaki biçimle sınırlamanızı tercih ederim: Başlık, Yazarlar, Yer / Konferans / Dergi, Yıl, DOI / …

3
Seyrek matris çarpımında ek yük nedir
Matris çarpımı (hem Mat * Mat hem de Mat * Vec) sıfır olmayan sayılarla veya matrisin boyutuyla ölçeklendiriliyor mu? Veya ikisinin bir kombinasyonu. Peki ya şekil. Örneğin, içinde 100 değeri olan bir 100 x 100 matrisi veya içinde 100 değeri olan bir 1000 x 1000 matrisi var. Bu matrisleri karelerken …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.