Diyelim ki http://www.nersc.gov/users/computational-systems/edison/configuration üzerinde 100k çekirdek üzerinde 4 saat boyunca süper bilgisayar hesaplaması yapıyorum , ağ üzerinden yaklaşık 4 PB veri alışverişi yapıyorum ve yaklaşık 4 TB I / Ö. Hesaplamanın tümü tamsayıdır, bu nedenle sonuçlar doğru veya yanlıştır (ara sayısal hata yok).
Kodun doğru olduğunu varsayarsak, bir donanım arızası nedeniyle hesaplamanın yanlış olma olasılığını tahmin etmek isterim. Bunun için iyi bir yol nedir? Böyle bir tahminde bulunmak için gereken sayılar için iyi kaynaklar var mı?