Dağıtılmış sistemlerde hataların ele alınmasına ilişkin hangi belgeleri öneriyorsunuz?
Dağıtılmış sistemlerde hataların ele alınmasına ilişkin hangi belgeleri öneriyorsunuz?
Yanıtlar:
2010'da Tushar D. Chandra, Vassos Hadzilacos ve Edsger W. Dijkstra Ödülü'nü Sam Toueg kazanan eserlere bir göz atmak isteyebilirsiniz :
Bu makaleler, dağıtılmış bir sistemdeki arıza dedektörleri kavramını genel ve kesin bir çerçevede ortaya koymaktadır . Sezgisel olarak, fikir birliğini çözmek için gereken asgari miktarda başarısızlık bilgisini incelemeye çalıştılar. Anlaşmayı çözmek için mükemmel bir arıza dedektörüne ihtiyacınız olmadığı ortaya çıkıyor. Bazı asgari koşulları karşılayan güvenilmez arıza dedektörleri bile görev için yeterli olacaktır. Bu makaleler dağıtılmış sistemlerde başarısızlıklarla nasıl başa çıkılacağı konusunda çok etkili olmuştur.
Sistemde ne tür arızalar? Bizans hatalarını ele almak için çözümler mi yoksa sadece klasik arıza durdurma modeli mi arıyorsunuz? Dağıtılmış bir sistemde Bizans düğümlerinin varlığında çözümler daha ilginç bir sorundur. Sorun Leslie Lamport (Bizans Generalleri sorunu ') tarafından resmileştirildi ve 1999'da Barbara Liskov ve Miguel Castro'nun makalesi en yakın çalışma pratik çözümü' Pratik Bizans hata toleransı'nı sunuyor. Fred Schneider'in makine yaklaşımı ve görünüm damgalı çoğaltma Sorunun çok genel olduğunu, alanın çok büyük olduğunu ve teori bugün çevrimiçi çalışan çoğu sistemin temelini oluşturduğunu kabul ediyorum.Belki daha spesifik bir hata modeli ve sorun alanı elde etmeye yardımcı olabilir daha iyi cevaplar
Dağıtılmış sistemlerde taşıma hatalarını ele almak için bir desen koleksiyonu:
Alternatif olarak, daha genel bir çalışma için, Rachid Guerraoui ve Luis Rodrigues'in Güvenilir Dağıtılmış Programlamaya Giriş kitabı , birçoklarının başarısızlık kurtarma varyantları da dahil olmak üzere çok çeşitli pratik algoritmalara sahiptir. Nancy Lynch'in daha klasik metin Dağıtılmış Algoritmaları daha teorik bir bakış açısıyla benzer bir zemini kapsıyor.