Dağıtılmış sistemlerde arıza işleme kağıtları


10

Dağıtılmış sistemlerde hataların ele alınmasına ilişkin hangi belgeleri öneriyorsunuz?


2
Konuya aşina değilim, ama çok fazla yok mu? Ayrıca, ne için tavsiye?
Tsuyoshi Ito

5
Soru çok geniş görünüyor; Dağıtılmış hesaplamadaki tüm kağıtların yarısının bir şekilde hata toleransı ile ilgili olduğunu tahmin ediyorum .
Jukka Suomela

2
kesinlikle çok geniş. kapatmak için oy ...
Suresh Venkat

Belki de soru o kadar da kötü değil. Aşağıda bazı çalışmaları tavsiye etmeye çalıştım.
Dai Le

1
Bu bilgiyi başlangıçta motivasyon olarak dahil etseydiniz soru daha iyi olurdu.
Dave Clarke

Yanıtlar:


8

2010'da Tushar D. Chandra, Vassos Hadzilacos ve Edsger W. Dijkstra Ödülü'nü Sam Toueg kazanan eserlere bir göz atmak isteyebilirsiniz :

Bu makaleler, dağıtılmış bir sistemdeki arıza dedektörleri kavramını genel ve kesin bir çerçevede ortaya koymaktadır . Sezgisel olarak, fikir birliğini çözmek için gereken asgari miktarda başarısızlık bilgisini incelemeye çalıştılar. Anlaşmayı çözmek için mükemmel bir arıza dedektörüne ihtiyacınız olmadığı ortaya çıkıyor. Bazı asgari koşulları karşılayan güvenilmez arıza dedektörleri bile görev için yeterli olacaktır. Bu makaleler dağıtılmış sistemlerde başarısızlıklarla nasıl başa çıkılacağı konusunda çok etkili olmuştur.


3

Sistemde ne tür arızalar? Bizans hatalarını ele almak için çözümler mi yoksa sadece klasik arıza durdurma modeli mi arıyorsunuz? Dağıtılmış bir sistemde Bizans düğümlerinin varlığında çözümler daha ilginç bir sorundur. Sorun Leslie Lamport (Bizans Generalleri sorunu ') tarafından resmileştirildi ve 1999'da Barbara Liskov ve Miguel Castro'nun makalesi en yakın çalışma pratik çözümü' Pratik Bizans hata toleransı'nı sunuyor. Fred Schneider'in makine yaklaşımı ve görünüm damgalı çoğaltma Sorunun çok genel olduğunu, alanın çok büyük olduğunu ve teori bugün çevrimiçi çalışan çoğu sistemin temelini oluşturduğunu kabul ediyorum.Belki daha spesifik bir hata modeli ve sorun alanı elde etmeye yardımcı olabilir daha iyi cevaplar


3

Dağıtılmış sistemlerde taşıma hatalarını ele almak için bir desen koleksiyonu:

Alternatif olarak, daha genel bir çalışma için, Rachid Guerraoui ve Luis Rodrigues'in Güvenilir Dağıtılmış Programlamaya Giriş kitabı , birçoklarının başarısızlık kurtarma varyantları da dahil olmak üzere çok çeşitli pratik algoritmalara sahiptir. Nancy Lynch'in daha klasik metin Dağıtılmış Algoritmaları daha teorik bir bakış açısıyla benzer bir zemini kapsıyor.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.