Dağıtılmış bilgi işlemde çökme veya Bizans olmayan işlemci hataları


13

Dağıtılmış bilgi işlem modellerinde iki tür işlemci arızası vardır:

(1) Çökme hataları: işlemci durur ve bir daha asla başlamaz. (2) Bizans arızaları: işlemciler olumsuz, kötü niyetli davranıyor.

Sorum şu:

İncelenen, çökme veya Bizans arızalarını azaltmayan diğer işlemci hatası türleri nelerdir?

Ayrıca, daha spesifik bir soru:

Bir olasılıkla, adımında bir işlemin açık olduğu ve başka şekilde kapalı olduğu bir model çalışıldı mı? Yani her işlem olduğu gibi göz kırpıyor ve kapanıyor.t

En çok bu başarısızlıkların fikir birliği ve diğer dağıtılmış anlaşma sorunları ile nasıl ilişkili olduğu ile ilgileniyorum.

Teşekkür ederim.


@Aaron: Birkaç yıl önce "dağıtılmış sistemler" ve "hataya dayanıklı sistemler" konusunda bir dersim daha vardı, ama bu konulara gerçekten değindim. Yine de dinamik hata modeli anahtar kelimesinin size yardımcı olabileceğini düşünüyorum .
MS Dousti

1
Kendi kendine stabilizasyon alanında kullanılan arıza modelinin çarpışma arızalarına veya Bizans arızalarına indirgenmediğini düşünüyorum. Bizans başarısızlıklarıyla ilişkilendirmenin bir yolu: geçici Bizans davranışına sahip olabilirsiniz , ancak böyle bir davranış durursa ve durduğunda, kendi kendini dengeleyen bir sistem doğru duruma ulaşmalıdır.
Jukka Suomela

1
p1/p

1
ATαAT/pαA

2
@Aaron: Michel Raynal ile dağıtık hesaplama teorisini aldım ve mesajların rastgele atılabileceği üçüncü bir model tanımladı. Bu modelde bir mesaj sessizce iletilemez, ancak bu mutlaka düğümün başarısız olduğu anlamına gelmez. Düğüm hataları yerine "adil kayıplı kanal modeli" yerine bağlantı hataları ile ilgili daha fazla bilgiyi buradan edinebilirsiniz: Arıza Dedektörü Oracles'a Giriş Anketi Olarak Sessiz Düzgün Güvenilir Yayın - Michel Raynal ( ftp.irisa.fr/techreports/2000/ PI-1356.ps.gz )
M. Alaggan

Yanıtlar:


12

Soru üzerine yapılan yorumlardan istek üzerine kopyalanmıştır.

Michel Raynal ile dağıtık hesaplama teorisini aldım ve mesajların rastgele atılabileceği üçüncü bir model tanımladı. Bu modelde bir mesaj sessizce iletilemez, ancak bu mutlaka düğümün başarısız olduğu anlamına gelmez. Düğüm hataları yerine "adil kayıplı kanal modeli" yerine bağlantı hataları ile ilgili daha fazla bilgiyi buradan edinebilirsiniz: Arıza Dedektörü Oracles'a Giriş Anketi Olarak Sessiz Düzgün Güvenilir Yayın - Michel Raynal (ftp.irisa.fr/techreports/2000/ PI-1356.ps.gz)


10

Bizans hata toleransı ile ilgili yüksek kaynak maliyeti nedeniyle, giderek daha güçlü varsayımlara sahip arıza modelleri elbette, özellikle kısıtlı tipteki hataları tolere etmek için kaynak gereksinimlerine göre analiz edilmiştir. ( Azadmanesh ve Kieckhafer, 2002 ) çok güzel bir sınıflandırma sağlar (bkz. Şekil 1).

3f+1f+12f+1f

Hata modu varsayımlarını modellemenin başka bir yolu, gönderenin hatası olarak modellenen mesaj kaybının, neden olabileceği tutarsızlıklardan sonra, yalnızca ikili görüş olan bağlantı hatası modeline doğru düğüm merkezli bakış açısından uzaklaşmaktır. sistem dikkate alınır. Bu model ( Schmid, Weiss ve Rushby, 2002 ) tarafından incelenmiştir ( Gray, 1978 ) 'in bağlantı hataları altında Koordineli Saldırı sorununun belirleyici bir çözümünü gösteren imkansızlık sonucunu atlatmıştır .


8

@M olup olmadığını bilmiyorum. Alaggan bu tür hatalardan bahsediyordu, ama kesinlikle birbirine benziyorlar: geçici hatalar.

Enerji tüketimini azaltmak için frekans ve voltajı değiştirebilen DVFS modelinde, bu yazıda Zhu ve Aydin (pdf) DVFS için bir hata modeli kullanmıştır. Örneğin yazılım hatalarından kaynaklanan arızalar olan geçici arızaları dikkate alırlar. Yalnızca geçerli görevin yürütülmesini geçersiz kılarlar ve bu hataya maruz kalan işlemci, kendisine atanan sonraki görevi (varsa) kurtarabilir ve yürütebilir.

λ

λ(f)=λpedfmaxffmaxfmin,
fminffmaxd0λpfmaxpTipfi
Ri(fi)=eλ(fi)×Execution Time(Ti,fi).

Orijinal yazının ardından bu kadar uzun süre yayınladığım için üzgünüm, ancak bu konuda çalıştığım için bu soruyu buldum :). DVFS üzerinde çalışılmadığında, bu hatalar hala mevcuttur, formüller muhtemelen hala geçerlidir (veya uyarlanabilir). DVFS olmadan geçici arızalar hakkında daha fazla bilgiyi burada bulabilirsiniz .


4

Daha önce bahsedilen ihmal hatası modelleri ile ilgili olarak , bunların farklı türlerini dikkate alan NeigerToueg'e bakmaktadır .

Bir olasılıkla, t adımında bir işlemin açık olduğu ve başka şekilde kapalı olduğu bir model çalışıldı mı? Yani her işlem olduğu gibi göz kırpıyor ve kapanıyor.

Bu bir kilitlenme kurtarma modeli gibi geliyor. Süreçlerin olasılıkla açık / kapalı olduğu herhangi bir modelin farkında değilim. Süreçlerin bir süre Bizans olduğu ve daha sonra iyileştiği, zamanla tüm süreçlerin Bizans olabileceği (çoğunlukla saat senkronizasyonu için düşünülür) varyantlar da vardır.

Kapalıyken, yalnızca bir işlemin yalnızca ilerleme kaydetmediğini (alıcının "kapalı" olması nedeniyle iletilerin kaybolmadığını) söylüyorsanız, baktığınız şeye eşzamansız denir sistemi. Paylaşılan bellek bağlamında, sorunuz bu Aspnes belgesiyle yakından ilişkili olabilir .


1

Başka türden arızalar olabilir. Örneğin, bazı işlemciler (örneğin yayın veya çok noktaya yayın protokolleri altında) aşırı yüklenebilir ve gelen tüm iletileri işleyemez. Bu işlemcinin dağıtılmış sistemdeki bazı işlemciler için çevrimdışı görünmesini sağlar.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.