Dağıtılmış işlemlerde başlıca araştırma konuları nelerdir?


10

Giriş: İşlem işleme, veritabanı teorisinde geleneksel bir araştırma konusu olmuştur. Günümüzde dağıtılmış işlemler , genellikle veri bölümü (parçalama olarak da adlandırılır) ve veri çoğaltması içeren büyük ölçekli dağıtılmış depolama sistemleri tarafından popülerleştirilmektedir .

Dağıtılmış işlemlerde başlıca araştırma konuları nelerdir?

(Teorik) iyileştirmeye ihtiyaç duyan tanınmış teoriler ve çözümler var mı?

Herhangi bir referans takdir edilmektedir.

Yanıtlar:


9

Dağıtılmış veritabanlarının teorisi ve pratiğinde birçok araştırma alanı vardır.

Temel pratik zorluklardan biri, dağıtılmış ve coğrafi olarak çoğaltılmış veritabanları için verimli eşzamanlılık kontrol mekanizmalarının uygulanmasıdır. İşlemleri verimli bir şekilde yürütmek için, bu mekanizmalar serileştirilebilirlikten daha zayıf garantiler sağlayabilir, bu da işlemlerin sırayla gerçekleştirilmesini gerektirir. Serileştirilebilirliğe bir alternatif Anlık Görüntü Yalıtımı [1] için yerleşim yeridir, ancak bunun coğrafi olarak çoğaltılmış ve dağıtılmış sistemlere zayıf ölçeklendiği kanıtlanmıştır. Tekniğin bilinen durumunda, coğrafi olarak çoğaltılmış sistemlerde eşzamanlılık kontrolü ile ilgili iki farklı Anlık Görüntü İzolasyonu (SI) tanımlanmıştır: Paralel Anlık Görüntü İzolasyonu (PSI) [2] ve Monotonik Olmayan Anlık Görüntü İzolasyonu (NMSI) [ 3,4]. Dağıtılmış veritabanlarıyla ilgili olanlara gelince (örneğin, verilerin farklı siteler arasında parçalandığı yerlerde),

Serileştirilebilirlikten daha zayıf garanti sağlayan farklı izolasyon seviyeleri kavramlarına sahip olan bir başka önemli soru, programların bir şekilde yazma işlemlerinin, dizilişlerin hala serileştirilebilir olduğu görülmektedir. [1] 'de Anlık Görüntü Yalıtımı için sağlam bir kriter tasarlanmıştır. Grubumdaki bazı insanlar şu anda PSI için makul bir kriter geliştirmeye çalışıyor.

Hem teorik hem de pratik açıdan ilgili bir diğer soru, işlemin doğurulmasıdır. Temel olarak doğrama, kaba taneli işlemlerin daha küçük, ince taneli işlemlere ayrıldığı statik bir analiz tekniğidir. Serileştirilebilirlik için bu soru [6] 'da ele alınmıştır ve ortaya çıkan teori [7]' de pratik bir uygulama sağlamak için uygulanmıştır.

Dağıtılmış veri tabanlarının teorik temelleri açısından, işlemlerin davranışlarını resmen tanımlamak için zayıf bellek modelleri topluluğundan [8] tekniklerin kullanılması için bazı öneriler vardır. [9] 'da yazarlar işlemler için resmi bir davranış nosyonu verirler; aynı yaklaşım, çoğaltılmış veri tiplerinin davranışını belirlemek için [10] 'da kullanılmıştır.

Son zamanlarda, ben ve bazı meslektaşlarım (Alexey Gotsman ve Hongseok Yang) [8,9,10] 'da geliştirilen tekniklerden başlayarak, coğrafi olarak çoğaltılmış veritabanları için tutarlılık düzeylerinin gözlemlenebilir davranışını belirlemek için teorik bir çerçeve oluşturduk. Her birini basit bir uygulama açısından doğru olduğunu kanıtladığımız SI, PSI ve NMSI'nin aksiyomatizasyonunu sağlamak için çerçeveyi başarıyla kullandık. PSI için doğrama kriteri oluşturmak için ortaya çıkan teoriyi de kullandık. Bu sonuçlar umarım öngörülebilir gelecekte yayınlayacağız.

Başka sorularınız varsa lütfen bana yazmaktan çekinmeyin. Bu yardımcı olur umarım,

Andrea Cerone.

Referanslar:

[1] Fekete ve diğerleri, Snapshot Isolation'ı Serializable Yapmak (2005)

[2] Sovran ve diğerleri, Geo-replicated Systems için İşlemsel Depolama (2011)

[3] Arkedani ve diğerleri, Monotonik Olmayan Anlık Görüntü Yalıtımı: coğrafi olarak çoğaltılmış işlem sistemleri için ölçeklenebilir ve güçlü tutarlılık (2013)

[4] Arkedani ve diğerleri, Enstantane İzolasyonun Ölçeklenebilirliği Üzerine (2013)

[5] Binnig ve diğerleri, Dağıtılmış anlık görüntü yalıtımı: küresel işlemler küresel olarak ödenir, yerel işlemler yerel olarak ödenir

[6] Shasha ve diğerleri, Transaction chopping: algoritmalar ve performans çalışmaları (1995)

[7] Zhang ve diğ., İşlem zincirleri: coğrafi dağıtılmış depolama sistemlerinde düşük gecikme ile serileştirilebilirlik elde etme (2013)

[8] Alglave, Zayıf bellek modellerinin resmi hiyerarşisi (2012)

[9] Buckhardt ve diğerleri, Sonunda Tutarlılığı Anlamak (2013)

[10] Buckhardt ve ark., Çoğaltılmış Veri Tipleri: Spesifikasyon, Doğrulama, Optimallik (2014)


Kapsamlı cevabınız için teşekkürler. SI için, literatürde çoğaltılmış ortamlarda dağıtılmış, kilitsiz protokoller var mı? Yoksa SI iyi ölçeklenmediği için bu girişim anlamsız mı? PSI için, gelecekteki çalışmalarda uygulanmasından söz eden bir makale (Tim Kraska @ Eurosys'13) okudum . Mı Genelleştirilmiş Paxos bunun için uygun? Sovran ve ark.'nın [2] orijinaline kıyasla olası artıları / eksileri / zorlukları nelerdir? Tekrar teşekkürler.
hengxin

2
Gerçekten de SI, coğrafi olarak çoğaltılmış sistemlere iyi ölçeklenmez. Yukarıdaki [4] 'te yazarlar Orijinal Kısmi Çoğaltma gibi SI tutarlılığı düzeyinde çalışan coğrafi olarak çoğaltılmış DBMS'ler tarafından elde edilemeyen özellikler olduğunu kanıtlamaktadır. [5] 'te yazarlar SI'ya göre lokal olarak (tek parçalarda) davranan, ancak küresel olarak olmayan ve DSI adı verilen bir SI varyantı öneren infaz örnekleri gösterirler. MDCC ile ilgili olarak, bu yazının farkında değilim ve genelleştirilmiş Paxos'un uygulama ayrıntılarını bilmediğimi itiraf etmeliyim. Ama memnuniyetle bir göz atacağım ve en kısa sürede cevap vereceğim.
Andrea Cerone
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.