İki Accumulo masasını nasıl ayırt edebilirim?


0

İki benzer Accumulo tablosunu karşılaştırmak ve farklılıklarını vurgulamak istersem, bunu nasıl yapabilirim?

İlk düşüncem, veritabanı dökümü oluşturmak ve Unix'i diffdosyalar üzerinde çalıştırmak , ancak bu ölçeklenemez.

İkinci düşüncem belki de iki Accumulo masasını, umarım kuru çalışma seçeneğiyle, bir yerde farklılıkları toplayabilmenin bir yolu olabilir.

... en azından HBase'de bunu yapmanın bir yolu var mı?

Yanıtlar:


2

Ne yazık ki, bunu yapmak için kutudan çıkan hiçbir şey bilmiyorum.

Önemsiz olarak, bunu iki Tarayıcı ile uygulayabilir ve birleştirilmiş bir okuma yapabilirsiniz. Her iki Tarayıcı da sıralı veri döndürdüğü için, iki anahtar değer eşitse, her iki Tarayıcıyı da ilerlersiniz. Tarayıcı 1'den Anahtar, Tarayıcı 2'den Anahtar'a göre sıralanırsa, Anahtarın Tarayıcı2'daki tabloda bulunmadığını bilirsiniz ve Tarayıcı1'i ilerlersiniz. Tarayıcı 2'den Anahtar, Tarayıcı1'den Anahtar'a göre sıralanıyorsa, bu Anahtar Tarayıcı2'den tabloda bulunmaz ve Tarayıcı2'yi ilerlersiniz.

Ancak, dediğiniz gibi, bir masayı okuyan bir iş parçacığına sahip olduğunuz ve muhtemelen eşzamanlı olarak çalıştırmak için birden fazla çekirdeğiniz olduğu için bu oldukça yavaş olacaktır.

Bu ölçeği yapmak için, tablonuzu kovalara "bölümlendirebilirsiniz" (örneğin, masa tuşlarınız [A, B, C, ... Z] alfabesiyse, her bölüm bu durumda bir harf olabilir) ve aynı algoritmayı paralelleştir. Alfabe örneğini kullanarak, tabloların bölümlerini aynı anda okuyan 26 müşteriniz olabilir. Bu da harita azaltma işi olarak kolayca uygulanabilecek bir şey.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.