Ben drbd gibi veri agnostik olan çoğaltma önermek eğilimindedir. Çok sayıda dosya, "blok depolama" dan daha yüksek bir düzeyde çalışan herhangi bir şeyin, rsync kullanarak veya inotify saatler oluştururken bulduğunuz gibi, ağaçta yürümek için çok fazla zaman harcamasına neden olacaktır.
Kişisel hikayemin kısa versiyonunu destekliyor: Ceph'i kullanmadım, ancak eminim ki Gluster ile olan benzerliğine dayanarak ana pazar hedeflerinde değiller. Bununla birlikte, son birkaç yıldır Gluster ile bu tür bir çözümü uygulamaya çalışıyorum. Birkaç ana sürüm güncellemesine rağmen, o zamanın çoğunda çalışıyor ve çalışıyor, ancak sorunum yoktu. Hedefiniz performanstan daha fazla yedeklilikse, Gluster iyi bir çözüm olmayabilir. Özellikle kullanım deseninizde çok sayıda stat () çağrısı varsa, Gluster çoğaltma ile çok iyi sonuç vermez. Bunun nedeni, çoğaltılmış birimlere yapılan stat çağrılarının çoğaltılmış düğümlerin tümüne gitmesidir (aslında "tuğla", ancak büyük olasılıkla ana bilgisayar başına bir tuğla olacaktır). Örneğin, 2 yönlü bir kopyanız varsa, bir istemciden her stat (), geçerli verileri kullandığından emin olmak için her iki tuğladan bir yanıt bekler. Daha sonra, yerel gluster dosya sistemini artıklık için kullanıyorsanız, FUSE ek yükü ve önbellek eksikliğiniz vardır (hala stat () nedeni için berbat olan NFS ile protokol ve otomatik sayaç için arka uç olarak Gluster kullanmak yerine) . Gluster, verileri birden fazla sunucuya dağıtabileceğiniz büyük dosyalarla gerçekten iyi sonuç verir; veri şeritleme ve dağıtımı iyi çalışıyor, çünkü bu tam olarak bunun için. Ve yeni RAID10 tipi çoğaltma, eski düz çoğaltılmış birimlerden daha iyi performans gösterir. Ancak, tahmin ettiğim şeye göre kullanım modeliniz, buna karşı tavsiye ediyorum. Daha sonra, yerel gluster dosya sistemini artıklık için kullanıyorsanız, FUSE ek yükü ve önbellek eksikliğiniz vardır (hala stat () nedeni için berbat olan NFS ile protokol ve otomatik sayaç için arka uç olarak Gluster kullanmak yerine) . Gluster, verileri birden fazla sunucuya dağıtabileceğiniz büyük dosyalarla gerçekten iyi sonuç verir; veri şeritleme ve dağıtımı iyi çalışıyor, çünkü bu tam olarak bunun için. Ve yeni RAID10 tipi çoğaltma, eski düz çoğaltılmış birimlerden daha iyi performans gösterir. Ancak, tahmin ettiğim şeye göre kullanım modeliniz, buna karşı tavsiye ediyorum. Daha sonra, yerel gluster dosya sistemini artıklık için kullanıyorsanız, FUSE ek yükü ve önbellek eksikliğiniz vardır (hala stat () nedeni için berbat olan NFS ile protokol ve otomatik sayaç için arka uç olarak Gluster kullanmak yerine) . Gluster, verileri birden fazla sunucuya dağıtabileceğiniz büyük dosyalarla gerçekten iyi sonuç verir; veri şeritleme ve dağıtımı iyi çalışıyor, çünkü bu tam olarak bunun için. Ve yeni RAID10 tipi çoğaltma, eski düz çoğaltılmış birimlerden daha iyi performans gösterir. Ancak, tahmin ettiğim şeye göre kullanım modeliniz, buna karşı tavsiye ediyorum. hala stat () nedeni için berbat. Gluster, verileri birden fazla sunucuya dağıtabileceğiniz büyük dosyalarla gerçekten iyi sonuç verir; veri şeritleme ve dağıtımı iyi çalışıyor, çünkü bu tam olarak bunun için. Ve yeni RAID10 tipi çoğaltma, eski düz çoğaltılmış birimlerden daha iyi performans gösterir. Ancak, tahmin ettiğim şeye göre kullanım modeliniz, buna karşı tavsiye ediyorum. hala stat () nedeni için berbat. Gluster, verileri birden fazla sunucuya dağıtabileceğiniz büyük dosyalarla gerçekten iyi sonuç verir; veri şeritleme ve dağıtımı iyi çalışıyor, çünkü bu tam olarak bunun için. Ve yeni RAID10 tipi çoğaltma, eski düz çoğaltılmış birimlerden daha iyi performans gösterir. Ancak, tahmin ettiğim şeye göre kullanım modeliniz, buna karşı tavsiye ediyorum.
Muhtemelen makineler arasında ana seçim yapmak için bir yol bulmanız veya dağıtılmış kilitleme uygulamanız gerektiğini unutmayın. Paylaşılan engelleme aygıtı çözümleri, çok yöneticili (GFS gibi) bir dosya sistemi veya dosya sisteminin okuma-yazma işlemine yalnızca bir düğümün bağlanmasını gerektirir. Genel olarak dosya sistemleri, verileri blok cihaz düzeyinde değiştirildiklerinde hoşlanmazlar. Bu, müşterilerinizin asıl hangisi olduğunu ve doğrudan yazma isteklerini söyleyebileceği anlamına gelir. Bu büyük bir sıkıntı olabilir. GFS ve tüm destekleyici altyapısı bir seçenekse, çoklu ana modda drbd ("çift birincil" olarak adlandırılır) iyi çalışabilir. Bununla ilgili daha fazla bilgi için https://www.drbd.org/tr/doc/users-guide-83/s-dual-primary-mode .
Hangi yöne gittiğinizden bağımsız olarak, bunun bir SAN şirketine sadece bir kamyon dolusu para vermeden gerçek zamanlı yapmak için oldukça büyük bir acı olduğunu keşfetmeye eğilimlisiniz.