Elastik Arama donanımı için öneriler [kapalı]


10

Elastik Arama'yı destekleyecek donanım düzeyi için iyi kılavuzlar var mı? Lucene veya Solr için öneriler iyi bir başlangıç ​​mı? İle başlayan bir dağıtım başlatmayı düşünüyoruz

  • 27 milyon belge, 8 TB veri
  • günde 300 bin belge ekle

Sonra bunu yaklaşık 10 kata kadar ölçeklendirin.

  • 270 milyon belge, 80 TB veri
  • günde 3 milyon belge ekleyin

Bu, sorguların binlerce / gün içinde olacağı garip bir kullanım durumudur, ancak yanıt sürelerinin Ajaxy webapp ile iyi bir deneyim için yeterince düşük kalması gerekir.


@ Markarkenderson: Bu gerçek (oyuncak olmayan) ve ilginç bir soru. Bence "çok yerelleştirilmiş" olarak değerlendirmeniz hedef dışı.
David J.

David, soru SSS bölümümüze göre kapatıldı, alışveriş soruları yapmıyoruz
Mark Henderson

Yanıtlar:


11

Oyuna girebilecek birçok faktör var, bu yüzden pek çok genel yönerge olduğunu düşünmüyorum.

Beklenen indeksleme ve arama yükünüzü kurulumda attığınızda işlerin nasıl davrandığını görmek için belki de ilk veri kümesinin 1 / 5'i ile daha küçük ölçekli bir değerlendirme yapmalısınız. Bu, verilerinizin arama motorunda gerçekte ne kadar yer kaplayacağını anlamanıza yardımcı olur. Elasticsearch için, kaynak json'u depolayıp saklamadığınıza ve alanların nasıl analiz edileceğine ve depolanıp depolanmadığına bağlıdır.

EC2, büyük bir yüksek harcama olmadan elastik araştırmayı değerlendirmek için makul bir yol olabilir.

Elasticsearch gibi küme tabanlı yazılımlar için, kümeyi daha küçük ve daha büyük tutmak arasında dengesizlikler vardır. Büyük bir küme güzeldir çünkü bir sunucuyu kaybettiğinizde, daha az verinin yeniden tahsis edilmesi gerekir. Daha küçük bir küme daha az enerji tüketir ve bakımı daha kolaydır.

Tüm dizinler çoğaltıldığından, toplam dizin boyutu 300 GB x 2 civarında 35 milyon belgeye sahip bir küme çalıştırıyoruz. Bunu ve çok sayıda aramayı desteklemek için, her biri 24 çekirdekli 4 düğüme, 48 GB RAM'e ve raid'de 10K diskli 1 TB depolama alanına sahibiz10. Yakın zamanda daha fazla kafa alanı olmasını sağlamak için disk boyutunu artırdık.

Durumunuz için daha fazla RAM ve daha fazla disk öneriyorum. Bu arama hacmiyle büyük olasılıkla CPU'lardan tasarruf edebilirsiniz.

Düşük arama hacmi aslında performansı düşürür, çünkü önbellekler (kullanılan yazılımın içinde ve işletim sistemi diskinde dahili) iyi ısıtılmaz.

Umarım bu yardımcı olur, Paul


Ne tür belgelerden bahsediyorsun? Kütükler? Gerçek belgeler mi?
Manuel Rauber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.