Amazon EC2'de ölçeklenebilir, güvenilir bir haproxy kümesini nasıl kurabilirim?

ELB'nin sağladığından daha fazla işlevselliğe ihtiyacımız var (çoğunlukla L7 muayenesi), ancak EC2 kullanarak kalp atışı ve yüksek kullanılabilirlik gibi şeylerle nasıl başa çıkılacağı belli değil. Kümede 3 veya daha fazla haproxy düğümüne ihtiyaç duymamız ihtimalinin yüksek olması nedeniyle, iki düğüm arasındaki basit kalp atışı işe yaramayacak.

Görünüşe göre, bir kalp atışı katmanı haproxy düğümlerinin önünde, muhtemelen IPVS kullanarak, ancak EC2 küme değiştikçe (ya kasıtlı değişiklikler, genişleme gibi ya da istemeden, bir kaybedilme gibi kasıtlı değişiklikler yoluyla) yapılandırma yolunu kullanmanın yolu olacak gibi görünüyordu. EC2 düğümü) önemsiz görünüyor.

Tercihen, çözelti en az iki Müsaitlik Alanını kapsayacaktır.

Soru cevaplarına cevaben: Hayır, seanslar yapışkan değildir. Ve evet, SSL’ye ihtiyacımız olacak, ancak teoride bu tamamen başka bir kurulum tarafından ele alınabilir - SSL trafiğini SSL olmayan trafikten farklı bir yere yönlendirebiliriz.

— Don MacAskill
kaynak

Kanarya'nın nasıl yapılacağını araştırıyorum, yavaş yavaş artan trafik yüzdesiyle yazılımın yeni sürümüne gidiyor ve bununla nerede başa çıkacağınızı merak ediyorum. Jesper'ın herhangi bir önerisini denediniz mi?

— Iain

Yanıtlar:

Tamam, hiçbir zaman kendimi SmugMug seviyelerinde trafiğe sahip bir AWS yük dengeleme çözümü inşa etmedim, ancak sadece teoriyi ve AWS'in hizmetlerini düşünerek, birkaç fikir aklıma geldi.

Orijinal soru, yük dengeleme tasarımını etkileme eğiliminde olan birkaç şeyi kaçırıyor:

Yapışkan oturumlar ya da değil? Yapışkan oturumu kullanmamak ve tüm yük dengeleyicilerin (LB'ler) yuvarlak robin (RR) veya rasgele arka uç seçimi kullanmasına izin vermek çok tercih edilir. RR veya rasgele arka uç seçimleri basit, ölçeklenebilirdir ve her koşulda yük dağılımı sağlar.
SSL mi değil mi? SSL'nin kullanımda olup olmadığı ve talep yüzdesinin bu oranın genellikle yük dengeleme tasarımı üzerinde etkisi vardır. Sertifika işlemeyi basitleştirmek ve SSL CPU'yu web uygulama sunucularından uzak tutmak için SSL'yi mümkün olduğunca erken sonlandırmak genellikle tercih edilir.

Yük dengeleme katmanının kendisini nasıl yüksek oranda erişilebilir tutacağı perspektifinden cevap veriyorum . Uygulama sunucularının korunması HA, L7 yük dengeleyicinize yerleştirilmiş sağlık kontrolleri ile yapılır.

Tamam, çalışması gereken birkaç fikir:

1) "AWS yolu":

İlk katman, en ön tarafta, LB (TCP / IP) modunda ELB kullanın.
İkinci katman, seçtiğiniz L7 yük dengeleyicinizle EC2 örneklerini kullanın (nginx, HAProxy, Apache vb.).

Faydaları / fikri: L7 yük dengeleyicileri, hepsi aynı AMI'den klonlanmış ve aynı konfigürasyonu kullanarak oldukça basit EC2 AMI'ler olabilir. Böylece Amazon'un araçları tüm HA ihtiyaçlarını karşılayabilir: ELB, L7 yük dengeleyicilerini izler. Bir L7 LB ölür veya tepkisizleşirse, ELB ve Cloudwatch birlikte yeni bir örneği otomatik olarak oluşturur ve ELB havuzuna getirir.

2) "İzleme yolu ile DNS turu robin:"

Birkaç IP adresi üzerinden kaba taneli bir yük dağılımı elde etmek için basit DNS yuvarlak robin kullanın. Siteniz için 3 IP adresi yayınladığınızı varsayalım.
Bu 3 IP'nin her biri, bir EC2 örneğine bağlı bir AWS Elastik IP Adresidir (EIA), seçtiğiniz bir L7 yük dengeleyicisine sahiptir.
Bir EC2 L7 LB ölürse, uyumlu bir kullanıcı aracısı (tarayıcı) gerekir sadece diğer IP adreslerine birini kullanın yerine.
Harici bir izleme sunucusu kurun. 3 EIP'nin her birini izleyin. Biri yanıt vermezse, EIP'yi başka bir EC2 örneğine taşımak için AWS'nin komut satırı araçlarını ve bazı komut dosyalarını kullanın.

Yararları / fikri: Uyumlu olmayan kullanıcı temsilcileri yanıt vermezse, otomatik olarak başka bir IP adresine geçmelidir. Bu nedenle, bir arıza durumunda, kullanıcılarınızın sadece 1 / 3'ü etkilenmeli ve UA'ları sessizce başka bir IP'ye geçemediğinden bunların çoğu hiçbir şey fark etmemelidir. Ve harici izleme kutunuz bir EIP'nin yanıt vermediğini fark edecek ve durumu birkaç dakika içinde düzeltecektir.

3) DNS RR - HA sunucu çifti:

Temel olarak, Don'un bir çift sunucu arasında basit bir kalp atışı önerisi olması, ancak birden fazla IP adresi için basitleştirilmesi.

DNS RR'yi kullanarak, hizmet için birkaç IP adresi yayınlayın. Yukarıdaki örnekten sonra 3 IP yayınladığınızı varsayalım.
Bu IP'lerin her biri bir çift EC2 sunucusuna gider , yani toplamda 6 EC2 örneği.
Bu çiftlerin her biri, aktif / pasif bir konfigürasyonda 1 IP adresini canlı tutmak için AWS araçlarıyla birlikte Heartbeat veya başka bir HA çözümü kullanır.
Her EC2 örneğinde, kurulu L7 yük dengeleyiciniz vardır.

Yararları / fikri: AWS'nin tamamen sanallaştırılmış ortamında, L4 servisleri ve yük devretme modları hakkında düşünülmesi gerçekten kolay değil. Sadece 1 IP adresini canlı tutan bir çift özdeş sunucuya basitleştirilmesiyle, mantıklı olması ve test edilmesi daha kolay hale gelir.

Sonuç: Yine üretimde bunların hiçbirini denemedim. İçimden gelen hislerime göre, L4 modunda ELB ile bir seçenek ve L7 LB olarak EC2 örnekleri AWS platformunun ruhu ile uyumlu görünüyor ve Amazon'un daha sonra yatırım yapıp genişlemesi muhtemel. Bu muhtemelen benim ilk tercihim.

— Jesper M
kaynak

Bu yüzden yaklaşım 1'e bayılıyorum, bu yöneldiğim yön, ama yine de bazı ilginç kazanımlar var - bunların hiçbiri ELB'in bir bütün AZ başarısızlığını iyi bir şekilde ele almadığı anlamına gelmez (zaten oldu. ). Kolay, ama yucky, 'çözüm', ELB'nin arkasındaki AZ'leri (belki başka bir AZ'de yedek bir küme ile) geçecek şekilde yapılandırılmış olan haksiklilere sahip olmaktır, bu nedenle her AZ'de en az bir haproksi varsa, iyi olmalıyız. Ancak bu sadece taklit eder, sorunu ortadan kaldırmaz. Bu problemle ilgili bir fikriniz var mı?

— Don MacAskill

@Don MacAskill: AWS'nin birkaç büyük hizmet kesintisi yaşadığını biliyorum, ancak AWS'de AZ güvenilirliğinden daha iyisini yapmak zor. Ön uçtaki çoklu AZ işlemine geçmek, tüm yığının çoklu AZ işlemine doğru atılacak ilk adım olabilir, ve bu bir sürü su ısıtıcısıdır ...

— Jesper M

@Don MacAskill: Bir seçenek, bir AZ içindeki DynDNS Dynect -> ELB + L7 LB'ler, başka bir AZ'de sıcak bekleme durumunda olan diğer ELB + L7'ler gibi jeo-bilinçli bir DNS çözünürlüğü olacaktır. (Coğrafi bilinçli olmanın yanı sıra, Dynect'in bazı sağlık kontrolleri de vardır.) DynDNS'in çalışma süresi için harika bir sicili var, ancak yine de coğrafi bilinçli DNS eklemek başka bir SPOF. 2 AZ'de Dynect + yük dengelemesinin sadece bir AWS AZ'den daha uzun süreli çalışma süresine sahip olup olmadığı benim için net değil. Ne demek istediğimi genel bir bakış için bakın, çoklu AZ veritabanlarını sanse edin

— Jesper M

@Don MacAskill: Son bir şey - tek bir ELB örneğinin birden fazla AZ'yi kapsayabileceğini unutmayın. EC2 bölgelerinde yayılamaz . Ama eğer ELB'yi L7'ye aynı bölgede bulunan iki AZ'de L7 LB'leri kullanmak kabul edilebilirse, bu kadar basit olabilirdi ... "ELB, bütün bir AZ'nin başarısızlığını çok iyi idare etmiyor" yazmış olabilirsiniz, belki zaten daha fazlasını biliyorsunuzdur. Ben yaparım.

— Jesper M,

Evet, eğer bir ELB birden fazla AZ kullanıyorsa ve bir AZ'deki arka uç düğümlerinin hiçbirine ulaşamadığı bir tür başarısızlığa sahipse (aşırı yüklenmiş, aşağı, 503'leri geri getiren, ne olursa olsun), son kullanıcılar bu hataları görüyor - öyle değil t diğer AZ (ler) e tekrar yönlendirin. Bunun planlandığını umuyorum, ama bizi bir kez ısırdı.

— Don MacAski,

Yapışkan oturumlar yapmıyorsanız ya da tomcat / apache stilini kullanıyorsanız (LB'de durumu saklamak yerine, oturum kimliğine düğüm kimliği ekleyin), o zaman ELB'yi bir grup halojenin önünde kullanırdım. ELB yerleşik bir sağlık kontrolüne sahiptir, böylece haksirleri izlemenizi ve havuzdan aşağı olanları almasını sağlayabilirsiniz. Kalp atışı yük devretme yerine kurmak için çok daha az.

Değişikliklere gelince, benim çok iyi bir cevabım yok. Kukla ilk yapılandırma ve değişikliklerin uygulanması için mükemmeldir, ancak düğüm eklemek / kaldırmak için 30 dakikalık yoklama aralığından daha hızlı yanıt alma eğilimindedir.

— Ben Jencks
kaynak

Bu iyi bir çözüm (ve iyi bir soru!) Yapılandırma değişikliklerini zorla yaymak için Amazon SNS kullanabilirsiniz. Haproxy yapılandırmasından düğüm eklemek / kaldırmak için bir bildirim sistemine ihtiyacınız var.

— Rafiq Maniar 4'10

Arka uç sunucularını yönetmek için başka bir seçenek (haproxy'nin ilettiği sunucular), her arka uç sunucusunun tüm haproksileri veya bir yapılandırma sunucusunu periyodik bir kayıt (30 saniye veya daha fazla) göndermesini sağlamaktır. Biri ölürse, hızla kayıtsız kalmaktadır (ve haproxy yine de fark etmelidir); eğer yenisi gelirse otomatik olarak rotasyona girer. Anlaşılan Netflix’in yaptığı bu.

— Ben Jencks,

Kendim kullanmadım ama EC2'de bu tür problemleri çözmek için kukla kullandığını söyleyen birçok insan gördüm.

— JamesRyan
kaynak

Evet, EC2'deki kukla küme yönetimini oldukça basit hale getirir. Sadece bir mikro örnek oluşturun ve bunu kukla yöneticiniz olarak kullanın.

— Tom O'Connor,

Kuklaları veri merkezlerimizde kullanıyoruz, ancak henüz EC2'yi denemedim. Kukla EC2, bir şekilde ec2-example-örnekleri veya benzerlerini kullanarak düğümleri bulabilecek ve bu çıktıya göre otomatik olarak konfigüre edecek / yeniden yapılandırabilir mi? Ve kuklacıların aniden uzaklaşmasını nasıl idare edersiniz?

— Don MacAskill

Neden aniden uzaklaştı?

— Tom O'Connor,

EC2 ile uyumlu değil, ancak onu kurarken imzalamak için yeni düğümler işaretlenecek ve onları tanımlamak için harici bir düğümler komut dosyası kullanacak şekilde ayarlayabilirsiniz. SimpleDB (dış düğümler) ve SQS (yeni düğümler için imzalama istekleri sırasını) ile bunu yapmak için bazı python yazdım; Bir ubuntu dev S3 kullanarak scriptler yazdı: ubuntumathiaz.wordpress.com/2010/04/07/…

— Ben Jencks

Kuklacı aniden ortadan kaybolursa, sadece tezahürü çalıştırmaz, yani düğümleri içinde bulundukları her durumda

— bırakırlar