Amazonons AWS altyapısı üzerinden yaklaşık iki yıldır birkaç web sitesi kullanıyoruz ve yaklaşık iki gün önce web sunucusu, bulabildiğim tek hatayla günde bir veya iki kez düşmeye başladı:
HTTP/1.1 503 Service Unavailable: Back-end server is at capacity
CloudWatch tarafından hiçbir alarm (CPU / Disk IO / DB Bağlantısı) tetiklenmez. ELB'yi atlamak için siteye elastik IP üzerinden gitmeye çalıştım ve şunu anladım:
HTTP request sent, awaiting response... Read error (Connection reset by peer) in headers. Retrying.
Apache günlüklerinde olağandışı bir şey görmüyorum ve doğru şekilde döndürüldüklerini doğruladım. Makineye SSH ile "aşağı" düştüğünde ve işlem listesine baktığımda hiçbir sorunum yok bana normal görünen 151 apache2 işlemlerini görüyorum. Apache'nin yeniden başlatılması sorunu geçici olarak düzeltir. Bu makine sadece bir ELB'nin arkasındaki web sunucusu olarak çalışıyor. Herhangi bir öneri çok takdir edilecektir.
İşlemci Kullanımı Ortalama:% 7.45, Minimum:% 0.00, Maksimum:% 25.82
Bellek Kullanımı Ortalama:% 11.04, Minimum:% 8.76, Maksimum:% 13.84
Swap Kullanımı Ortalama: N / A, Minimum: N / A, Maksimum: N / A
/ Dev / xvda1 için monte edilen / ortalama / ortalama:% 62,18, Minimum:% 53,39, Maksimum:% 65,49
Açıklığa kavuşturayım Meselenin tek tek EC2 örneği ile olduğunu düşünüyorum ve ELB ile değil, elastik IP'ye ulaşamama rağmen, bunu ekarte etmek istemedim. ELB'nin sadece gerçek EC2 örneğine vurarak sonuçlarını iade edeceğinden şüpheleniyorum.
Güncelleme: 2014-08-26 Bunu daha önce güncellemeliydim ama "düzeltme", "kötü" vakanın anlık görüntüsünü almak ve elde edilen AMI'yi başlatmaktı. O zamandan beri aşağı gitmedi. Halen sorun yaşarken sağlık kontrolüne curl http://localhost/page.html
baktım ve yük dengeleyicisinden kapasite sorunları alırken bile sağlık kontrol sayfasına ( ) ulaşabildim. Bunun bir sağlık kontrolü sorunu olduğuna ikna olmadım, ancak Amazon dahil hiç kimse daha iyi bir cevap veremediğinden, cevap olarak işaretliyorum. Teşekkür ederim.
Güncelleme: 2015-05-06 Buraya geri döneceğimi ve sorunun kesinlikle sağlık kontrolü ayarları olduğuna inanıyorum derim. AMI ile ilgili bir sorun olmalarını reddetmek istemiyorum çünkü AMI'nin değiştirilmesinden sonra kesinlikle daha iyi bir hal aldı, ancak sağlık kontrollerimizin her yük dengeleyici için farklı olduğunu ve en fazla sorun yaşadığını kontrol ettim. Gerçekten agresif bir sağlıksız eşik ve müdahale zaman aşımına uğradı. Trafiğimiz tahmin edilemez bir şekilde yükselme eğilimindedir ve agresif sağlık kontrolü ayarları ile trafikteki ani artışlar arasında mükemmel bir fırtına olduğunu düşünüyorum.