Bir nagios sunucusunda yüksek yük - Bir nagios sunucusu için kaç servis kontrolü çok fazla?


9

2.0 GHz Intel İşlemci, RAID10 dizisi ve 400 MB RAM ile Ubuntu çalıştıran bir nagios sunucum var. 8 ana bilgisayardaki toplam 42 hizmeti izler, bunların çoğu check_http eklentisi kullanılarak 5 dakika, hatta her dakika kontrol edilir. Son zamanlarda nagios sunucusundaki yük 4'ün üzerinde, genellikle 6'nın üzerindedir. Sunucu ayrıca 6 ana bilgisayar için her dakika istatistik toplayarak kaktüsleri çalıştırır.

Acaba, bunun gibi bir donanımın kaç hizmetin üstesinden gelebilmesi gerekir? Donanımın sınırlarını zorladığım için yük çok yüksek mi yoksa bu donanım 42 servis kontrolü artı kaktüslerle başa çıkabiliyor mu? Donanım yetersizse, daha fazla RAM, daha fazla çekirdek veya daha hızlı çekirdek eklemeye bakmalı mıyım? Diğerleri hangi donanım / hizmet denetimlerini çalıştırıyor?


Koç kullanımı şu anda sunucuda neye benziyor? Ayrıca cpu kullanımı neye benziyor? Eğer bu yüksekse hangi süreçler pimleme yapıyor?
3dinfluence

Sorunu çözdün mü? Aynı sorunu yaşıyoruz. Yük ort. 12 ..
John

Yanıtlar:


7

Darboğazınızın nerede olduğunu bulmanız gerekiyor ...

400'den fazla ana bilgisayarı http, ping ve ssh kontrolleriyle kontrol eden bir nagios monitör çalıştırıyorum. (birçok pasif kontrol ve nscd ile birlikte)

Bu, RAID10'da 4 SAS diskli 2xQuadCore sunucusundadır.

IO çekişmesi olduğundan şüpheleniyorum, çünkü birçok rrd'a yazmak çok verimsiz.

Hangi sürecin kaynaklarınızı ele geçirdiğini bulmanız gerekir. (kaktüsler, nagios veya başka bir şey)

IO kontrolü için iotop'u seviyorum. İotop'u yükleyin (9.04 paketi 8.04'te çalışır)

Ancak aksi halde üst, yük domuzunuzu bulmanıza yardımcı olmalıdır.

Dakikada bir kez kaktüsler oldukça agresif. (Ben 5m aralıklarla benimkini çalıştırıyorum)

Rrd yazma çekişmesi için duyduğum bir yaklaşım rrd mağazalarını ramdisk / tmpfs üzerine koymaktır. (her seferinde kalıcı depolama için yeniden senkronize ettiğinizden emin olun)

İyi şanslar.


Teşekkürler. Ben bakacağım. Muhtemelen kaktüsler yükü oluşturuyor ve rrd'ları tmpfs'ye taşımanın bir yolu olup olmadığını göreceğim. Veya sadece daha fazla RAM ekleyin, böylece sunucu rrd'ları arabelleğe alabilir. Kaktüsleri her 5 dakikada bir çalıştırırsam korkarım sadece 1 veya 2 dakika süren yük sivri uçları olabilir, ki bu tamamen özleyeceğim ...
Josh

6

Yükün çoğunu kaktüs üretmedikçe, donanımınızdakinden daha fazla kontrol çalıştırabilmeniz gerekir.

Ben köpek yavaş eski bir PC (yavaş PATA disk ile Pentium 3 1 GHz) üzerinde Microsoft Virtual Server üzerinde çalışan bir FreeBSD sanal makinede nagios çalıştırıyorum. Sanal makine sadece 128MB RAM'e sahiptir ve performans korkunçtur.

Bununla birlikte, yük ortalaması yaklaşık 0.2'dir, 42 ana bilgisayarda 158 kontrol gerçekleştirir.


Teşekkürler. Her iki yanıtı da kabul edebilseydim! Çok yardımcı oldun, bana kaktüslerin muhtemelen suçlu olduğunu gösteriyor.
Josh

2

256 MB RAM içeren eski bir PIII'de yaklaşık 230 farklı hizmeti aktif olarak izliyorum. Aynı makine, gelen tüm fakslarımız için MRTG ve HylaFAX kullanıyor ve bunu oldukça rahat yapıyor.


Çok yararlı bilgiler. Bu bana kaktüslerin muhtemelen nagios değil, suçlu olduğunu gösteriyor. Teşekkürler!
Josh

1

Bu donanıma sahip bir tekne yükü nagios denetimi çalıştırabilmelisiniz. Yaklaşık 70 kontrol ve Nagiosgraph ile benzer bir kurulum gerçekleştiriyoruz - büyük fark RAM ekleniyor (ucuz, bu yüzden kutuyu 2Gb'ye çarptıracağım).

CPU'nun aşırı yüklenmiş olup olmadığını görmek için üst veya ps-aux çalıştırmayı deneyin, ancak şüpheliyim. Ayrıca , kurulumunuzun seri hale getirmek yerine bir kerede çok fazla kontrol çalıştırmaya çalışıp çalışmadığını görmek için nagios paralelleştirme belgelerini kontrol etmek isteyebilirsiniz .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.