İzleme örneği başlatma / durdurma uyarıları nasıl devre dışı bırakılır?


10

Monit, daemon daemon her durdurulduğunda veya başlatıldığında bir uyarı gönderir. Bu iğrenç ve yararlı bir bilgi değil.

Dokümanlara göre:

set alert user@mycompany.com but not on { instance }

... başlatma / durdurma olarak tanımlanan "örnek" kategorisinde olmadıkça, bu e-postaya uyarı göndermesi gerekir.

Ancak, yine de uyarılar oluşturulur. Bu çok sinir bozucu. Açıkçası bir şey eksik olmalıyım.

Monit 5.2.4 kullanıyoruz


Yanıtlar:


7

Monit , belgelere göre bir dizi uyarı oluşturabilir:

Event:     | Failure state:              | Success state:
---------------------------------------------------------------------
action     | "Action done"               | "Action done"
checksum   | "Checksum failed"           | "Checksum succeeded"
bytein     | "Download bytes exceeded"   | "Download bytes ok"
byteout    | "Upload bytes exceeded"     | "Upload bytes ok"
connection | "Connection failed"         | "Connection succeeded"
content    | "Content failed",           | "Content succeeded"
data       | "Data access error"         | "Data access succeeded"
exec       | "Execution failed"          | "Execution succeeded"
fsflags    | "Filesystem flags failed"   | "Filesystem flags succeeded"
gid        | "GID failed"                | "GID succeeded"
icmp       | "Ping failed"               | "Ping succeeded"
instance   | "Monit instance changed"    | "Monit instance changed not"
invalid    | "Invalid type"              | "Type succeeded"
link       | "Link down"                 | "Link up"
nonexist   | "Does not exist"            | "Exists"
packetin   | "Download packets exceeded" | "Download packets ok"
packetout  | "Upload packets exceeded"   | "Upload packets ok"
permission | "Permission failed"         | "Permission succeeded"
pid        | "PID failed"                | "PID succeeded"
ppid       | "PPID failed"               | "PPID succeeded"
resource   | "Resource limit matched"    | "Resource limit succeeded"
saturation | "Saturation exceeded"       | "Saturation ok"
size       | "Size failed"               | "Size succeeded"
speed      | "Speed failed"              | "Speed ok"
status     | "Status failed"             | "Status succeeded"
timeout    | "Timeout"                   | "Timeout recovery"
timestamp  | "Timestamp failed"          | "Timestamp succeeded"
uid        | "UID failed"                | "UID succeeded"
uptime     | "Uptime failed"             | "Uptime succeeded"

Bunu bizim tarafımızdan (masumları korumak için adresler değiştirildi) ayarlayarak çözebildik:

SET ALERT important-messages@projectlocker.com ON { invalid, nonexist, timeout, resource, size, timestamp}
SET ALERT less-important-messages@projectlocker.com ON {action, permission, pid, ppid, instance, status}

Bu, mesajları başarıyla önem verdiğimiz adreslere yönlendirir. Onları globallly veya yerel olarak ayarlayabilirsiniz, ancak uyarılarımız sadece globaldir.

HİZMET TESTLERİ altındaki alt başlıklar: http://mmonit.com/monit/documentation/monit.html yukarıdaki türlere oldukça düzgün bir şekilde karşılık gelir.

Sunucunuzun zamanlanan her bir işlemi veya özelliği için, sizin için önemli olan şeyleri İngilizce olarak bulmanız ve bu arzuyu HİZMET TESTLERİNDE belirtilen testlerden biriyle eşleştirmeniz gerekir. Örneğin, eğer Apache çalıştırıyorsam, önemsediğimi biliyorum:

  • PID dosyasındaki PID hala çalışıyor mu? (var olmayan)
  • PID bilgim olmadan değişti mi? (PID)
  • Hizmet yeniden başlatmaya zamanında yanıt veriyor mu? (zaman aşımı)

Anket yapan özel bir arka plan programı için, günlük dosyasının durum iletileriyle düzenli olarak (zaman damgası) güncellenip güncellenmediğine bakabilirim.


1
Neye önem verdiğini nasıl anlarsın? Bu eylemlerin gerçekte ne anlama geldiğiyle ilgili iyi bir belge bulamadım. Örneğin, "çalışma süresi" oldukça yararlı görünüyor, ancak listenizde yok.
dfrankow

Yorum yapmak için cevabımı düzenleyeceğim.
brokenbeatnik

6

Monit sürüm 5.2.5 kullanıyorum ve aşağıdaki kullanarak gelen monit uyarıları durdu

set alert example@gmail.com not {instance}


1

Bu örneklere göre N zaman periyodunda belirli sayıda yeniden denemeden sonra onu durdurmasını söyleyin .


Bu, belirli bir izlenen işlemin veya hizmetin durdurulması veya başlatılması (haberdir) değil, monit daemon'un kendisinin durdurulması / başlatılması, her zaman kasıtlı ve haber değildir.
Winfield

1
Ooooh, global "uyarı ayarla" satırını kaldırırsanız ve servis stanzlarınızda açık uyarılar koyarsanız ne olur?
Ben Lutgens

bu daha iyi çalışır .. sadece kontrollerde uyarı e-postaları ayarlayın .. küresel olanı kaldırın.
Mike

1

Bunu monit içinde düzeltemedim ve teslimattan önce bu monit bulut bildirimlerini filtrelemek için monit e-postasında bir işlem katmanı oluşturmak zorunda kaldım.

Pait ve diğer birçok sistemden gelen bildirimleri toplamak ve göndermek için çağrı görevini kullanıyoruz, bu durumda monit hizmeti bildirim e-postalarını filtrelemek için konu tabanlı bir normal ifade kullanarak Monit hizmetine bir filtreleme kuralı ekledim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.