Donanım Hataları / Arızası Nasıl Kontrol Edilir?


0

Bu harika yazıyı yeni keşfettim: http://www.cyberciti.biz/tips/linux-server-predicting-hardware-failure.html

ve başarısız / arızalı donanımı kontrol etmek için ne sıklıkta normal olduğunu merak ediyor musunuz? Bir şey çıkarsa mümkün olduğu kadar erken olmak isterim, ancak makinenin kendisini kontrol etmesi için makinenin tüm hesaplama gücünü emmek istemiyorum. Cronjob olarak eklemek istediğim CheckHardware.zsh adlı bir kabuk betiğinde önerilen satırın değiştirilmiş bir sürümü var:

#!/bin/zsh
[ $(grep -c "hardware error" /var/log/mcelog) -gt 0 ] && echo "Hardware Error Found On $(hostname) @ $(date)" | ssmtp administrator@example.com

Komut satırı yardımcı programının (mcelog) da çok sık bir cronjob olarak çalıştırılması gerekip gerekmediğini de bilmiyordum. Yani, iki cronjob'a sahip olmak zorunda mıyım? mcelog dosyasını çalıştırın ve ardından "donanım hatası" olan içerikler için mcelog dosyasını kontrol edin.

Sunduğunuz her türlü yardım için şimdiden teşekkür ederiz.

Yanıtlar:


0

Sanırım bir aralıkta kontrol etmekten çok daha iyi bir şey bozulursa uyarılmak olduğunu düşünüyorum.

Bunun için popüler bir araç örneğin http://nagios.org/ ve eğer google'da çok daha fazlası var.

Bu araçlar, yanlış bir şey olduğunda size e-posta uyarıları gönderebilir. Böylece, örneğin yayınladığınız betiği kullanabilirsiniz ve küçük bir değişiklikle, bir sorun tespit ederse nagios'un sizi uyarması için nagios ile bütünleştirebilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.