İdeal olarak, mümkün olduğunca basit kurulum ve sunucuların yeniden başlatılmasına gerek kalmadan. Çoğunlukla DL380 G5's
yardımcı olursa.
İdeal olarak, mümkün olduğunca basit kurulum ve sunucuların yeniden başlatılmasına gerek kalmadan. Çoğunlukla DL380 G5's
yardımcı olursa.
Yanıtlar:
Bu, sunucularda çalıştırdığınız işletim sistemlerine biraz bağlıdır, ancak genel olarak HP ProLiant sunucularından ve Smart Array RAID denetleyicilerinden uyarı almak mümkündür.
DL380 G5 sistemleriniz için tam sürücü ve yazılım destek listesi burada listelenmiştir .
SNMP ve bir izleme çözümü en iyi yaklaşımdır ... Ancak bunu HP'nin bazı araçlarıyla artırabilirsiniz. HP, karşıdan yüklenebilen ve sunucularla birlikte gelen HP Systems Insight Manager'ı sunar . Bu, sunucu koleksiyonları için idealdir. Yönetim veya izleme altyapısı oluşturmadan bir kerelik uyarılar arıyorsanız, HP Yönetim Aracılarını (diğer adıyla ProLiant Destek Paketi ) yükleyebilirsiniz .
Bağımsız Linux sistemleri için, aracıların e-posta yoluyla tuzaklar göndermelerini sağlayacağım. Genellikle destek paketini varsayılanlarla veya özel bir paketle yapılandıracağım , ardından satırı düzenleyip alıcının adresini gösterecek şekilde /opt/hp/hp-snmp-agents/cma.conf
değiştireceğim trapemail
:
########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
# trapemail /usr/bin/logger
# will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' systems@1234.net
Linux çalıştırıyorsanız ve tam HP yönetim paketini yüklemek istemiyorsanız, denetleyici / disk durumunu sorgulamak için cciss_vol_status yardımcı programının etrafında bir komut dosyası geliştirebilirsiniz . Ayrıca bkz: OpenFiler'e HP Aracıları Yükleme
ProLiant DL360 G7
sunucum var ve HP SIM izleme için ayarlandı.
HP Insight Manager'a göz atın
https://www.hpe.com/us/en/product-catalog/detail/pip.489496.html#
Sunucularınızla çalışması gerektiğine inanıyorum.
@Wwite'ın cevabında belirttiği hafif programı kullandım: cciss_vol_status
Birlikte verilen INSTALL talimatlarını izlerseniz, komut dosyası yerleştirilir /usr/local/bin/cciss_vol_status
.
Burada cciss_vol_status çıktısını grep ve herhangi bir dizi FAILED durumu varsa bir e-posta göndermek için kullandığım bir sarıcı komut dosyası.
#!/bin/bash
#
# Check status of RAID volumes on HP Smart Array controllers. Send an email
# alert if any volumes have a FAILED status.
#
status=`/usr/local/bin/cciss_vol_status /dev/sd*`
# email lock file
lockfile=/tmp/raid.check.hp.smartarray.lock
# how often to send an email (minutes)
_notification_freq=59
_host=`hostname`
# To: email
_toemail=root
# create email lock file
[ ! -f ${lockfile} ] && /bin/touch ${lockfile}
if echo $status | grep -q FAILED
then
# make sure we haven't sent a notification in the last X minutes
if test `find ${lockfile} -mmin +${_notification_freq}`
then
echo -e "${status}" | /bin/mail -s "System Alert! RAID failure on ${_host}" ${_toemail}
# update lock file mod time
/bin/touch ${lockfile}
fi
fi
Yukarıdaki betiği cron olarak çağırınız. Çeki iki dakikada bir çalıştırıyorum:
*/2 * * * * /usr/local/bin/raid.check.hp.smartarray.sh
HP'lerinizin çalışır durumda olup olmadığını kontrol etmek için HP System Insight Manager'ı kullanıyoruz, ancak bunun ötesinde bir şey yok. Linux ajanının bizim için aşırı yüklü olduğunu gördüm, çünkü başka izleme çözümlerine sahibiz, bu yüzden yukarıdaki bu komut dosyası özel amacına iyi hizmet ediyor.
GÜNCELLEME
Sadece bununla karşılaşırsanız bir sorun giderme ipucu. Bu komut dosyası, başarısız bir dizi hakkında bir e-posta aldığımda bu sabah yardımcı oldu:
Önbellek kirli sınırına ulaşıldı
Cihaz salt okunur oldu ve içinde görünmüyordu /proc/partitions
. Sunucuyu yeniden başlattım ve önyüklemede şu mesajları gördüm:
Mantıksal sürücüler olası veri kaybı nedeniyle devre dışı bırakıldı. Devre dışı bırakılan mantıksal sürücü (ler) ile devam etmek için "F1" seçin Veri kaybını kabul etmek ve mantıksal sürücü (ler) i yeniden etkinleştirmek için "F2" yi seçin
F2'yi seçtim ve RAID iyiydi ve önyüklemeye monte edildi.
smartmontools yükleyin. Bir sürücü arızalanmadan ÖNCE size posta gönderir.