Bir sürücü arızalandığında HP sunucularımın bana e-posta göndermesini nasıl sağlayabilirim?


11

İdeal olarak, mümkün olduğunca basit kurulum ve sunucuların yeniden başlatılmasına gerek kalmadan. Çoğunlukla DL380 G5'syardımcı olursa.


Yazık ki onlar G7 değiller ya da HP Insight Manager'ı kullanabilirsiniz.
Tom O'Connor

Sunucularınız Windows veya Linux mu çalıştırıyor?
Tom O'Connor

Bu sunucularda hangi işletim sistemlerini çalıştırıyorsunuz?
ewwhite

Hepsi 2003 veya 2008 hem vanilya hem de R2. SIM ile oynadım ama G5'lerimle konuşamadım.
DrZaiusApeLord

SIM hala G5 ProLiants ile uyumlu olmalıdır. Daha önce denediğinizde aracıları yüklediniz mi?
ewwhite

Yanıtlar:


16

Bu, sunucularda çalıştırdığınız işletim sistemlerine biraz bağlıdır, ancak genel olarak HP ProLiant sunucularından ve Smart Array RAID denetleyicilerinden uyarı almak mümkündür.

DL380 G5 sistemleriniz için tam sürücü ve yazılım destek listesi burada listelenmiştir .

SNMP ve bir izleme çözümü en iyi yaklaşımdır ... Ancak bunu HP'nin bazı araçlarıyla artırabilirsiniz. HP, karşıdan yüklenebilen ve sunucularla birlikte gelen HP Systems Insight Manager'ı sunar . Bu, sunucu koleksiyonları için idealdir. Yönetim veya izleme altyapısı oluşturmadan bir kerelik uyarılar arıyorsanız, HP Yönetim Aracılarını (diğer adıyla ProLiant Destek Paketi ) yükleyebilirsiniz .

Bağımsız Linux sistemleri için, aracıların e-posta yoluyla tuzaklar göndermelerini sağlayacağım. Genellikle destek paketini varsayılanlarla veya özel bir paketle yapılandıracağım , ardından satırı düzenleyip alıcının adresini gösterecek şekilde /opt/hp/hp-snmp-agents/cma.confdeğiştireceğim trapemail:

########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
#             trapemail /usr/bin/logger
#       will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' systems@1234.net

Linux çalıştırıyorsanız ve tam HP yönetim paketini yüklemek istemiyorsanız, denetleyici / disk durumunu sorgulamak için cciss_vol_status yardımcı programının etrafında bir komut dosyası geliştirebilirsiniz . Ayrıca bkz: OpenFiler'e HP Aracıları Yükleme


sürücüyü yuvadan çıkarmak dışında bir RAID dizi arızası için bir uyarıyı test etmenin zarif bir yolu var mı? Birkaç ProLiant DL360 G7sunucum var ve HP SIM izleme için ayarlandı.
Banjer

Bildiğim kadarıyla hayır. Analiz temsilcileri kesinlikle işe yarıyor. Dizi durumunu hpacucli yardımcı programı ile görebiliyorsanız ve HP SIM'de uyarı aldığınızı biliyorsanız, işlerin işe yarayacağını varsaymanın adil olduğunu düşünüyorum.
ewwhite


3

@Wwite'ın cevabında belirttiği hafif programı kullandım: cciss_vol_status

Birlikte verilen INSTALL talimatlarını izlerseniz, komut dosyası yerleştirilir /usr/local/bin/cciss_vol_status.

Burada cciss_vol_status çıktısını grep ve herhangi bir dizi FAILED durumu varsa bir e-posta göndermek için kullandığım bir sarıcı komut dosyası.

#!/bin/bash
#
# Check status of RAID volumes on HP Smart Array controllers.  Send an email
# alert if any volumes have a FAILED status.
#
status=`/usr/local/bin/cciss_vol_status /dev/sd*`

# email lock file
lockfile=/tmp/raid.check.hp.smartarray.lock
# how often to send an email (minutes)
_notification_freq=59
_host=`hostname`
# To: email
_toemail=root

# create email lock file
[ ! -f ${lockfile} ] && /bin/touch ${lockfile}

if echo $status | grep -q FAILED
then
    # make sure we haven't sent a notification in the last X minutes
    if test `find ${lockfile} -mmin +${_notification_freq}`
    then
        echo -e "${status}" | /bin/mail -s "System Alert! RAID failure on ${_host}" ${_toemail}

        # update lock file mod time
        /bin/touch ${lockfile}
    fi
fi

Yukarıdaki betiği cron olarak çağırınız. Çeki iki dakikada bir çalıştırıyorum:

*/2 * * * * /usr/local/bin/raid.check.hp.smartarray.sh

HP'lerinizin çalışır durumda olup olmadığını kontrol etmek için HP System Insight Manager'ı kullanıyoruz, ancak bunun ötesinde bir şey yok. Linux ajanının bizim için aşırı yüklü olduğunu gördüm, çünkü başka izleme çözümlerine sahibiz, bu yüzden yukarıdaki bu komut dosyası özel amacına iyi hizmet ediyor.

GÜNCELLEME

Sadece bununla karşılaşırsanız bir sorun giderme ipucu. Bu komut dosyası, başarısız bir dizi hakkında bir e-posta aldığımda bu sabah yardımcı oldu:

Önbellek kirli sınırına ulaşıldı

Cihaz salt okunur oldu ve içinde görünmüyordu /proc/partitions. Sunucuyu yeniden başlattım ve önyüklemede şu mesajları gördüm:

Mantıksal sürücüler olası veri kaybı nedeniyle devre dışı bırakıldı. Devre dışı bırakılan mantıksal sürücü (ler) ile devam etmek için "F1" seçin Veri kaybını kabul etmek ve mantıksal sürücü (ler) i yeniden etkinleştirmek için "F2" yi seçin

F2'yi seçtim ve RAID iyiydi ve önyüklemeye monte edildi.


1

smartmontools yükleyin. Bir sürücü arızalanmadan ÖNCE size posta gönderir.


2
Zamanın ~% 30'u. SMART gümüş bir kurşun değildir .
HopelessN00b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.