Müvekkilimin sitelerinden biri geçen hafta doğrudan tesadüfi aldı (tesadüfen 13'üncü Cuma günü! ).
Siteye uzaktaydım, ancak yerinde çalışan birisiyle çalışırken garip bir hasar şekli keşfettim. Her iki internet bağlantısı da kapalıydı, çoğu sunucuya erişilemiyordu. Hasar çok oluştu MDF , ama bir lif-bağlı IDF da bir anahtar yığını elemanı üzerinde bağlantı noktaları% 90 kaybetti. Başka yerlere kabloları yeniden dağıtmak ve yeniden programlamak için yeterli yedek anahtar bağlantı noktası mevcuttu, ancak etkilenen cihazları kovalarken bir süre duruldu.
Bu yeni bir bina / depolama tesisi idi ve sunucu odasının tasarımına çok fazla planlama yapıldı. Ana sunucu odası, bir jeneratör tarafından desteklenen APC SmartUPS RT 8000VA çift dönüşümlü çevrimiçi UPS'ten çalıştırılmaktadır. Bağlı tüm ekipmana uygun güç dağıtımı yapıldı. Şirket dışı veri çoğaltması ve sistem yedeklemeleri yapıldı.
Sonuçta (bildiğim kadarıyla) hasar:
- Cisco 4507R-E kasa anahtarı üzerinde 48 portlu hat kartı başarısız oldu .
4 üyeli bir yığında Cisco 2960 anahtarı başarısız oldu.(ayy ... ... istifleme kablosu gevşek)- Cisco 2960 anahtarında çeşitli lapa lapa portlar.
- HP ProLiant DL360 G7 anakart ve güç kaynağı.
- Elfiq WAN bağlantı dengeleyicisi.
- Bir Multitech faks modem.
- WiMax / Sabit kablosuz internet anteni ve güç enjektörü.
- Çok sayıda PoE bağlantılı cihaz (VoIP telefonları, Cisco Aironet erişim noktaları, IP güvenlik kameraları)
Bu sorunların çoğu Cisco 4507R-E'deki bütün anahtar bıçaklarını kaybetmeye bağlıydı. Bu, bazı VMware NFS ağlarını ve sitenin güvenlik duvarına giden bağlantıyı içeriyordu. Bir VMWare ana bilgisayarı başarısız oldu, ancak HA, depolama ağı bağlantısı geri yüklendikten sonra VM'nin hizmetine baktı. Korkak güç durumlarını temizlemek için bir dizi cihazı yeniden başlatmak / kapatmak zorunda kaldım. Yani iyileşme zamanı kısaydı, ama hangi derslerin alınması gerektiğini merak ediyorum.
- Gelecekte ekipmanı korumak için hangi ek korumalar uygulanmalıdır?
- Garanti ve değişime nasıl yaklaşmalıyım? Cisco ve HP sözleşme kapsamındaki ürünleri değiştiriyor. Pahalı Elfiq WAN bağlantı dengeleyici, web sitelerinde temel olarak "çok kötü, bir ağ dalgalanma koruyucusu kullanın" diyen bir bulanıklığa sahiptir . (bu tür bir başarısızlık bekledikleri anlaşılıyor)
- Geçmişte elektrik fırtınası hasarı ile karşılaşacak kadar uzun zamandır BT’de bulundum; örneğin, ucuz bir PC'nin ağ arayüzü veya mini anahtarların imhası.
- Potansiyel lapa lapa ekipmanı tespit etmek için yapabileceğim başka bir şey var mı, yoksa garip davranışların ortaya çıkmasını beklemek zorunda mıyım?
- Bunların hepsi kötü şans mı, yoksa felaket kurtarmasında gerçekten dikkate alınması gereken bir şey mi?
Yeterli $$$ ile, her türlü işten çıkarmaları bir çevreye inşa etmek mümkündür, ancak önleyici / düşünceli tasarım ve kaynakların etkin kullanımı için makul bir denge nedir?