Cliffhanger: Yedekler doğru… burada… doğru mu?


28

İşimde yedeklerin şaşırtıcı derecede düşük bir önceliği var. Yedekleme stratejisi bir süre önce uygulandı ve o zamandan beri yedeklerin iyi olduğu varsayıldı. Sistem yöneticilerine sorarsanız, her şeyin yedeklendiğini söylerler.

Ancak, ÖZEL bir yedekleme isteğinde bulunduğun zamanın yarısı orada olmaz:

  • Disk doldu
  • Kaset başarısız oldu
  • Birisi yedekleme işini devre dışı bırakmışa benziyor
  • Ağ bağlantısının aksama süresi vardı
  • Diski yıllar önce sipariş ettik, ancak finans satınalma siparişini onaylamadı
  • Dosyalar bozuk
  • Dosya yanlış veritabanı içeriyor
  • Yalnızca işlem günlüğü yedeklemeleri (tam sürüm olmadan işe yaramaz)

Birkaç hafta önce, sunuculardan biri çok fazla sayıda baskın diski kaybettiğinden, felaket yaklaşmıştı. Neyse ki, bir çok kez denediyseniz, bir disk hala verileri kopyalamak için yeterince nazikti.

Fakat bu felaketten sonra bile, sistem yöneticilerini durumu iyileştirmeye ikna edemiyorum. Merak ediyorum, insanların gözlerini açmak için herhangi bir ipucu var mı? Bana öyle geliyor ki, bir uçurumun kenarında yürüyoruz.


17
Yani sadece RAID setini kaybedecek kadar yetersiz sistem yöneticileri değil, aynı zamanda o sistem için bir yedeğe sahip olmayacak kadar işe yaramazlar mı diyorsunuz? Bazı yeni yöneticileri almak için iyi bir dava gibi görünüyor.
PowerApp101

Yanıtlar:


24

Bu şeyleri daima en baştan düzeltmelisin.

Mevcut yedekleme stratejisi yönetim tarafından destekleniyor ve anlaşılıyor mu? Olmazsa, işe yaramaz.

Yürütme yönetiminin, sorunları ve hangi riskleri içerdiğini bilmesi gerekir (hayatta kalmak için yasal olarak sağlamanız gereken finansal verileri mi yoksa toplanması yıllar alan müşteri verilerini mi kaybedersiniz?) birinin (senin gibi) harekete geçmesine izin vermek.

Yönetime ulaşamıyorsanız, şirket kontrolleri veya verinin alınmasının ve bütünlüğünün şirket raporları için önemli olduğu diğer finansal pozisyonları deneyin. Eğer gerekirse, onlar "fırtınayı başlatabilir".


İş politikalarından ve insanlar "fırtınaya başlamaktan" tamamen nefret ediyorum, ancak durum hakkında dürüst gerçeği söylüyorsanız "en üste gitme" ve diğer "fırtına" başlangıçları muhtemelen en iyi / tek yoldur.
Anonim korkak

Kabul, darbeler (amaçlanan hiçbir punto). Fırtına başlangıcı olmak hem can sıkıcı hem de riskli olsa da, bazen yapılması gerekenlerden sadece bir tanesi. Ancak, bu gibi kritik sorunlara gelince, en fazla üç seçenek var: yoksay, ayrıl ya da saldırı. Ve bu tür bir kusuru görmezden gelmek, iyi bir ses gibi gelmiyor.
Oskar Duveborn

14

Nereden başlamalı? Bu gerçekleşmeyi bekleyen bir felaket. Sysadmins birincil iş işlevi, verilerin yedeklenip kurtarılabilir olmasını sağlamaktır. Geri kalan her şey ikincildir. Hayır eğer hayır ama's.

İşte yapabileceğiniz birkaç şey:

  1. Geri yüklemeler için KPI'ları izleyin. Kaç tane geri yükleme isteğinin başarılı olduğunu gösteren bir rapor hazırlamak mümkün olmalıdır. % 100'den az olan herhangi bir şey tamamen araştırılmalıdır. Yönetim aşk raporları ve bu zor bir kanıt.

  2. Tüm sistemler ve yedekleme stratejileri, teyp dönüşleri, zaman çizelgeleri, yükseltme yolları, test geri yüklemeleri vb. Dahil tüm yedekleme ve geri yükleme işlemleri için belgelenmiş prosedürler bulunmalıdır.

  3. Sys yöneticilerinin yöneticisi ile konuşun ve endişelerinizi dile getirin. Geri yükleme çalışmadığını kanıtı ile silahlı git. Eğer neşe yoksa yüksek gidin.

Cidden - yaygarayı tekmelemek. Böyle şeyler bir şirketi mahvedebilir.


Üç denemede "istatistik" inizde
Tobias Kienzler

5

(En azından) yıllık felaket kurtarma testleri önerin. Testi başarıyla uygulamak için gerekli olan çalışma eksiklikleri ortaya çıkarmalıdır.


5

Çalıştığım yerde, ciddi anlamda iyi bir BT departmanımız var, her yıl Avrupa'daki her ofisten bir araya geliyorlar ve bir veri merkezindeki kiralanmış sunuculara bir 'geri yükleme şenliği' düzenliyorlar, personel bir gün işe başlarsa ve ne olursa olsun ne olacağını etkin bir şekilde simüle ediyorlardı. ofis gece boyunca yanmıştı.

Büyük patronu dahil edin, felaket olursa, o yıl bir bonus kazanacağını (veya daha da kötü!) Ve bu yüzden belki de benzer bir felaket kurtarma egzersizi düzenlemenin tedbirli olacağını söyledi. Uzun sürmemeli veya çok fazla masrafa uğramamalı - yöneticiler şirket dışındaki yedekleme bantlarıyla gönderilmekte ve onlardan aynı ofis ortamını getirmelerini söylemişlerdir.

Ardından arkanıza yaslanın ve BT'nin iyileşmesini izleyin - yönetim, şirket verilerinin kalıcı olarak kaybolmaya tehlikeye yakın olduğunu fark ettiğinde, kıvılcımlar uçacak (stratejik olarak söz konusu yöneticilere yerleştirilecek roketlerden)


1
Bu harika!
Oskar Duveborn

4

Yöneticileri suçlamak kolaydır - ancak Oskar haklı: bu şeyler tepeden sürülüyor. Yönetim yedekleri öncelik haline getirmek için para harcamazsa, sistem yöneticileri genellikle şanssız kalır ve ellerinden gelenin en iyisini yaparlar.

Anahtar, bu şanssız yöneticilerden biriyseniz - ve bazı tekneler için bu teknedeyseniz - yönetimin brifing, brifing ve kâğıt izlerini onaylayan bir şekilde brifing edilmesini sağlamalısınız. iş için bir risk.

Stratejim sürekli sorunlara çarpmak. Bunu yaparsanız, bazen sorunlar çözülecek, ancak çoğunlukla, “asla bilgilendirilmedim” bahanesinin arkasına saklanamayacağımı bildirdiğim kimseler öyle oluyor. Bir danışman olarak genellikle daha iyisini yapabilirim. Patronlarımdan, güvenlik açığı olduğunu düşündüğümden daha fazla üst düzey yönetime bilgi verebilirim. Bu, suçu etrafa yayar ya da en azından benden daha yüksek bir seviyeye odaklar.

Aynı zamanda, müşterinin sağlayabileceği her türlü kaynaktan riskleri en aza indirmek için yaratıcı olmanız ve çok çalışmanız gerekir.

Bazı durumlarda yöneticiler suçlu olabilirken, yönetim her zaman sorumludur: ya riski bilmek ve hafifletmek için yeterince yapmamak ya da bu risklere karşı kendilerini uyarmayan insanları işe almak.


3

İngiltere'nin Kuzey Batısı'na yayılmış yaklaşık 200 sunucudan sorumluyum ve bu durum elle kontrol etmek için çok fazla.

Yedeklemeyi, tamamlandıktan sonra yedekleme günlüğünü inceleyen (VBScript) betiğini çalıştıracak, yedeklemenin çalışıp çalışmadığına karar verecek ve yedekleme sonucunu içeren merkezi bir veritabanına bir kayıt yazacak şekilde yapılandırdım. Daha sonra merkez ofiste bu veritabanını sorgulayan ve yedeklemenin hata bildirdiği veya siteden hiç rapor almadığı sitelerin bir listesini sunan bir komut dosyası çalıştırıyorum.

Sonuçta masamda oturduğumda, yedeklemeyi kontrol etmem gereken tüm sitelerin bir listesi vardı.

Tüm bunların amacı, varsayılan varsayımın yedeklemenin başarısız olduğu ve yedeklemenin yalnızca VBScript'im hata tespit etmediğinde ve bu sonucu I veri tabanına yazdığında işe yaradığı kabul edilir . Bu, yedekleme hatalarının fark edilmeden kalmamasını sağlar.

Sunuculardan bazıları Backup Exec, bazıları NTBackup kullanıyor ve bazıları dosyaları ağdaki başka bir sunucuya kopyalanıyor. Sunucuların ne tür bir yedekleme yaptığı hiç önemli değil, hataları kontrol etmek için VBScript'imi değiştirmek kolaylaştı. Benim betiğim aslında oldukça basit, sadece yedekleme raporunu bir metin dosyası olarak açıyor ve "monte edilemedi", "kaset dolu", "CRC hatası" vb. İfadelerini kullanıyor. Profesyonel bir programcının yapabileceğinden eminim kaygan bir iş. Bununla birlikte, her şey basit ve sağlamdır ve yedekleme hatası raporunu görmek isteyip istemediğim anlamında proaktif ve sadece bilinçli olarak raporu görmezden gelmeye karar verirsem bir hatayı fark edemem.

JR

PS Yedekleme hatalarının% 99'u, kullanıcıların yedekleme bandını değiştirmeyi unuttukları içindir. Sadece bayanları sevmiyor musun :-)


Ya da robot kaseti düşürdü (lanet olası robot) ^^ (düşündüğünden daha sık olur)
Oskar Duveborn

2

Test edilmemiş bir yedekleme hiçbir şekilde bir yedekleme değildir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.