Her şey patladığında kontrol listen ne?


40

Kullanıcılar e-postalarına ulaşamıyor, CEO şirketin ana sayfasına ulaşamıyor ve çağrı cihazınız bir "911" koduyla kapandı. Her şey patladığında ne yaparsın?

Yanıtlar:


35

İlk cevap sakin ol! Panik yapmanın zor yolunun işleri daha da kötüleştirdiğini öğrendim. Bu başarıldıktan sonra bir sonraki şey sorunun ne olduğunu tespit etmek. Kullanıcılardan ve yöneticilerden gelen şikayetler, her açıdan size, onların ne yapamayacağını ancak sorunun ne olduğunu söyleyemez.

Sorunu öğrendikten sonra sorunu çözme planını başlatabilir ve kızgın kullanıcılarınıza zaman ölçeği vermeye başlayabilirsiniz!


3
Bu reaktif bir plan. Gerçek bir felaket kurtarma planı zaten her kritik iş süreci için yazılmış ve test edilmiştir.
spoulson,

3
spaulson emin: ama yapılacak ilk şey, planı aktif hale getirmenizin gerekip gerekmediğini veya devre kesiciyi çevirmenizin her şeyi düzelttiğidir.
pjz

1
Bu aslında yapılacak en iyi şey, MÜKEMMEL POST! Sırtınızdaki tüm baskıyı kaldırabilmek zorunda kaldıktan sonra, yukarıdaki yorumlarda da belirtildiği gibi, herkes ofisinize koşarak istedikleri yere gidebileceklerini söyleyecektir. Aslında kullanıcılar çoğu zaman bu anda gerçekten bencilcedirler ve hiç anlamak istemezler, sadece onların işlediğini ve geri kalanı umursamadıklarını isterler ... Bu yüzden yazınıza tamamen katılıyorum !
Marc-Andre R.

"Sorunu" belirtilerden ayırmak için +1.
bmb

59

Sakin ol

Korkma. Nefes almak! (Diyaframdan yardımcı olur.) Meditasyon okuduysanız, bu da yardımcı olabilir.

Aşırı stres ile karşı karşıya kaldığınızda, vücudunuz bir uçuş veya savaş moduna girecektir, çünkü vücudunuz bunun ölüm kalım durumunda olduğunu düşünür. Bu zamanda vücudunuz aslında beyninizin bazı kısımlarına daha az kan pompalar ve mantık yürütme gibi işlevleri azaltır. Bu, etkin bir şekilde IQ'nuzu içgüdüsel olarak düşürür, rasyonellik yerine, beyin fonksiyonlarınızı domine etmeye başlar. Daha önce sıcak bir tartışmaya girdiyseniz ya da tanık olduysanız, bu semptomları insanların duygularının parlaması ve rasyonelliğin bir tatil geçirmesi olarak tanıyabilirsiniz. Daha sonra, insanlar soğuma şansına sahip olduklarında, bir hata yaptığını veya yanlış olduğunu kabul etmeyi daha fazla kabul edeceklerdir ve diğer tarafı daha çok görme yeteneğine sahip olacaklardır, ancak o anın sıcağında, daha az.

Kompozisyonunuzu korumak ve zihninizi sizinle ilgili tutmak, beyninizi tam kapasitede çalışır durumda tutacak ve duygu ve korkudan ziyade delil ve gerekçelere dayanan rasyonel kararlar almanızı sağlayacaktır.

aciliyetine göre sıralama

En düşük faydayı kullanarak en yüksek faydayı elde etmek için sınırlı kaynakların verimli bir şekilde uygulanması burada çok önemlidir. Kararları mümkün olan en erken, hangi şeylerin düzeltilmesi gerektiğine karar verin, HEMEN ŞİMDİ, bir süre bekleyebilir (saat, gün) ve hangisi sonsuza kadar bekleyebilir. Ayrıca, bir şeyin kurtarılamaz olduğu ve kurtarılmaya değer olmadığı zamanları fark etmeyi de öğrenin (örn. Yönlendiricinin yarısı erimiş, sadece bir taneniz olsa bile, kaydedemezsiniz, yeni bir tane satın alın ve acele sonrası siteye alın ya da bulabilecek bir şeyler bulun) boşluğu geçici olarak doldurun).

Durumsal Farkındalığı Koru

Dikkatinizin bazı ilginç problemlerden veya henüz tam olarak anlamadığınız bir şeyden hapsolmasına izin vermeyin. Büyük resme ve çalışan en önemli şeylere odaklanmaya devam edin.

Bilimsel Yöntemi Kullan

Bir hipotez oluşturun. Bu hipotezi nasıl test edeceğinizi belirleyin. Hipotezi test etmek için veri toplayın. Verileri de onaylamamaya bakın. Hipotezinizi düzeltin ve harekete geçmek için hipotezinize yeterince güveninceye kadar çevrimi gerektiği kadar tekrarlayın.

Pragmatik olun

Şimdi dogmanın zamanı değil. Felaketten kurtarırken burada ve orada birkaç kısayol almak sorun değil. Bu aslında teknik borç tahakkuk ediyor. Birçok şirkette, felaket başarısızlığı, felaketten kaynaklanan gelir kaybı anlamına gelir. Titreşimli bir ayak bile olsa, işleri daldırmaktan ve şirketinizin geçimliliğini riske atmaktan iyidir. Her zaman olduğu gibi, burada yargılama son derece önemlidir. Bazen bir sunucu rafına işaret eden bir kutu fanı yükseltmek mantıklı olur, bazen değil.

Kendine iyi bak

Ne zamandır bu acil durum üzerinde çalışıyorsun? En son ne zaman su içtin? En son ne zaman yedin? Ne zamandır uyanıksın? Acil bir durum olduğu için kendinizi yakmayın, sulandırmak, beslenmek ve dinlenmek için zaman ayırın (uzun, çok günlük bir slog olması durumunda).

İşe Alım Yardımı

Şirketinizde hem motive hem de yardım alabilecek yetenekli kişiler var. Etrafta koşuşturup çok fazla insanın sorun yaşamasına neden olmaktan kaçının. Ayrıca can sıkıcı insanlara "ateş tiryakisi" uygulayarak bunlara karşı dikkatli olun. Zaten yardım etmek isteyen kişileri bulun, hedeflenen görevlerde çalışmalarını sağlayın ve insanların birbirleriyle iletişim kurduğundan emin olun.

İletişim kurmak

İletişim kritik. Hiçbir şey bilinmeyen kadar korkutucu değildir. İnsanlar bir şeyden başka bir şey bozulduğunu bilmediğinde, X saat içinde geri alınacağına dair boş bir ifade sadece hafif güven vericidir (X saat geçtikten ve işler hala kırıldıktan sonra daha az güven vericidir). Oyundaki baskılar sizi aşırı iyimser WAG zaman tahminleri vermeye yönlendirebilir, ancak bu yanlış bir seyir. Sadece üzerinde çalıştığını söyleme, sadece X zamanına göre her şey düzelecek deme. Açık olun, işleminizi gösterin, ilerlemenizi ve başarısızlıklarınızı ayrıntılandırın. Soruna, onu takip etme sürecinize ve işleri düzeltmeye yönelik planınıza (insanlar minutia'da boğulmasa da) fikir verin. Problemin çözülemez olmadığını gösterin, sonuçta işlerin doğru yapılacağını gösterin, sorun konusunda yetkin insanlar olduğunu gösterin,


2
Çok iyi - Mümkünse işe alım yardımı eklerim
Brent

@Brent ah evet, bunu eklemek istedim. Yine de o bölüm için doğru ifadeyi henüz anlamadım.
Kama





8

Önce temelleri kontrol edin, aptal görünüyor, ancak

  1. Sunucu tesisinde güç açık mı? (site dışında barındırıyorsanız)
  2. Hosting sağlayıcınız devre dışı mı?

Sorunun tersine gittiğinde bir çözüm aramak için zaman harcayabileceğini biliyorum.


2
evet - eğer hepsi bitiyorsa - veri merkezini - ve destek forumlarını kontrol edin. Çevrimiçi ortamda 30 kişi varsa, genellikle 3 olduğunda - vantilatöre çarpıyor.
Alister Bulman,

6

Ping yapıyorum. Bundan sonra olan şey, ping sonuçlarına bağlı olarak büyük ölçüde değişir.


Bugün bu yöntemi kullandı. PC'lerin çoğu yazdırılamadı. Ping ping veritabanı sunucusuna çalıştı, tamam. Ping yazıcı lisans sunucusu denendi, yanıt yok. Sonuç = Sunucu hatası!
Swinders

Güzel nokta;) Başka bir şey yapmadan önce günde birçok kez yapıyorum. Bu aslında çok zaman kazandırıcı: P
Marc-Andre R.




2

Henüz bir şeyi tamir etmeye çalışmayın.

Gerçek, altta yatan sorunun ne olduğunu tam olarak bildiğinizden emin olun. Şimdi işleri tamir etmeye başladım. Düzeltmek için birden fazla şey varsa, hangi şeylerin ertelenebileceğini (umarım bir sonraki iş gününe kadar, en azından!) Ve hangilerinin şimdi düzeltilmesi gerektiğini dikkatlice düşünün.

Fakat en önemlisi: Her şey işe yaradığında, neden "her şey patladı" diye sorun. Bunu tekrar önlemek için ne yapacaksın? O takdirde daha kolay bir çözüm yapacak adımlar var mı yok tekrar yaşanmaması?


1

İnsanların bilmesini sağlayın, üzerinde olduğunuzu ve mümkünse, işlerin normale döneceği zaman hakkında bir tahmin verin.

Gerçek sorun giderme gelince, bu açıkça neyin yanlış olduğuna bağlı. Genelde çeşitli hizmetler için "check status" komut dosyası koleksiyonu tutarım.


Bu neden moral bozuldu? Bana geçerli bir nokta gibi geliyor.
Adriano Varoli Piazza

Bu mükemmel bir nokta. Önleme, büyük felaketlerden kaçınmanın anahtarıdır;)
Marc-Andre R.

1

Kabloları kontrol et! Basit bir Eth0 kablo takası problemi çözdüğünde diğer şeyleri kontrol ederken saatlerimi kaybettim ...


Aslında bir kablo sebepsiz yere ölmez. Yığın, sargı veya başka bir koruma yöntemi iyi değilse ve herkesin onunla oynayabileceği, aslında evet, bir kablonun kırılması muhtemeldir. Aksi takdirde, hiçbir sebep yoktur.
Marc-Andre R.

0

Acil durum planlarınız olmalı.

Temel sistemler, otomatik yük devretme veya belgelenmiş ve test edilmiş bir kurtarma planı ile tasarlanmalıdır.

Sistem ne kadar önemliyse, o kadar fazla esneklik sağlamalısınız ve o kadar otomatik olmalıdır.

Eğer bir tane yoksa, o zaman önemli değildi, değil mi!


0

Özgeçmişinizin yedeğinin güvende olduğundan emin olun :) O zaman,

Ortaklıkları bulun. Etkilenen tüm sistemlerde ortak olan nedir.

Neyin değiştiğini bulun. Kuruluşunuzda bazı resmi değişiklik yönetimine devam etmeniz gerekir.

Yeni adam nerede ... patron nerede ...? Bir tanesi kestirme mi oldu? (sadece hızlı bir sunucu yeniden başlatmasıdır, ne zarar verebilir ki)



0

Açıklamadan belirli bir dizi eylem sağlamak zordur. İlk hamleniz şu şekilde olacak:

  • Neredesin
  • Sizinle iletişim kuran kişiden ne kadar bilgi sıkılabildiğinizi
  • Sorun gidermede (veya bilgi aramada) hangi acil araçlara sahipsiniz?
  • Ağınızın fiziksel ve mantıksal yolları hakkında bilginiz
  • Ne kadar yardımınız var (takımın bir parçası mı yoksa yalnız ninja mı?)

Açıkçası, elinizdeki konuyla ilgili sakin ve uyanık olmanız gerekir. Ağ sorunlarını giderme konusundaki deneyiminiz, bunun çok önemsiz bir şey olabileceğini, örneğin:

  • Bağlantısı kesilmiş bir kablo
  • Haber verilmeyen bir bakım (başka bir teknoloji “işleri düzeltiyor”)
  • CEO'nuz, bir dizüstü bilgisayar kablosuz bağlantısının kesilmesinden sonra şirketin peynirli pizza yapması nedeniyle tamamen mahkum olduğu konusunda aşırı tepki gösteriyor.

Bunu söyledikten sonra, aşağıdaki kategorilerde ciddi bir şey de olabilir:

  • Fiziksel Taşıma (bağlantı)
  • Donanım (yönlendirici \ anahtar \ sunucu)
  • Depolama (erişilemiyor \ ele geçirilmedi
  • Yazılım (Servis> Yanlış yapılandırılmış \ Saldırılmış \ çevrimdışı)

Kilit bileşen, konuyla ilgili ne kadar bildiğinizdir. Referans noktan ne? (hangi açıdan 'sistem çökertildi')?



0

Basit başlayın ve saçma doğru çalışın.

Güç?

Ethernet?

Program çalışıyor mu?

...

Uzaylılar?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.