Debian Squeeze kullanarak birkaç OpenVZ konteyneri kullanarak bir sunucu çalıştırıyorum. Kaplar çoğunlukla Squeeze, bazıları Lenny ve bazıları zaten Wheezy'ye güncellendi. Ana bilgisayar iptables ve DHCP'nin ötesinde bunu yapmaz. Dosya sunucuları, proxy'ler, posta sunucuları, kerberos, LDAP, ... kapsayıcılara konur. Sistem yıllarca istikrarlı bir şekilde çalıştı ve bir yıl boyunca bazı güvenlik duvarı kuralları dışında önemli bir değişiklik yapmadı.
2 gün önce aniden sistem çöktü. Tekrar gündeme getirirken çok fazla sorun yaşadım. İlk başta ssh ile giriş yapmama izin vermedi. root girişi 'Siz yoksunuz' tarafından reddedildi. Çekip gitmek!' Yerel giriş iyiydi. Bir süre sonra ssh tekrar çalıştı. Tesadüf olarak, bash geçmişinden satırı tekrar kullanmadım, ancak üç kez kontrol edilen satırla aynı olan, daha önce çalışmayan ancak çökmeden önce çalışan yeni bir komut yazdım.
Sonra sistem çalıştı, ancak çoğu protokolde ağ trafiği SYN ACK'nın ardından engellendi. DNS, Telnet ve SSH iyiydi, ancak geri kalanı bir karışıklıktı. Birkaç saat sonra karanlıkta balık tuttuktan ve güvenlik duvarını birkaç kez tekrar yükledikten sonra aniden her şey yolunda gitti. Günlüklerde şüpheli bir şey bulamadım - ama adli tıp uzmanı değilim.
Bugün dosya sunucusunun nscd'si, kap kotası nedeniyle LDAP ile bağlantı kurmak için yuvalardan çıktı. Daha önce hiç olmamış bir şey. Ayrıca smbd tarafından iddia edilen çok fazla soket gördüm (> 30).
/ var / log / messages sistem günlüğü ile aynı görünüyordu . /var/log/kern.log kilitlenme nedenleriyle ilgili şu ek bilgilere sahipti:
/var/log/kern.log:2950:Sep 19 10:46:57 asgard kernel: [6529441.320086] INFO: task sendmail:32181 blocked for more than 120 seconds.
/var/log/kern.log:2982:Sep 19 10:48:57 asgard kernel: [6529561.324525] INFO: task kdmflush:1932 blocked for more than 120 seconds.
/var/log/kern.log:3005:Sep 19 10:48:57 asgard kernel: [6529561.324694] INFO: task xfssyncd:10162 blocked for more than 120 seconds.
/var/log/kern.log:3027:Sep 19 10:48:57 asgard kernel: [6529561.324934] INFO: task postgres:16827 blocked for more than 120 seconds.
/var/log/kern.log:3060:Sep 19 10:49:51 asgard kernel: [6529561.325129] INFO: task imapd:31749 blocked for more than 120 seconds.
/var/log/kern.log:3084:Sep 19 10:49:51 asgard kernel: [6529561.325248] INFO: task cleanup:32194 blocked for more than 120 seconds.
/var/log/kern.log:3106:Sep 19 10:50:57 asgard kernel: [6529681.324028] INFO: task flush-253:3:3216 blocked for more than 120 seconds.
/var/log/kern.log:3142:Sep 19 10:50:57 asgard kernel: [6529681.324224] INFO: task kjournald:6859 blocked for more than 120 seconds.
/var/log/kern.log:3166:Sep 19 10:50:57 asgard kernel: [6529681.324366] INFO: task syslogd:11720 blocked for more than 120 seconds.
/var/log/kern.log:3198:Sep 19 10:50:57 asgard kernel: [6529681.324574] INFO: task postgres:16827 blocked for more than 120 seconds.
/var/log/kern.log:7152:Sep 19 19:29:41 asgard kernel: [ 1440.617090] INFO: task sendmail:11892 blocked for more than 120 seconds.
Son 'sendmail' çökmesi makineyi yeniden başlattıktan sonra oldu. O zamandan beri böyle bir olay olmadı. 'imapd' ve 'postgres' kesinlikle farklı kaplarda çalışır.
Hiç sigara silahı görmüyorum, ama muhtemelen sadece körüm. Sistemi bilinen / varsayılan iyi yedeklemelerden kurmak, çok iyi nedenler olmadan denemek için beni çok zorlayacaktı.
Bundan sonra ne kontrol etmek için herhangi bir tavsiye için teşekkür ederiz.
Yardımın için teşekkürler.
Güncelleme : Bazı çökme ön imlecini aramak için daha fazla çaba koyarak syslog aşağıdakileri buldum:
Sep 19 10:09:56 asgard ntop[7965]: **WARNING** packet truncated (8754->8232)
Sep 19 10:09:56 asgard ntop[7965]: **WARNING** packet truncated (8754->8232)
Sep 19 10:09:56 asgard ntop[7965]: **WARNING** packet truncated (10490->8232)
Sep 19 10:09:56 asgard ntop[7965]: **WARNING** packet truncated (8754->8232)
Sep 19 10:09:56 asgard ntop[7965]: **WARNING** packet truncated (8754->8232)
Sep 19 10:09:56 asgard ntop[7965]: **WARNING** packet truncated (17442->8232)
Sep 19 10:11:02 asgard ntop[7965]: **WARNING** packet truncated (11650->8232)
Sep 19 10:11:02 asgard ntop[7965]: **WARNING** packet truncated (10202->8232)
Sep 19 10:11:29 asgard ntop[7965]: **WARNING** packet truncated (8754->8232)
Sep 19 10:13:27 asgard ntop[7965]: **WARNING** packet truncated (8754->8232)
Sep 19 10:20:33 asgard ntop[7965]: **WARNING** packet truncated (8754->8232)
Bunun eleştirel olmadığını biliyorum, ama nadir bir olay gibi görünüyor. Paket kesilmesi yalnızca ikinci kilitlenme gününde oluşur. Kullanılabilir tüm günlük dosyalarında başka hiçbir yerde yok.