Birkaç düzine Proxmox sunucumuz var (Proxmox Debian üzerinde çalışıyor) ve ayda bir kez bir tanesinde çekirdek paniği olacak ve kilitlenecek. Bu kilitlemelerin en kötü yanı, küme yöneticisinden ayrı bir anahtarda olan bir sunucu olduğunda, bu anahtardaki diğer tüm Proxmox sunucularının, gerçekten çökmüş olan sunucuyu bulana ve yeniden başlatana kadar yanıt vermeyi durdurmasıdır.
Proxmox forumunda bu sorunu bildirdiğimizde, Proxmox 3.1'e yükseltmemiz tavsiye edildi ve bunu son birkaç aydır devam ediyoruz. Ne yazık ki, Proxmox 3.1'e geçirdiğimiz sunuculardan biri Cuma günü bir çekirdek paniği ile kilitlendi ve yine aynı anahtardaki tüm Proxmox sunucularına, çökmüş sunucuyu bulana ve yeniden başlatana kadar ağ üzerinden erişilemedi.
Eh, anahtardaki neredeyse tüm Proxmox sunucuları ... Aynı anahtardaki Proxmox sunucularının hala Proxmox sürüm 1.9'daki Proxmox sunucularının etkilenmediğini ilginç buldum.
Kilitlenen sunucunun konsolunun ekran görüntüsü:
Sunucu kilitlendiğinde, Proxmox 3.1'i çalıştıran aynı anahtardaki sunucuların geri kalanına erişilemez hale geldi ve aşağıdakileri bildiriyordu:
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
...etc...
uname-kilitli sunucunun çıktısı:
Linux ------ 2.6.32-23-pve #1 SMP Tue Aug 6 07:04:06 CEST 2013 x86_64 GNU/Linux
pveversion -v çıktısı (kısaltılmış):
proxmox-ve-2.6.32: 3.1-109 (running kernel: 2.6.32-23-pve)
pve-manager: 3.1-3 (running version: 3.1-3/dc0e9b0e)
pve-kernel-2.6.32-23-pve: 2.6.32-109
İki soru:
Çekirdek paniğine ne sebep olabileceğine dair ipuçları var mı (yukarıdaki resme bakın)?
Aynı anahtar ve Proxmox sürümündeki diğer sunucular neden kilitli sunucu yeniden başlatılana kadar ağdan kesilsin ki? (Not: Aynı anahtarda, etkilenmeyen eski 1.9 Proxmox sürümünü çalıştıran başka sunucular da vardı. Ayrıca, aynı 3.1 kümesinde aynı anahtarda olmayan başka Proxmox sunucuları etkilenmedi.)
Herhangi bir tavsiye için şimdiden teşekkürler.