Bu durumdan nasıl güvenle çıkarım?
Detaylar aşağıdaki gibidir:
Bir xen sunucusunda VM'lere ayrılmış blok cihazları vardır. Ancak bu cihazlar Xen'in içine de monte edilmiştir.
Aslında bu blok cihazların 44'ü bu şekilde monte edilmiştir. Daha da kötüsü, her fiziksel cihaz 4 yol üzerinde görülür ve her biri ayrı bir bağlantı noktasına monte edilir. Başka bir deyişle, cihazlar aslında her biri 5 kez monte edilir.
VM konuk işletim sistemi yolu bir PowerPath sözde aygıtı (domU'ya bir phy: blok aygıtı olarak ayrılır) aracılığıyla görür
Bazı cihazlar ext2 ve reiserfs olarak biçimlendirilmiştir.
Burada yer alan dosya sistemi bozulma risklerini açıklamaya gerek yok.
Korkarım ki sadece dosya sistemlerini ayırmak yolsuzluğa neden olabilir ve bu noktada ana bilgisayardan gücü çekmenin en güvenli seçenek olduğunu hissediyorum .
Tüm VM'lerde uygulamaların, çoğunlukla Oracle veritabanlarının, hala çalışmakta ve kullanımda olduğunu unutmayın.
Dom0'da yüksek CPU kullanımını araştırırken bunu keşfettim. / Dev / sdf1 dizininden / dev / emcpowerr'a ait olan cwd -> / media / disk-12 ile bir unkillable "find" işlemi vardır.
Birisi sormadan önce, süreçlerin öldürülemeyeceğini ve CPU ve RAM'i kullanmaya devam edemediğini (geçersiz / zombi işleminin aksine), olağanüstü taahhüt edilmiş G / Ç'ler olduğu zaman, örneğin senkronizasyon geri döndü, ancak henüz fiziksel olarak diskte değil . Daha yaygın olarak bu, bant G / Ç'sinde meydana gelir.
Öneriler!?
PS Ben bu tür bir şey önlemek için, monte kez cihazlar "ayrılmış" beklenirdi? Yoksa Linux'ta bu mümkün değil mi?
EDIT: Öncelikle hiper yönetici içinde KDE) suçlu olduğuna ikna oldum. KDE, masaüstü simgeleri oluşturmak için günlüğe kaydedebileceği cihazları monte ediyor gibi görünüyor. Ancak aynı şey diğer Xen sunucularında da gerçekleşmiyor, ancak diğer tüm sunucular SLES ve KDE'nin çok daha eski bir sürümünü çalıştırıyor ... V4, 3.4 daha iyi davranan rahatsız edici gibi görünüyor).
Dahası, kritik olmayan iki VM asıldı. Onları kapattıktan sonra dosya sistemi bozulması nedeniyle yeniden önyükleme olmaz. Ana / üretim VM hala çalışıyor ve üzerindeki veritabanı hala çalışıyor, ama açıkça bu bir saatli bomba. Müşteri, ortamı başka bir sunucudaki başka bir VM'de yeniden oluşturmaya çalışıyor, ancak bazı bileşenlerin yapılandırılmasıyla ilgili sorunlara takıldı, bu yüzden bekliyoruz ...
Her halükarda, cevapların hiçbirinin şu ana kadar "en iyi uygulama her zaman zarif bir şekilde kapatıldığından" daha fazla olmadığını hissediyorum ve umarım daha somut bir şey elde etmeyi umuyorum ... Her durumda, bu durumun biraz daha dikkatli olabileceğini hissediyorum. düşünce. Kapatmak, olağanüstü IO'nun, özellikle hiper yöneticiden gelen dosya sistemi meta veri güncellemelerinin senkronize edilmesine ve büyük olasılıkla büyük dosya sistemi bozulmasına neden olur mu?