Bir güç arızasından sonra CentOS 6 Sunucu VM Ana Bilgisayarını nasıl kontrol edebilirim?


9

Bu öğleden sonra, ofisimizde birisi dışarıda fırtına olduğu için sunucumuzdan fişi çekmeye karar verdi. Kapatmadılar, çalışırken fişi çıkardılar.

Sunucuda yazılım RAID 10 yapılandırmasında 4 SATA sürücüsü ve RAID'in üstünde çalışan LVM vardır. Sunucu CentOS 6.2 Minimal çalıştırıyor ve KVM kullanan bir sanal makine ana bilgisayarı. Fişi prizden çekildiği sırada, bilgisayarda çalışan birçok konuk makinesi vardı. Her misafirin doğrudan sabit disk olarak kullandığı bir veya daha fazla LVM bölümü vardır. Konuk bölümler EXT3, EXT4 ve NTFS'dir. Ana işletim sistemi bir EXT4 bölümünde.

Daha sonra, güç geri geldiğinde, o kişi onu tekrar taktı ve çalışmaya başladı. Önce bir monitöre takmadan taktıklarından, ekranda ne olduğunu görmenin bir yolu yoktur. Şimdi bir monitör takmayı denedim, ancak monitör önyüklemeye bağlı olmadığı sürece çalışmaz. Bir şeyleri bertaraf etmek istemediğim için bazı tavsiyelerde bulunana kadar bunu olduğu gibi bıraktım.

SSH üzerinden sunucuya girebilirim. Bir günlüğünde yararlı olabilecek bir şey olması durumunda henüz yeniden başlatmadım.

Yapmam gereken şey, eğer mümkünse tüm diskleri ve bölümleri veri bütünlüğü açısından kontrol etmektir. RAID 10'un bir çeşit bellek tabanlı önbellek kullandığını düşünüyorum ve sürücülerin tutarsız olmasından veya ipucunda henüz yazılmamış sürücüye yazmak için bir şeyler varsa dosyaların bozuk olduğundan endişeleniyorum.

[root@othello ~]# cat /proc/mdstat
Personalities : [raid10] [raid1] 
md2 : active raid1 sdc1[2] sda1[0] sdd1[3] sdb1[1]
      102388 blocks super 1.0 [4/4] [UUUU]

md0 : active raid10 sda3[0] sdc3[2] sdd3[3] sdb3[1]
      1952289792 blocks super 1.1 512K chunks 2 near-copies [4/4] [UUUU]
      bitmap: 0/15 pages [0KB], 65536KB chunk

md1 : active raid10 sdc2[2] sda2[0] sdd2[3] sdb2[1]
      1022976 blocks super 1.1 512K chunks 2 near-copies [4/4] [UUUU]

unused devices: <none>

Ayrıca dizilerimi "yakın kopyalar" olarak adlandırdığı beni rahatsız ediyor. Bu normal mi?

Sürücülerde ve verilerde her şeyin yolunda olduğundan emin olmak için ne tür disk kontrolleri yapmalıyım? Kontrol etmem gereken başka şeyler var mı?

GÜNCELLEME

MDDAM Çıkışı - Detay

[root@othello ~]# mdadm --detail /dev/md0
/dev/md0:
        Version : 1.1
  Creation Time : Sat Feb 25 09:26:20 2012
     Raid Level : raid10
     Array Size : 1952289792 (1861.85 GiB 1999.14 GB)
  Used Dev Size : 976144896 (930.92 GiB 999.57 GB)
   Raid Devices : 4
  Total Devices : 4
    Persistence : Superblock is persistent

  Intent Bitmap : Internal

    Update Time : Sun Mar 11 12:59:30 2012
          State : active 
 Active Devices : 4
Working Devices : 4
 Failed Devices : 0
  Spare Devices : 0

         Layout : near=2
     Chunk Size : 512K

           Name : othello.myserver.com:0  (local to host othello.myserver.com)
           UUID : 58ba40ab:12516733:e3779362:68200fdd
         Events : 2208

    Number   Major   Minor   RaidDevice State
       0       8        3        0      active sync   /dev/sda3
       1       8       19        1      active sync   /dev/sdb3
       2       8       35        2      active sync   /dev/sdc3
       3       8       51        3      active sync   /dev/sdd3

Yanıtlar:


3

RAID iyi, tüm UUUU'lar dizideki tüm disklerin dolu olduğu anlamına gelir. Şimdilik bunun için endişelenmem bile.

VM'lere gelince, üzerinde fscks çalıştırmak istiyorsanız, VM'leri durdurun ve çalıştırın

fsck.ext3 (ext4, etc) /path/to/lvm (genellikle / dev / vg-name / lv-name gibi)

KVM kullanıyorsanız, VM'lere virshihtiyacınız olan her şeyi yapmak için kullanabilmeniz gerekir. İşte virsh adam sayfasına bir link http://linux.die.net/man/1/virsh

Raid dizilerinizde gerçekten disk denetimleri yapmak istiyorsanız, tek bir kullanıcı moduna yeniden başlatmanız veya canlı bir cd'den önyükleme yapmanız gerekir, böylece tek tek / dev / mdX aygıtlarını fsck edebilirsiniz. Birincil dosya sistemi EXT4 olduğundan, rahatsız etmem, elektrik kesintileri olan EXT3'ten çok daha iyi.


+1, yarın deneyecek.
Nick

1

Mddadm --detail / dev / md0'ı (md1 ve md2 için aynı) deneyin.

O zaman burada verilen tavsiyeleri deneyin: http://linas.org/linux/raid.html


mdadm --detail /dev/md0Yukarıdakilerin çıktısını gönderdim . Bağladığınız kılavuzu okudum, ancak EXT4 dosya sistemlerinden bahsetmiyor ya da özellikle bütünlüğü kontrol etmek için ne yapabilirim?
Nick

Dosya sistemi türü, RAID bütünlüğü açısından önemli olmamalıdır. Bir bakım süreniz varsa, etkilenen dosya sistemlerini ve fsckbunların bağlantılarını kaldırabilirsiniz . RAID cihazlarını kendileri kontrol etmek istiyorsanız, benzer bir şey yapabilirsiniz echo "check" > /sys/block/md0/md/sync_action. Ya da bir tür mdadm onarım yapmak için "onarım" yankı.
cjc

Bunu yarın deneyeceğim ve rapor vereceğim.
Nick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.