İşlevsel MD kompleksi RAID10, tüm sürücüleri aniden yedek olarak işaretler


1

Bu sabah, uzun süredir bir ~ 1.5TB okuma işlemi sırasında bir NFS istemcisine veri gönderme, benim md kompleksi-RAID10 dizim kendiliğinden durdu, daha sonra "yeni olmayan" olmak için dört üyeyi bıraktı ve tekrar başlayamadı. Mdstat'ı kontrol etmek, "yedek" kabul edilen tüm sürücüleri gösterir.

Debian 7. 6x HGST Deskstar NAS, dördü bir Marvell 88SE9230 PCIe kartında ve iki tanesi de ICH7 SATA'da çalışıyor. Tüm sürücüler, yeniden tahsis edilmeden SMART'ı geçer. Düşen dört sürücü de tamamen Marvell kartındaydı fakat aynı zamanda sda, sdb, sdc ve sdd idi ve mutlaka test ettiğim ve iyi çalıştığım denetleyici olmadığına inanıyorum.

Bu dizideki tüm verilerin yedeklenmesi gerektiğine inanıyorum, ancak emin değilim ve kullanacağı tüm veriler çok önemlidir. Depolama iş akışım şu an geçiş halinde ve bu verilerin yedekleri her yerde.

Bu şeyin tekrar başlatılmasını nasıl sağlayabilirim? Bazıları her sürücünün arızalanmasını ve çıkarılmasını ve yeniden eklemeyi önerdi, bazıları dizinin --force ile başlatılmasını önerdi ve diğerleri de diziyi --assume-clean ile yeniden oluşturmayı söyledi, ancak hepsinin yalnızca diğer RAID düzeyleriyle ilgili deneyimi var . Onlar ve ben, bunların karmaşık bir RAID10 ile nasıl davranacakları hakkında hiçbir fikrimiz yok ve iyi görünmüyor.

[GÜNCELLEŞTİRME] Cihaz adlarının değiştiğini keşfettim. Bu yüzden işletim sistemi sürücüsü mdstat'ta (yeniden başlatıldıktan sonra) sdg ve syslog'da sdc'dir (dolayısıyla EXT4 montaj mesajı). Şimdi atılan dört tanenin Marvell kontrol cihazında olduğuna inanmıyorum.

1/3 montajlı diziyi durdurdum ve - montajı --scan dört sürücü "(muhtemelen güncel değil)" gösterdi ve geri kalan ikisinden yapılamadı. --Assemble --force komutunu kullanarak tekrar manuel olarak denedim ve 6 sürücüden toplanan FAULTY bayraklarını temizledi, ancak hepsi hala YEDEK olarak işaretlendiğinden hala diziyi başlatamadı. Bu da beni, bu sürücülerin bu RAID10'un kendi fonksiyonel üyeleri olarak tekrar tanınmasını sağlama adımını atıyor, eğer mümkünse ...

mdstat:

md0 : inactive sdf[0](S) sdd[5](S) sdc[4](S) sdb[3](S) sda[2](S) sde[1](S)
      23441325072 blocks super 1.2


syslog:

    Dec 13 02:30:02 mWproduction rpc.mountd[2790]: authenticated mount request from 10.10.1.124:993 for /media/MainStore (/media/MainStore)
    Dec 13 02:33:22 mWproduction kernel: [ 2238.437611] md: md0 stopped.
    Dec 13 02:33:22 mWproduction kernel: [ 2238.437628] md: unbind
    Dec 13 02:33:22 mWproduction kernel: [ 2238.456050] md: export_rdev(sdf)
    Dec 13 02:33:22 mWproduction kernel: [ 2238.456131] md: unbind
    Dec 13 02:33:22 mWproduction kernel: [ 2238.472043] md: export_rdev(sdd)
    Dec 13 02:33:22 mWproduction kernel: [ 2238.472130] md: unbind
    Dec 13 02:33:22 mWproduction kernel: [ 2238.472183] md: export_rdev(sdc)
    Dec 13 02:33:22 mWproduction kernel: [ 2238.472233] md: unbind
    Dec 13 02:33:22 mWproduction kernel: [ 2238.476282] md: export_rdev(sdb)
    Dec 13 02:33:22 mWproduction kernel: [ 2238.476329] md: unbind
    Dec 13 02:33:22 mWproduction kernel: [ 2238.476369] md: export_rdev(sda)
    Dec 13 02:33:22 mWproduction kernel: [ 2238.476421] md: unbind
    Dec 13 02:33:22 mWproduction kernel: [ 2238.480171] md: export_rdev(sde)
    Dec 13 02:33:27 mWproduction kernel: [ 2243.889311] md: md0 stopped.
    Dec 13 02:33:27 mWproduction kernel: [ 2243.890748] md: bind
    Dec 13 02:33:27 mWproduction kernel: [ 2243.890902] md: bind
    Dec 13 02:33:27 mWproduction kernel: [ 2243.891047] md: bind
    Dec 13 02:33:27 mWproduction kernel: [ 2243.891190] md: bind
    Dec 13 02:33:27 mWproduction kernel: [ 2243.891327] md: bind
    Dec 13 02:33:27 mWproduction kernel: [ 2243.891503] md: bind
    Dec 13 02:33:27 mWproduction kernel: [ 2243.891528] md: kicking non-fresh sdd from array!
    Dec 13 02:33:27 mWproduction kernel: [ 2243.891534] md: unbind
    Dec 13 02:33:27 mWproduction kernel: [ 2243.904065] md: export_rdev(sdd)
    Dec 13 02:33:27 mWproduction kernel: [ 2243.904079] md: kicking non-fresh sdc from array!
    Dec 13 02:33:27 mWproduction kernel: [ 2243.904090] md: unbind
    Dec 13 02:33:27 mWproduction kernel: [ 2243.916138] md: export_rdev(sdc)
    Dec 13 02:33:27 mWproduction kernel: [ 2243.916155] md: kicking non-fresh sdb from array!
    Dec 13 02:33:27 mWproduction kernel: [ 2243.916173] md: unbind
    Dec 13 02:33:27 mWproduction kernel: [ 2243.928029] md: export_rdev(sdb)
    Dec 13 02:33:27 mWproduction kernel: [ 2243.928039] md: kicking non-fresh sda from array!
    Dec 13 02:33:27 mWproduction kernel: [ 2243.928046] md: unbind
    Dec 13 02:33:27 mWproduction kernel: [ 2243.944040] md: export_rdev(sda)
    Dec 13 02:33:27 mWproduction kernel: [ 2243.962667] md: raid10 personality registered for level 10
    Dec 13 02:33:27 mWproduction kernel: [ 2243.963132] bio: create slab  at 1
    Dec 13 02:33:27 mWproduction kernel: [ 2243.967055] md/raid10:md0: not enough operational mirrors.
    Dec 13 02:33:27 mWproduction kernel: [ 2243.967264] md: pers->run() failed ...
    Dec 13 02:33:35 mWproduction kernel: [ 2251.460454] md: md0 stopped.
    Dec 13 02:33:35 mWproduction kernel: [ 2251.460465] md: unbind
    Dec 13 02:33:35 mWproduction kernel: [ 2251.480313] md: export_rdev(sdf)
    Dec 13 02:33:35 mWproduction kernel: [ 2251.480476] md: unbind
    Dec 13 02:33:35 mWproduction kernel: [ 2251.498418] md: export_rdev(sde)
    Dec 13 02:33:44 mWproduction kernel: [ 2260.905447] md: md0 stopped.
    Dec 13 02:33:44 mWproduction kernel: [ 2260.911283] md: bind
    Dec 13 02:33:44 mWproduction kernel: [ 2260.911576] md: bind
    Dec 13 02:33:44 mWproduction kernel: [ 2260.911844] md: bind
    Dec 13 02:33:44 mWproduction kernel: [ 2260.912306] md: bind
    Dec 13 02:33:44 mWproduction kernel: [ 2260.912475] md: bind
    Dec 13 02:33:44 mWproduction kernel: [ 2260.912650] md: bind
    Dec 13 02:42:48 mWproduction shutdown[4245]: shutting down for system reboot

Yanıtlar:


1

Sorun çözüldü. Tüm sürücülerde mdadm -E yapmam önerildi. Şimdi, dizinin zorla yeniden birleştirildiğini, sürücülerin dışındakilerin hepsinin AAAAAA dizisi statüsüne sahip olduğunu ortaya çıkardı. /dev/sde Durumunun AA'ya sıkışmış olması .... (iki aktif, dört etkin değil) ve bu bir çeşit anomali olduğunu gösteriyor.

Sürücüleri tekrar monte ettim. --force, ihmal /dev/sde ve gerekli olduğunu belirtti --run çünkü bütün üyelerin katılmasını istedi. --Run ile dizi doğru bir şekilde başlatıldı, bozuldu. Şimdi kalan diski test ediyorum, her şeyin yedeklendiğini tekrar kontrol ediyorum ve diziye tekrar ekliyorum.

Kullanıcıların değerli girişleri için sırasıyla irc.freenode.net #linux ve #mdadm spreeuw ve mumixam kullanıcılarına büyük, büyük teşekkür ederiz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.