Bu sabah, uzun süredir bir ~ 1.5TB okuma işlemi sırasında bir NFS istemcisine veri gönderme, benim md kompleksi-RAID10 dizim kendiliğinden durdu, daha sonra "yeni olmayan" olmak için dört üyeyi bıraktı ve tekrar başlayamadı. Mdstat'ı kontrol etmek, "yedek" kabul edilen tüm sürücüleri gösterir.
Debian 7. 6x HGST Deskstar NAS, dördü bir Marvell 88SE9230 PCIe kartında ve iki tanesi de ICH7 SATA'da çalışıyor. Tüm sürücüler, yeniden tahsis edilmeden SMART'ı geçer. Düşen dört sürücü de tamamen Marvell kartındaydı fakat aynı zamanda sda, sdb, sdc ve sdd idi ve mutlaka test ettiğim ve iyi çalıştığım denetleyici olmadığına inanıyorum.
Bu dizideki tüm verilerin yedeklenmesi gerektiğine inanıyorum, ancak emin değilim ve kullanacağı tüm veriler çok önemlidir. Depolama iş akışım şu an geçiş halinde ve bu verilerin yedekleri her yerde.
Bu şeyin tekrar başlatılmasını nasıl sağlayabilirim? Bazıları her sürücünün arızalanmasını ve çıkarılmasını ve yeniden eklemeyi önerdi, bazıları dizinin --force ile başlatılmasını önerdi ve diğerleri de diziyi --assume-clean ile yeniden oluşturmayı söyledi, ancak hepsinin yalnızca diğer RAID düzeyleriyle ilgili deneyimi var . Onlar ve ben, bunların karmaşık bir RAID10 ile nasıl davranacakları hakkında hiçbir fikrimiz yok ve iyi görünmüyor.
[GÜNCELLEŞTİRME] Cihaz adlarının değiştiğini keşfettim. Bu yüzden işletim sistemi sürücüsü mdstat'ta (yeniden başlatıldıktan sonra) sdg ve syslog'da sdc'dir (dolayısıyla EXT4 montaj mesajı). Şimdi atılan dört tanenin Marvell kontrol cihazında olduğuna inanmıyorum.
1/3 montajlı diziyi durdurdum ve - montajı --scan dört sürücü "(muhtemelen güncel değil)" gösterdi ve geri kalan ikisinden yapılamadı. --Assemble --force komutunu kullanarak tekrar manuel olarak denedim ve 6 sürücüden toplanan FAULTY bayraklarını temizledi, ancak hepsi hala YEDEK olarak işaretlendiğinden hala diziyi başlatamadı. Bu da beni, bu sürücülerin bu RAID10'un kendi fonksiyonel üyeleri olarak tekrar tanınmasını sağlama adımını atıyor, eğer mümkünse ...
mdstat: md0 : inactive sdf[0](S) sdd[5](S) sdc[4](S) sdb[3](S) sda[2](S) sde[1](S) 23441325072 blocks super 1.2 syslog: Dec 13 02:30:02 mWproduction rpc.mountd[2790]: authenticated mount request from 10.10.1.124:993 for /media/MainStore (/media/MainStore) Dec 13 02:33:22 mWproduction kernel: [ 2238.437611] md: md0 stopped. Dec 13 02:33:22 mWproduction kernel: [ 2238.437628] md: unbind Dec 13 02:33:22 mWproduction kernel: [ 2238.456050] md: export_rdev(sdf) Dec 13 02:33:22 mWproduction kernel: [ 2238.456131] md: unbind Dec 13 02:33:22 mWproduction kernel: [ 2238.472043] md: export_rdev(sdd) Dec 13 02:33:22 mWproduction kernel: [ 2238.472130] md: unbind Dec 13 02:33:22 mWproduction kernel: [ 2238.472183] md: export_rdev(sdc) Dec 13 02:33:22 mWproduction kernel: [ 2238.472233] md: unbind Dec 13 02:33:22 mWproduction kernel: [ 2238.476282] md: export_rdev(sdb) Dec 13 02:33:22 mWproduction kernel: [ 2238.476329] md: unbind Dec 13 02:33:22 mWproduction kernel: [ 2238.476369] md: export_rdev(sda) Dec 13 02:33:22 mWproduction kernel: [ 2238.476421] md: unbind Dec 13 02:33:22 mWproduction kernel: [ 2238.480171] md: export_rdev(sde) Dec 13 02:33:27 mWproduction kernel: [ 2243.889311] md: md0 stopped. Dec 13 02:33:27 mWproduction kernel: [ 2243.890748] md: bind Dec 13 02:33:27 mWproduction kernel: [ 2243.890902] md: bind Dec 13 02:33:27 mWproduction kernel: [ 2243.891047] md: bind Dec 13 02:33:27 mWproduction kernel: [ 2243.891190] md: bind Dec 13 02:33:27 mWproduction kernel: [ 2243.891327] md: bind Dec 13 02:33:27 mWproduction kernel: [ 2243.891503] md: bind Dec 13 02:33:27 mWproduction kernel: [ 2243.891528] md: kicking non-fresh sdd from array! Dec 13 02:33:27 mWproduction kernel: [ 2243.891534] md: unbind Dec 13 02:33:27 mWproduction kernel: [ 2243.904065] md: export_rdev(sdd) Dec 13 02:33:27 mWproduction kernel: [ 2243.904079] md: kicking non-fresh sdc from array! Dec 13 02:33:27 mWproduction kernel: [ 2243.904090] md: unbind Dec 13 02:33:27 mWproduction kernel: [ 2243.916138] md: export_rdev(sdc) Dec 13 02:33:27 mWproduction kernel: [ 2243.916155] md: kicking non-fresh sdb from array! Dec 13 02:33:27 mWproduction kernel: [ 2243.916173] md: unbind Dec 13 02:33:27 mWproduction kernel: [ 2243.928029] md: export_rdev(sdb) Dec 13 02:33:27 mWproduction kernel: [ 2243.928039] md: kicking non-fresh sda from array! Dec 13 02:33:27 mWproduction kernel: [ 2243.928046] md: unbind Dec 13 02:33:27 mWproduction kernel: [ 2243.944040] md: export_rdev(sda) Dec 13 02:33:27 mWproduction kernel: [ 2243.962667] md: raid10 personality registered for level 10 Dec 13 02:33:27 mWproduction kernel: [ 2243.963132] bio: create slab at 1 Dec 13 02:33:27 mWproduction kernel: [ 2243.967055] md/raid10:md0: not enough operational mirrors. Dec 13 02:33:27 mWproduction kernel: [ 2243.967264] md: pers->run() failed ... Dec 13 02:33:35 mWproduction kernel: [ 2251.460454] md: md0 stopped. Dec 13 02:33:35 mWproduction kernel: [ 2251.460465] md: unbind Dec 13 02:33:35 mWproduction kernel: [ 2251.480313] md: export_rdev(sdf) Dec 13 02:33:35 mWproduction kernel: [ 2251.480476] md: unbind Dec 13 02:33:35 mWproduction kernel: [ 2251.498418] md: export_rdev(sde) Dec 13 02:33:44 mWproduction kernel: [ 2260.905447] md: md0 stopped. Dec 13 02:33:44 mWproduction kernel: [ 2260.911283] md: bind Dec 13 02:33:44 mWproduction kernel: [ 2260.911576] md: bind Dec 13 02:33:44 mWproduction kernel: [ 2260.911844] md: bind Dec 13 02:33:44 mWproduction kernel: [ 2260.912306] md: bind Dec 13 02:33:44 mWproduction kernel: [ 2260.912475] md: bind Dec 13 02:33:44 mWproduction kernel: [ 2260.912650] md: bind Dec 13 02:42:48 mWproduction shutdown[4245]: shutting down for system reboot