6 RAIDZ yapılmış bir ZFS havuzu var. Tek RAIDZ'de iki diskin birbirine yakın olması nedeniyle, ZFS'nin ikinci disk başarısız olmadan ilk hatadan kurtulamayacağı için RAIDZ'den biri bozulur. Yeniden başlattıktan kısa bir süre sonra "zpool durumu" ndan çıktı:
pool: pod2
state: DEGRADED
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://www.sun.com/msg/ZFS-8000-8A
scrub: resilver in progress for 0h6m, 0.05% done, 237h17m to go
config:
NAME STATE READ WRITE CKSUM
pod2 DEGRADED 0 0 29.3K
raidz1-0 ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F165XG ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F1660X ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F1678R ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F1689F ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F16AW9 ONLINE 0 0 0
raidz1-1 ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F16C6E ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F16C9F ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F16FCD ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F16JDQ ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F17M6V ONLINE 0 0 0
raidz1-2 ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F17MSZ ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F17MXE ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F17XKB ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F17XMW ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F17ZHY ONLINE 0 0 0
raidz1-3 ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F18BM4 ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F18BRF ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_W1F18XLP ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F09880 ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F098BE ONLINE 0 0 0
raidz1-4 DEGRADED 0 0 58.7K
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F09B0M ONLINE 0 0 0
spare-1 DEGRADED 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F09BEN UNAVAIL 0 0 0 cannot open
disk/by-id/scsi-SATA_ST3000DM001-1CH_W1F49M01 ONLINE 0 0 0 837K resilvered
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0D6LC ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0CWD1 ONLINE 0 0 0
spare-4 DEGRADED 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F09C8G UNAVAIL 0 0 0 cannot open
disk/by-id/scsi-SATA_ST3000DM001-1CH_W1F4A7ZE ONLINE 0 0 0 830K resilvered
raidz1-5 ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-1CH_Z1F2KNQP ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0BML0 ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0BPV4 ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0BPZP ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0BQ78 ONLINE 0 0 0
raidz1-6 ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0BQ9G ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0BQDF ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0BQFQ ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0CW1A ONLINE 0 0 0
disk/by-id/scsi-SATA_ST3000DM001-9YN_Z1F0BV7M ONLINE 0 0 0
spares
disk/by-id/scsi-SATA_ST3000DM001-1CH_W1F49M01 INUSE currently in use
disk/by-id/scsi-SATA_ST3000DM001-1CH_W1F4A7ZE INUSE currently in use
disk/by-id/scsi-SATA_ST3000DM001-1CH_W1F49MB1 AVAIL
disk/by-id/scsi-SATA_ST3000DM001-1ER_Z5001SS2 AVAIL
disk/by-id/scsi-SATA_ST3000DM001-1ER_Z5001R0F AVAIL
errors: 37062187 data errors, use '-v' for a list
İlk disk başarısız olduğunda yerine bir yedek ile değiştirdim ve yeniden dirilmeye başladı. Resilver tamamlanmadan önce ikinci bir disk başarısız oldu, bu yüzden ikinci diski başka bir etkin yedekle değiştirdim. O zamandan beri yeniden diriltmeye başlayacak, yaklaşık% 50'sini tamamlayacak ve daha sonra hepsini yiyip işletim sisteminin çökmesine neden olana kadar gobbling belleğini başlatacak.
RAM'i sunucuda yükseltmek bu noktada kolay bir seçenek değildir ve bunu yapmanın bir çözümü garanti edeceği açık değildir. Bu aşamada veri kaybı olacağını anlıyorum, ancak havuzun geri kalanını korumak için bu RAIDZ'nin içeriğini feda edebilirsem, bu kabul edilebilir bir sonuçtur. Bu sunucunun içeriğini başka bir sunucuya yedekleme işlemindeyim, ancak bellek tüketimi sorunu her 48 saatte bir yeniden başlatmayı (veya çökmeyi) zorlar, bu da rsync yedeklememi keser ve rsync'i yeniden başlatmak zaman alır ( kaldığı yeri bulduktan sonra devam edin, ancak bu çok uzun zaman alır).
İki yedek değiştirme işlemi ile uğraşmaya çalışan ZFS'nin bellek tüketimi sorununun kökü olduğunu düşünüyorum, bu yüzden ZFS'nin bir kerede bir tane üzerinde çalışabilmesi için etkin yedeklerden birini kaldırmak istiyorum. Ancak, yedek parçalardan birini ayırmaya çalıştığımda "/ dev / disk / by-id / scsi-SATA_ST3000DM001-1CH_W1F49M01: geçerli çoğaltmaları ayıramıyorum" iletisi alıyorum. Belki de operasyonu zorlamak için -f seçeneğini kullanabilirim, ama bunun sonucunun tam olarak ne olacağı net değil, bu yüzden ilerlemeden önce herhangi bir girdi olup olmadığını görmek istedim.
Sistemi, yedeklemenin tamamlanması için yeterince uzun süre çalışabileceği istikrarlı bir duruma getirebilirsem, elden geçirme için almayı planlıyorum, ancak mevcut koşullar ile bir kurtarma döngüsünde sıkışmış.
zfs-fuse
. Bu gerçekten ZFS Sigortası mı? Lütfen işletim sistemi ayrıntılarını sağlayın.