ZFS - L2ARC önbellek aygıtı hatasının etkisi (Nexenta)


10

NexentaStor depolama birimi olarak çalışan bir HP ProLiant DL380 G7 sunucum var . Sunucuda 36GB RAM, 2 LSI 9211-8i SAS denetleyicisi (SAS genişletici yok), 2 SAS sistem sürücüsü, 12 SAS veri sürücüsü, etkin yedek disk, Intel X25-M L2ARC önbellek ve DDRdrive PCI ZIL hızlandırıcı bulunur. Bu sistem birden çok VMWare ana bilgisayarına NFS sunar. Ayrıca dizide yaklaşık 90-100 GB tekilleştirilmiş veri var.

Performansın aniden toplandığı ve VM misafirlerine ve Nexenta SSH / Web konsollarına erişilemez olduğu ve işlevselliği geri yüklemek için dizinin tamamen yeniden başlatılmasını gerektiren iki olay yaşadım. Her iki durumda da, başarısız olan veya "devre dışı bırakılan" Intel X-25M L2ARC SSD idi. NexentaStor önbellek hatası konusunda beni uyaramadı, ancak (yanıt vermeyen) konsol ekranında genel ZFS FMA uyarısı göründü.

resim açıklamasını buraya girin

zpool statusÇıkış göstermiştir:

  pool: vol1
 state: ONLINE
 scan: scrub repaired 0 in 0h57m with 0 errors on Sat May 21 05:57:27 2011
config:

        NAME                        STATE     READ WRITE CKSUM
        vol1                        ONLINE       0     0     0
          mirror-0                  ONLINE       0     0     0
            c8t5000C50031B94409d0   ONLINE       0     0     0
            c9t5000C50031BBFE25d0   ONLINE       0     0     0
          mirror-1                  ONLINE       0     0     0
            c10t5000C50031D158FDd0  ONLINE       0     0     0
            c11t5000C5002C823045d0  ONLINE       0     0     0
          mirror-2                  ONLINE       0     0     0
            c12t5000C50031D91AD1d0  ONLINE       0     0     0
            c2t5000C50031D911B9d0   ONLINE       0     0     0
          mirror-3                  ONLINE       0     0     0
            c13t5000C50031BC293Dd0  ONLINE       0     0     0
            c14t5000C50031BD208Dd0  ONLINE       0     0     0
          mirror-4                  ONLINE       0     0     0
            c15t5000C50031BBF6F5d0  ONLINE       0     0     0
            c16t5000C50031D8CFADd0  ONLINE       0     0     0
          mirror-5                  ONLINE       0     0     0
            c17t5000C50031BC0E01d0  ONLINE       0     0     0
            c18t5000C5002C7CCE41d0  ONLINE       0     0     0
        logs
          c19t0d0                   ONLINE       0     0     0
        cache
          c6t5001517959467B45d0     FAULTED      2   542     0  too many errors
        spares
          c7t5000C50031CB43D9d0     AVAIL   

errors: No known data errors

Bu, Nexenta içinden herhangi bir uyarı tetiklemedi.

Bir L2ARC arızasının sistemi etkilemeyeceği izlenimindeydim. Ama bu durumda, kesinlikle suçluydu. RAID L2ARC için hiç tavsiye görmedim. Kötü SSD'nin sunucudan tamamen kaldırılması beni tekrar çalıştırdı, ancak cihaz arızasının (ve belki de NexentaStor'dan gelen bildirim eksikliğinin) kaygısı duyuyorum.

Düzenleme - Bugünlerde L2ARC önbellek uygulamaları için mevcut en iyi seçim SSD nedir?


SSD veya SATA bağlantı noktanızın donanım sorunları yaşıyor mu?
tegbains

Bu bir HP SAS arka paneli. Hiç başarısız ya da birçok (Linux) dağıtımda sorun görmedim, ancak başarısızlık yerinde tüketici sınıfı SSD'nin bir işlevi olduğundan eminim. Hatayı kabul edebilirim, ancak kalan diskler ve genel depolama sistemi üzerindeki etki daha büyük sorun.
ewwhite

Özellikle, Nexenta'nın en büyük entegratörü / satıcısı olarak anladığım Pogo Linux, Intel'in belleniminin sonraki sürümleriyle ilgili sorunlar nedeniyle artık L2ARC veya ZIL için bir seçenek olarak Intel X25 cihazları sunmuyor.
Skyhawk

Ve önerilen değiştirme (marka, model, fiyat)?
ewwhite

1
Bu arada, yeni Intel 320 serisi bir L2ARC veya hatta ZIL cihazı olarak denemek ilginç olabilir: kapasitör desteklidir ve yazma dayanıklılığı sınırlı olmasına rağmen (modele bağlı olarak 60 terabayta kadar), kalan aşınma yüzdesi SMART özniteliği E9 kullanılarak izlenmelidir (100'de başlar ve 1'e kadar geri sayılır). Birçok ZFS kullanıcısının, E9'un 1'e yaklaşmasını önlemek için bu cihazı, nispeten büyük bir SLC sürücüsünün maliyetine bile yaklaşmadan bile, sık sık değiştirebileceğinden şüpheleniyorum.
Skyhawk

Yanıtlar:


10

ZFS disk G / Ç yapmaz, ZFS altındaki aygıt sürücüleri disk G / Ç yapar. Aygıt zamanında yanıt vermezse veya bu durumda olduğu gibi, genişleticide diğer tüm aygıtları bozarsa, ZFS'ye bir hata olarak görünmez. Tüm ZFS'nin gördüğü yavaş bir G / Ç.

Intel X-25M sabit yazılımında ağır yükler sırasındaki davranışlarını etkileyen ve sıfırlama fırtınalarına neden olabilecek bir hata var. Bu sorun tüm işletim sistemlerini etkiler ve işletim sistemi katmanında çözülemez. Düzeltmeler veya düzeltme için lütfen donanım sağlayıcınıza başvurun.

Eğer bir okumanın L2ARC tarafından yerine getirilmesi bekleniyorsa, o zaman okuma denenecektir. ZFS daha sonra bir hata bildirmek için alt katman sürücülerine güvenir. Bu durumda sürücü, cihaza ve varsayılan zaman aşımı ayarlarına bağlı olarak G / Ç'nin arızalı olduğunu bildirmeden önce sürücü sıfırlamaya ve 5 dakika kadar yeniden denemeye devam eder. Yalnızca alt katman sürücüleri G / Ç'yi başarısız olarak bildirdikten sonra ZFS havuzu yeniden dener.

NexentaStor'un ses denetimi ve disk denetimi koşucuları ek hata iletileri arar ve e-posta ve hata günlüğü aracılığıyla sizi uyarır. Disk kontrolü koşucusu, 3.1 sürümünde, özellikle SSD'lerde bozuk bellenim tarafından gösterilen koşullar konusunda sizi uyarmaya yardımcı olmak için geliştirilmiştir.

Alt satır: donanımınız arızalı ve düzeltilmesi veya değiştirilmesi gerekiyor.


2
Teşekkür ederim. Bu yüzden artık Intel X-25'i kullanmayacağım. Yeni bir L2ARC SSD cihazının değiştirilmesi için test edilmiş bir öneri istiyorum.
ewwhite

3

X25-M SSD'yi arka panele mi bağlıyorsunuz? Nexenta ile ilgili bilinen bir sorun var ve L2ARC'ye arka panel üzerinden erişiliyor. En iyi seçeneğiniz, SSD'yi doğrudan anakarttaki bir SATA bağlantı noktasına bağlamaktır. AHCI kullanacak şekilde yapılandırıldığından emin olun.

Bu sunucuda kritik bir görev yürütüyorsanız, bir SLC SSD'ye (X25-E veya STEC SSD gibi) geçirdim. Olduğu söyleniyorsa, muhtemelen X25-M ile iyi olacaksınız.


Evet, normal bir sürücü yuvasından bağlanıyorum. L2ARC ile aynı Intel SSD ile çalışan başka kurulumlarım var (Sun ve HP donanımında). Yine de bu sorun bana sıkıntı verdi. Araştırmalarım L2ARC'nin ZIL kadar sağlam olması gerekmediğini gösterdi (bu nedenle SLC ve PCI tabanlı ZIL çözümlerinin ve L2ARC için bir tüketici sürücüsünün kullanılması). Bu değişti mi?
ewwhite

SSD'yi doğrudan anakarta takmayı ve çalışıp çalışmadığını görmeyi deneyeceğim. Yedek çalışan bir X25-M'niz varsa, mevcut olanı değiştirmeyi deneyebilir ve SSD'nin kendisinin kötü olup olmadığını görebilirsiniz. SLC SSD'de: Risk seviyenize bağlıdır. Hiçbir zaman aşağıya inemeyen ve hızlı çalışması gereken bir SLA üzerinde yazılım kullanıyorsanız, yüksek kaliteli bir SSD satın almak daha ucuz olabilir.
zippy

Çevrimiçi olarak gördüğüm makalelerin ve tartışmaların çoğunda Intel X25-M'nin L2ARC için önerildiğini söylemeye çalışıyorum. Artık durum böyle değilse, tercih edilen cihaz nedir?
ewwhite

1
@whwhite: Teoride, LFSARC cihazının arızalanması rahatsız edici olmamalı çünkü ZFS sadece disk okumaya geri dönebilir (açıkçası performans bir darbe alacaktı). Pratikte .. Eh, SSD davranışı tarafından tetiklenen bir ZFS veya scsi sürücü hatası vurmuş gibi geliyor.
Tom Shaw

1
@whwhite: Muhtemelen size daha pratik tavsiyeler vermeliyim. Sisteminizin bir sonraki takozunda bir sistem çökmesi dökümü oluşturmak istiyorsanız, buradaki talimatları izleyin . Bu tür çöplükler Illumos geliştiricileri için yararlı olabilir.
Tom Shaw

0

Ed, nispeten makul fiyattan oldukça darn pahalıya kadar kullanabileceğiniz birkaç tane var. Her durumda SAS SSD'leri kullanmayı tercih ediyorum ve hem STEC hem de Pliant ile çok iyi iş çıkardım. Her ikisi de artık ünlü bir L2ARC cihazı olan bir MLC sürücüsü sunuyor. Henüz test edilmedi, ancak yakında SSS SAS 2.0 olan ve "pahalı değil" olduğu söylenen Seagate'in SSD teklifi. Bizi izlemeye devam edin....

Pb

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.