Linux altında SSD için yazma döngüleri veya beklenen ömür nasıl belirlenir?


10

Bir süredir bir Linux (RHEL 5) sunucusunda bir SSD (Intel X25-M) çalıştırıyoruz, ancak geçen yıl ne kadar yazma yükü olduğunu anlamak için hiçbir zaman çaba göstermedik. Linux altında bize zaman içinde yaklaşık olarak ne kadar diske yazıldığını veya daha ne kadar yıprandığını söyleyen bir araç var mı? Sadece ölüme yakın olup olmadığını görmek için bir ipucu arıyorum ...

Yanıtlar:


13

Intel SSD'ler toplam yazma ve istatistiklerin kullanım ömrü boyunca istatistiklerini tutar.

Aşağıdakiler Intel X25-M G2 160 GB'tır (SSDSA2M160G2GC)

# smartctl -data -A /dev/sda
smartctl 5.40 2010-10-16 r3189 [x86_64-redhat-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       6855
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       68
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148487
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       3168
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       1
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       1950295543
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

Host_Writes_32MIB ham değeri, bu sürücüye kaç adet 32MiB birim veri yazıldığını gösterir.

Media_Wearout_Indicator değeri, sürücünün yararlı aşınma ömrü boyunca ne kadar normal bir yüzde olduğunu gösterir. Bu 100'de başlar (veya 099, hangisini unuturum) ve 001'e kadar iner, bu noktada Intel sürücünün kullanım ömrünü aştığını düşünür. Intel, MWI'yı garanti taleplerinin bir parçası olarak da kullanır - MWI 001'e ulaştığında garantinin süresi dolar.

001'e ulaşan MWI, sürücünün hemen arızalanacağı anlamına gelmez! Intel, flaş birimlerindeki varyanslarla başa çıkmak için yerleşik bir toleransa sahip olacak. Sürücülerin bu noktadan çok daha uzun sürdüğünü gördüm ve ne kadar daha uzun sürdüklerini görmek için bazı Intel 320 serisi SSD'leri aktif olarak test ediyorum.

Ancak, MWI 001'e ulaştığında garanti süresi sona erdiğinde, bu noktada tüm sürücüleri değiştiririm.


Gelecekte Media_Wearout_Indicatorbaşvurmak üzere Intel 520 Serisi SSD'm için 100'den başlıyor.
pableu

Sürücü 001'e ulaştığında "başarısız" olmasa bile, bir noktadan sonra (belki de uzun bir yoldan sonra), bazı sürücülerin güç kaybolduğunda verileri tutma yeteneğinin endişe verici derecede kısa sürelere düştüğünü belirtmek gerekir. . Çevrimiçi olarak yayınlanan ve bunu ölçen bazı dayanıklılık testleri olduğunu düşünüyorum.
sa289

6

Corsair diskleri de benzer bir ömür boyu sol göstergesi verir. Onların durumunda 231 özelliği:

231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0

(Eğer smartctl bunu bir Sıcaklık olarak gösteriyorsa, cihaz veritabanınızı güncellemeniz gerektiğini unutmayın. Debian sistemimde bu, çalışan anlamına gelir /usr/sbin/update-smart-drivedb)

Bir Corsair blog yazısı , değerin asla% 10'un altına düşmediğini gösteriyor, bu yüzden% 10 olarak değiştirilmesi gerektiğini varsayıyorum.

Aynı SSD_Life_Left değerini de veren aynı Sandforce denetleyicisine sahip bir OCZ diskim var.


3

Media_Wearout_Indicator aradığınız şeydir. 100 için SSD'niz% 100 ömür demektir, daha düşük sayı daha az ömür demektir.

# smartctl -a /dev/sda | grep Media_Wearout_Indicator

Dizüstü bilgisayarımdan çıktı

233 Media_Wearout_Indicator 0×0032 100 100 000 Old_age Always – 0

Sürücünüzden daha fazla ayrıntı ve tam özellik görmek istiyorsanız,

# smartctl -data -A /dev/sda

ve çıktı

# smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-49-generic] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0×0032 100 100 000 Old_age Always – 0
9 Power_On_Hours 0×0032 000 000 000 Old_age Always – 232959027031342
12 Power_Cycle_Count 0×0032 100 100 000 Old_age Always – 279
170 Unknown_Attribute 0×0033 100 100 010 Pre-fail Always – 0
171 Unknown_Attribute 0×0032 100 100 000 Old_age Always – 0
172 Unknown_Attribute 0×0032 100 100 000 Old_age Always – 0
174 Unknown_Attribute 0×0032 100 100 000 Old_age Always – 278
184 End-to-End_Error 0×0033 100 100 090 Pre-fail Always – 0
187 Reported_Uncorrect 0×0032 100 100 000 Old_age Always – 0
192 Power-Off_Retract_Count 0×0032 100 100 000 Old_age Always – 278
225 Load_Cycle_Count 0×0032 100 100 000 Old_age Always – 10752
226 Load-in_Time 0×0032 100 100 000 Old_age Always – 65535
227 Torq-amp_Count 0×0032 100 100 000 Old_age Always – 66
228 Power-off_Retract_Count 0×0032 100 100 000 Old_age Always – 65535
232 Available_Reservd_Space 0×0033 100 100 010 Pre-fail Always – 0
233 Media_Wearout_Indicator 0×0032 100 100 000 Old_age Always – 0
241 Total_LBAs_Written 0×0032 100 100 000 Old_age Always – 10752
242 Total_LBAs_Read 0×0032 100 100 000 Old_age Always – 21803
249 Unknown_Attribute 0×0013 100 100 000 Pre-fail Always – 357

http://namhuy.net/1024/how-to-check-ssd-life-left.html


Bu durumda normalleştirilmiş değerin kullanılması gerektiğini belirtmek yararlıdır.
Falcon Momot

1

Pek sayılmaz. Sürücü istatistikleri tutmazsa, kesin olarak bilemezsiniz. O zaman bile, sürücü, sistem çağrılarından ve arayüzlerinden uzakta, başlık altındaki şeyleri optimize etmeye çalışmak için yazma seviyelendirme algoritmalarını soyutlayacaktır. Başka bir deyişle, sürücü, verilerin "medyada" gerçekte nerede yazıldığı konusunda size kolayca yalan söyleyebilir, böylece hangi hücrelerin aktivite aldığını bilemezsiniz.

Bu hala ne zaman hata veya hata göreceğinizi / göreceğinizi garanti etmez. Sürüş yarın başarısız olabilir, üç yıl içinde başarısız olabilir.

En iyi seçenek, onu bir RAID yapılandırmasında tutmak ve başarısız olduğunda (diğer sürücü arızalanmadan önce) değiştirmek ve yedeklemelerinizin güncel olduğundan emin olmak için bir plan yapmaktır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.