SSD'de veya ortamın aşınma seviyesinde kalan yaşam nasıl kontrol edilir?


31

Hepimiz SSD'lerin sınırlı bir önceden belirlenmiş ömre sahip olduğunu biliyoruz. Linux'ta SSD'nin şu anki sağlık durumunun ne olduğunu nasıl kontrol edebilirim?

Çoğu Google arama sonucu, Media_Wearout_Indicator adlı bir yüzde alanı veya mevcut olmayan Longterm Data Endurance gibi diğer jargon göstergeleri gibi SMART bilgilerini aramanızı ister - bu mevcut değil - Evet, iki SSD'yi de kontrol ettim. Üçüncü bir SSD bulabilirdim ama alanların standart olmadığını hissediyorum.

Burada sorunu göstermek için iki örnek.


İlk SSD ile, hangi alanın havanın seviyesini gösterdiği açık değildir. Ancak, RAW VALUE değeri 1 ile 100 arasında olan yalnızca bir Unknown_Attribute var, bu yüzden aradığımızı ancak söyleyebilirim:

    $ sudo smartctl -A /dev/sda                                             
    smartctl 6.2 2013-04-20 r3812 [x86_64-linux-3.11.0-14-generic] (local build)
    Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

    === START OF READ SMART DATA SECTION ===                                 
    SMART Attributes Data Structure revision number: 1                       
    Vendor Specific SMART Attributes with Thresholds:                        
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      5 Reallocated_Sector_Ct   0x0002   100   100   000    Old_age   Always       -       0
      9 Power_On_Hours          0x0002   100   100   000    Old_age   Always       -       6568
     12 Power_Cycle_Count       0x0002   100   100   000    Old_age   Always       -       1555
    171 Unknown_Attribute       0x0002   100   100   000    Old_age   Always       -       0
    172 Unknown_Attribute       0x0002   100   100   000    Old_age   Always       -       0
    173 Unknown_Attribute       0x0002   100   100   000    Old_age   Always       -       57
    174 Unknown_Attribute       0x0002   100   100   000    Old_age   Always       -       296
    187 Reported_Uncorrect      0x0002   100   100   000    Old_age   Always       -       0
    230 Unknown_SSD_Attribute   0x0002   100   100   000    Old_age   Always       -       190
    232 Available_Reservd_Space 0x0003   100   100   005    Pre-fail  Always       -       0
    234 Unknown_Attribute       0x0002   100   100   000    Old_age   Always       -       350
    241 Total_LBAs_Written      0x0002   100   100   000    Old_age   Always       -       742687258
    242 Total_LBAs_Read         0x0002   100   100   000    Old_age   Always       -       1240775277

Yani bu SSD yeniden yazma ömrünün% 57'sini kullandı, doğru mu?


Diğer diskte, SSD_Life_Left ATTRIBUTE göze çarpıyor, ancak% 0 ömrünün kaldığını belirten 0 Ham değeri, tehlikeli bir durumda olmadıkça (birkaç gün içinde göreceğiz), görünüşte sağlıklı bir SSD için olası değildir ve "% 0 kullanım ömrü" yazıyorsa, yıpranmış bir sabit disk için de imkansızdır (yıpranmış = bir yıldan uzun süredir kullanılmaktadır).

    > sudo /usr/sbin/smartctl -A /dev/sda
    smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.11.6-4-desktop] (SUSE RPM)
    Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

    === START OF READ SMART DATA SECTION ===
    SMART Attributes Data Structure revision number: 10
    Vendor Specific SMART Attributes with Thresholds:
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      1 Raw_Read_Error_Rate     0x000f   104   100   050    Pre-fail  Always       -       0/8415644
      5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0
      9 Power_On_Hours_and_Msec 0x0032   100   100   000    Old_age   Always       -       4757h+02m+17.130s
     12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1371
    171 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
    172 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
    174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       52
    177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       2
    181 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
    182 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
    187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
    194 Temperature_Celsius     0x0022   030   030   000    Old_age   Always       -       30 (Min/Max 30/30)
    195 ECC_Uncorr_Error_Count  0x001c   104   100   000    Old_age   Offline      -       0/8415644
    196 Reallocated_Event_Count 0x0033   100   100   000    Pre-fail  Always       -       0
    231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
    233 SandForce_Internal      0x0000   000   000   000    Old_age   Offline      -       3712
    234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       1152
    241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       1152
    242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       3072

SMART özniteliklerinde, düşük değerler daha kötüdür çünkü sürücü her zaman bir değerin eşik değerden düşük (veya buna eşit değil? Emin değil) olduğunu bildirir. Olduğu söyleniyor, bir aşınma göstergesi olması çok güzel, ama umarım herhangi bir depolama aygıtına ait değerli verilere güvenmiyorsunuzdur. RAID düzeninde birden fazla depolama aygıtı çalıştırıyor olmalısınız.
Alexios

Verilerimin 'değerli' olduğunu nereden biliyorsun? Bu sadece benim şirketin dizüstü bilgisayarıma knowledgabase bir çevrimdışı kopyasıdır. İnsanların bir sysop senaryosunu çok sık varsaydıklarına dikkat çekmek için yorum yapıyorum. Yine de yorumlarınız için teşekkürler.
Tankman,

Tüm veriler değerlidir. :) Bu ilkeye başlıyoruz, daha sonra daha değerli (örneğin bir fotoğrafçının dijital fotoğrafları) ve daha az değerli (işletim sistemi - değiştirilmesi kolay, ancak kesinti ve zaman / gelir kaybı) olan verilere geçiyoruz. değiştirin).
Alexios

Her iki sürücü de dayanıklılık sınırları dahilinde. İlk sürücüde sadece 350 GiB, ikinci sürücüde 1.1 TiB var. Burada neler olduğundan emin değilim ...
bwDraco

Yanıtlar:


19

İlk örneğinizde, bahsettiğiniz şey, 233 niteliğindeki Intel sürücülerindeki "Medya Dokuması Göstergesi" dir. Evet, 100'ü yepyeni, kullanılmayan bir sürücü ve 0-100 arasında değişen 0 tamamen yıpranmış. Çıktınıza göre, bu alan mevcut görünmüyor.

İkinci örnekte, lütfen SSD_Life_Left hakkındaki resmi belgeleri okuyun . Bu sayfa başına:

Bu özelliğin RAW değeri her zaman 0'dır ve hiçbir anlamı yoktur. Bunun yerine normalleştirilmiş VALUE değerini kontrol edin. 100'de başlar ve kalan SDD ömrünün yaklaşık yüzdesini gösterir. Flash blokları bozuk olarak işaretlendiğinde genellikle azalır, Retired_Block_Count'un RAW değerini görün

Smartctl'nin (8) ne dediğini tam olarak anlamanız ve varsayımlarda bulunmamanız çok önemlidir. Ne yazık ki, SMART araçları her zaman en son SSD'ler ve özellikleriyle güncel değildir. Bu nedenle, çiplerin kaç kere yazıldığını söylemenin her zaman temiz bir yolu yoktur. Yapabileceğiniz en iyi şey, sizin durumunuzda "6568" olan "Power_On_Hours" 'a bakmak, ortalama disk kullanımınızı belirlemek ve hesaplamak.

Sürücünüzün özelliklerini arayabilmeli ve yongaları yapmak için kullanılan işlemi belirlemelisiniz. 32nm işlem yongaları, 24nm işlem yongalarından daha uzun bir yazma dayanıklılığına sahip olacaktır. Ancak, "ortalama" olarak, muhtemelen en az 1.000 ve en fazla 6.000 olmak üzere yaklaşık 3.000 ila 4.000 yazma beklediğiniz anlaşılıyor. Öyleyse, 64GB'lık bir SSD'niz varsa, aşınma seviyesini varsayarak SSD'ye yazılan toplam 192TB ila 256TB civarında bir yerde beklemelisiniz.

Örnek olarak, sürücünüze 11 KB / sn kullanmaya devam ediyorsanız, saatte yaklaşık 40 MB yazılmasını bekleyebilirsiniz. Saatte 6568 çalışan, diske yaklaşık 260 GB yazmışsınız. Muhtemelen yaklaşık 200 TB toplam yazı yazabileceğini bilmek, başarısızlıktan önce, yongaları yıpratma nedeniyle başarısızlıktan yaklaşık 600 yıl önce var. Diskiniz muhtemelen yıpranmış kapasitörlerden veya voltaj regülasyonundan dolayı başarısız olacaktır.


9
Çok açık, teşekkür ederim. Bu bilgi en iyi smartctl veya API'sini kullanan bir GUI aracına yapılır. Afterall, bilgisayarı bir giriş aygıtı olarak kullanarak bir hesap makinesiyle hesaplama yapar ve önünde bir işlemci olarak oturan bir insan, bilgisayarların icat edildiği ruhuna aykırıdır!
Tankman 六四

Bağlantınız ölü gibi görünüyor
Skeleton Bow

15

Samsung SSD'ler için, SMART niteliği 177'yi (Aşınma Düzeyi Sayısı) kontrol edin.

ID # 177 Aşınma Dengeleme Sayısı

Bu özellik, medya programı ve silme işlemlerinin sayısını (bir bloğun silinme sayısı) gösterir. Bu değer doğrudan SSD'nin ömrü ile ilgilidir. Bu özelliğin ham değeri toplam P / E Döngüsü sayısını gösterir.

Kaynak: http://www.samsung.com/global/business/semiconductor/minisite/SSD/M2M/download/07_Communicating_With_Your_SSD.pdf

Aşınma seviyesi göstergesi 100'de başlar ve söyleyebileceğimden doğrusal olarak 1'e düşer. 1'de, sürücü nominal p / e çevrimlerinin tümünü aşmış olacak, ancak gerçekte sürücünün toplam dayanıklılığı bu değeri önemli ölçüde aşabilir.

Kaynak: http://www.anandtech.com/show/7173/samsung-ssd-840-evo-review-120gb-250gb-500gb-750gb-1tb-models-tested/3

Bu değeri bir tuz taneleri ile aştığınızla ilgili son ifadenizi almanızı öneririm.


Link şimdiye kadar öldü.
Calculus Knight

Sanırım Wear_Leveling_Count için geriye doğru bir siparişleri var. Ben 2 Samsung SSD var ve ~ 4 yaşında bir RAW_VALUE 42 ve bir diğerinde ~ 1 aylık bir RAW_VALUE var. 0'da başlıyor ve yukarı doğru artışlar var.
John Eikenberry

4

Intel marka bir SSD'niz yoksa: Dikkatli olun! Samsung SSD aygıtım var ve smartmontools / smartctl etiketindeki hatalı özelliklerden dolayı tamamen yanıldım. Intel dışında bir şey varsa - (inane) ağrı hikayemi https://askubuntu.com/a/460463/65722 adresinde bulabilirsiniz .

Bilgi-kalite harcanan zaman-kazma oranınız benimkinden daha iyi olsun!


0

LSI baskın kartı bulunan bir sunucuya sahip olduğumda 7 Samsung SSD var.

Öyle ki

  • / dev / sda, Raid Controller tarafından JBOD olarak işaretlenmiş işletim sistemim SSD'dir.
  • Diğer 7 SSD'ler yalnızca / dev / sdb olarak görünür çünkü RAID 0 (veya RAID-a).

baskın denetleyicisinin arkasındaki disklerin bilgisini almak için püf noktası

smartctl --scan

{output is}
/dev/sda -d scsi # /dev/sda, SCSI device
/dev/sdb -d scsi # /dev/sdb, SCSI device
/dev/bus/0 -d megaraid,8 # /dev/bus/0 [megaraid_disk_08], SCSI device
/dev/bus/0 -d megaraid,9 # /dev/bus/0 [megaraid_disk_09], SCSI device
/dev/bus/0 -d megaraid,10 # /dev/bus/0 [megaraid_disk_10], SCSI device
/dev/bus/0 -d megaraid,11 # /dev/bus/0 [megaraid_disk_11], SCSI device
/dev/bus/0 -d megaraid,12 # /dev/bus/0 [megaraid_disk_12], SCSI device
/dev/bus/0 -d megaraid,13 # /dev/bus/0 [megaraid_disk_13], SCSI device
/dev/bus/0 -d megaraid,14 # /dev/bus/0 [megaraid_disk_14], SCSI device
/dev/bus/0 -d megaraid,15 # /dev/bus/0 [megaraid_disk_15], SCSI device

sonra gibi smartctl bilgi almak için

  • WEAR_LEVELING_COUNT
  • POWER_ON_HOURS
  • TEMPERATURE_CELCIUS ve diğer tüm iyi şeyler

her disk için yapmak

smartctl -d megaraid,8 -all /dev/bus/0
smartctl -d megaraid,9 -all /dev/bus/0
smartctl -d megaraid,10 -all /dev/bus/0
{down to}
smartctl -d megaraid,15 -all /dev/bus/0

sözdizimi smartctl'in olansmartctl [options] <device>

çoklu diskler / dev / sdb, / dev / sdc, / dev / sdd gibi çoklu aygıtlar göstermediğinde, bu şekilde bir baskın kartı içine girip girersiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.