İyi bir işkence testi aracı var mı?


17

Son zamanlarda SSD'nin hatası olduğundan şüpheleniyorum garip ve nadir dosya sistemi bozulması yaşıyorum. İyi bir sürücü işkence testi aracı arıyorum. Tüm diske yazabilen, daha sonra geri dönüp uçan yazma, bozuk bloklar, eski revizyonlara döndürülen bloklar ve diğer hataları aramak için okuyan bir şey. Bu, olandan çok daha fazlası olurdu badblocks. Böyle bir araç var mı?

Not Bir performans ölçütü aramıyorum ve zaten SMART durumunu kontrol ettim; diyor sağlıklı ve kötü blok bildirilmedi.


1
Denedin mi? iozone.org
positron

1
Btw, hangi işletim sistemi / sistem donanımını kullandığınızı belirtmediniz. SSD (ler) in güç tasarrufu yapmak için sabit sürücüyü sık sık kapatmak üzere yapılandırıldığında bazı Mac OS X kutularında bahsettiğiniz bozulmayı yaşadıkları bildirildi. Bu yolsuzluğa neden olacaktır. Sürücünün bir SSD'ye verilen bir sabit sürücü gücü ile uykuya zorlanması durumunda, diğer OS / Donanım kombinasyonlarında da aynı olduğunu düşünürüm. Sürücü testiyle SSD'nizi yakmadan önce sisteminizin yapılandırmasını kontrol ederim.
Wing Tang Wong

1
@WingTangWong, vay canına. Birçok SSD'nin güç kaybettiklerinde vidalanmaya hazırlandım, ancak uykuya geçmeleri istendiğinde? Bu bir arabası. Buna dikkat edeceğim. Linux kullanıyorum ve belki de sistemi askıya aldığımda uyku yok ...
psusi

Yanıtlar:


10

Aşırıya kaçabilir ama Phoronix Test Suite var . Orada da var bonnie++, hem de hdparm.

Genellikle kullanıyorum hdparm, örneğin:

% hdparm -Tt /dev/hdb
/dev/hdb:
 Timing buffer-cache reads:   128 MB in  1.25 seconds =102.40 MB/sec
 Timing buffered disk reads:  64 MB in 16.70 seconds =  3.83 MB/sec

Ben demem hdparmbir işkence testi ama size sürücüler genel performans kabaca bir fikir veriyor.

Bir sürücünün sağlığını belirleme

Sürücüye işkence yaptıktan sonra, sürücünün genel sağlığını kontrol etmek için bu komutu kullanabilirsiniz:

% sudo udisks --dump | grep -A 24 Updates
 Attribute       Current|Worst|Threshold  Status   Value       Type     Updates
===============================================================================
 raw-read-error-rate         103| 99| 34   good    5854752     Pre-fail Online 
 spin-up-time                100| 99|  0    n/a    0           Pre-fail Online 
 start-stop-count             98| 98| 20   good    2785        Old-age  Online 
 reallocated-sector-count    100|100| 36   good    0 sectors   Pre-fail Online 
 seek-error-rate              72| 60| 30   good    25872884688 Pre-fail Online 
 power-on-hours               89| 89|  0    n/a    424.4 days  Old-age  Online 
 spin-retry-count            100|100| 97   good    0           Pre-fail Online 
 power-cycle-count            98| 98| 20   good    2753        Old-age  Online 
 attribute-184               100|100| 99   good    0           Old-age  Online 
 reported-uncorrect          100|100|  0    n/a    0 sectors   Old-age  Online 
 attribute-188               100| 96|  0    n/a    0           Old-age  Online 
 high-fly-writes             100|100|  0    n/a    0           Old-age  Online 
 airflow-temperature-celsius  58| 42| 45 FAIL_PAST 42C / 108F  Old-age  Online 
 g-sense-error-rate          100|100|  0    n/a    124         Old-age  Online 
 power-off-retract-count     100|100|  0    n/a    15          Old-age  Online 
 load-cycle-count              1|  1|  0    n/a    248327      Old-age  Online 
 temperature-celsius-2        42| 58|  0    n/a    42C / 108F  Old-age  Online 
 hardware-ecc-recovered       45| 38|  0    n/a    5854752     Old-age  Online 
 reallocated-event-count      89| 89| 30   good    14877766723263 Pre-fail Online 
 current-pending-sector      100|100|  0    n/a    0 sectors   Old-age  Online 
 offline-uncorrectable       100|100|  0    n/a    0 sectors   Old-age  Offline
 udma-crc-error-count        200|200|  0    n/a    0           Old-age  Online 
 attribute-254               100|100|  0    n/a    0           Old-age  Online 

Disk sağlığı / bakım araçları

Çalıştığım aşağıdaki 2 aracı kullanarak iyi bir başarı elde ettik. HDAT2 ve Spinrite . İkincisi ticari bir araçtır, ancak eski HDAT2 bir açık kaynak projesidir.

İşte HDAT2'nin birkaç ekran görüntüsü:

ss # 1 HDAT2

ss # 2 HDAT2

Sisteminizi her ikisine de yeniden başlatmanız gerekir, bu nedenle bu işlemleri gerçekleştirirken çevrimdışıdır, ancak her ikisi de başarısız olan veya arıza göstermeye başlayan sürücüler kurtardı. HDAT2'deki kullanıcı arayüzü gezinmek için biraz kaba, genellikle varsayılan seçenekleri çoğunlukla kullandık ve oradan çok fazla dolaşmamaya çalıştık.


Bahsettiğiniz ilk üçü performans kriterleri. Zaten SMART durumunu kontrol ettim ve kötü sektörler olmadan iyi, bu yüzden HDAT2 de aradığım şey değil gibi görünüyor.
psusi

HDAT2'yi yoksaydım, chkdsks'i çalıştırıyorduk ve onlar da temizdi, ancak disk hala önyüklenebilir değildi, HDAT2'yi çalıştırmak diski önyüklenebilir hale getirmek için yeterince tamir edebilen diskle ilgili yüzey sorunlarını bulabildi.
slm

Geç bir yorum, ama ben başarı ile HDAT2 kaynak kodu bulmaya çalışıyorum. Son zamanlarda yapılan bir lisans değişikliği oldu mu?
i336_

4

bonnie ++ akla geliyor:

Yani, kutunuzun donanım yapılandırmasına bağlı olarak:

bonnie++ -d /path/to/mounted/ssd -r your-system-ram-size-in-MB

Misal:

# For a 32GB system with the SSD formatted and mounted at /mnt/mounted-ssd-001
bonnie++ -d /mnt/mounted-ssd-001 -r 32000

Cihazınıza iyi bir stres testi vermelidir. Siz de özelleştirebilirsiniz.

SSD ile, bozuk bir blok oluştuğunda, çalıştığınız sürücüye bağlı olarak sürücü donanımı tarafından otomatik olarak yeniden eşleştirilebilir. Ayrıca, bir işkence testi SSD'nizin yazma ömründe yiyor. Bu nedenle, kendi takdirinize bağlı olarak kullanın.

DÜZENLE:

SSD arızaları hakkında bir not eklemek, çünkü Bonnie ++ stres testlerinin belirtildiği, ancak hataları takip etmediği belirtildi. SSD'lerin "hatalı blokları yeniden eşleme" biçimi, sabit sürücülerin yeniden eşleme yönteminden farklıdır. Nasıl devam ettiği tamamen SSD'nin hangi markasına / markasına / modeline sahip olduğunuza bağlıdır:

  • Ucuz SSD (ler) sadece yeniden eşleme için yedek kapasiteye sahip olmadıkları veya arızalı flaş bloklarını ayırmanın hiçbir yolu olmadığı için başarısız oluyor. Yalnızca asılır veya çevrimdışı olurlar ve tekrar çevrimiçi olmazlar.
  • Yedek kapasitesi olmayan orta seviye SSD (ler), Smartd uyarıları üretebilir ve hatta başarısız bir blok algılandığında işletim sistemi düzeyinde blok cihazı hataları oluşturabilir. Ancak, arıza meydana geldiğinde SSD'nin kayıtlı boyutu değişecektir. Bu, bir hataya ve cihazın işletim sistemi tarafından çevrimdışına alınmasına neden olabilir veya cihazın kendisinin asılı kalmasına ve tekrar tanınması için çıkarılıp tekrar takılmasına neden olabilir. Yeniden kaydedildiğinde, cihazın kullanılabilir blok boyutu azalacaktır.
  • Yedek kapasiteye sahip ileri teknoloji SSD (ler), sahne arkasındaki kötü blokları yeniden eşler ve işletim sistemi düzeyinde uyarılar / uyarılar oluşturabilir. Yedek kapasite bittiğinde, cihaz muhtemelen Orta Kademe SSD (ler) inin hatları boyunca başarısız olacaktır.

SSD, hatalı bloklar yalıtıldığından kendini yeniden boyutlandırdığında, sürücünün bellenimi otomatik olarak uygun güncellemeleri otomatik olarak yapmazsa, sürücüyü canlandırmak için aşağıdakileri yapmanız gerekebilir:

http://communities.intel.com/message/145676

Stres testi ve hata günlüğü aracı özellikle SSD (ler) ile tasarlanmadığı sürece, sadece cihazın ömrünü kullanıyorsunuzdur.

DÜZENLE:

Yukarıdaki yanıtlardan edinilen bilgilere dayanarak, bu tür bir OS dosya sistemi düzeyi hatası normal olmadığından, kabloyu daha iyi bir kablo ile değiştirmenizi veya sürücüyü değiştirmenizi (RMA / Garantiyi değiştirme) öneririz.

Ayrıca, sürücünüz destekliyorsa, hataları işlemek için ayrılan alan miktarını artırabilirsiniz:

http://www.thomas-krenn.com/en/wiki/SSD_Over-provisioning_using_hdparm


Bu bir performans ölçütü. Sürücüye egzersiz yapabilir, ancak hataları algıladığını sanmıyorum.
psusi

SSD (ler) in çalışma şekli, hata algılama, SSD'nin markası / modeline bağlı olarak birkaç formdan birinde gelir: Bir blok yeniden eşlenirse ve yedek kapasite kullanılırsa (hata yok), cihazın kapasitesi flash belleğin bir bölümü arızalı olduğu için azaltılır (smartd hatalarına neden olabilir, dosya sistemi hatalarına neden olabilir, çevrimdışı duruma getirerek cihazın veri yolunu kapatmasına neden olabilir. ) ve SSD yeniden eşleme yapmadan tamamen askıda gibi görünebilir (yeniden taktıktan sonra bile cihaz yanıt vermiyor). Başarısızlık yolu HD ile eşdeğer değildir
Wing Tang Wong

1
hatalar sürücü tarafından algılanmaz, dolayısıyla bir test aracına ihtiyaç duyulur. Kendisini yeniden monte edilen dosya sistemi ve e2fsck meta verilerdeki birçok hatayı bulup düzelterek kendini gösterir. Ayrıca bazı git depo paketi dosyaları bozuk yaşadım. Belki ayda bir ya da iki kez olmak üzere sessiz bir yolsuzluk olur. İlk başta, TRIM'i içeren bir hata olabileceğini düşündüm, çünkü bunu etkinleştirmeden önce bu olayı hatırlamıyorum, bu yüzden onu kapattım ve hala oluyor.
psusi

Birkaç potansiyel sorun: kötü sürücü kablosu veya kötü sürücü. Kabloyu başka bir kabloyla değiştirerek bozuk sürücü kablosunu test edebilirsiniz. Bunu geçmişte yaşadım ve daha iyi bir spec'd kablo ile değiştirdim. Bozuk bir sürüş durumunda, RMA veya garanti kapsamında onarım için gönderin.
Wing Tang Wong

1
sorun, bunun kötü bir sürücü (veya gerçekten, bellenimdeki bir hata) olduğunu ve çekirdekte bir hata olduğunu söylemiyor. Kötü bir kablo olsaydı, rastgele sessiz yolsuzluktan ziyade sata ecc hataları olarak tezahür ederdi.
psusi

3

Bunun bir yıldan daha eski olduğunu anlıyorum, ancak gelecekte iş parçacığını okuyan herkesin yararına olması için, (d) istediğiniz yazılımın HP Labs dışında henüz mevcut olmadığını umuyorum:

"Güç Hatası Altında SSD'lerin Sağlamlığını Anlamak" https://www.usenix.org/system/files/conference/fast13/fast13-final80.pdf

Güç hatası enjeksiyonunu tercih edilen bir olayla değiştirmek (veya aralıklı bellenim hatalarını saptaması durumunda hiçbir şey) ve bu yazılımın bunu algılayacağı anlaşılıyor. Ne yazık ki, bir alternatif olduğunu düşünmüyorum, muhtemelen HP şirket içinde bir şey yazmazdı.

Bu bir utanç, çünkü sanal ortamda sorunları kanıtlamak için böyle bir şeye ihtiyacım vardı; işlediğim yazarların fiziksel diske gitmediğinden şüpheleniyorum Sadece SSD'leri değil, depolama yığınını bu şekilde stres testine tabi tutmak harika olurdu. Henüz uygun bir şey bulamadım.


2
(anonim yorumdan) Şeylerin donanım tarafının çoğaltılması gerekecek olsa da, bu kağıdın yazılım doğrulama bölümünün tetikleyicilerle istemci / sunucu modunda fio kullanılarak çoğaltılamamasının bir nedenini göremiyorum. Ayrıntılar için github.com/axboe/fio/blob/master/HOWTO (10.0 Doğrulama ve tetikleyiciler) bölümüne bakın . fio, daha sonra doğrulanabilecek çeşitli yararlı modellerde arabelleksiz veya periyodik olarak G / Ç'yi kullanmak için yapılabilir (farklı fio çağrılarından sonra doğrulama yapılabilmesi için bir durum dosyasını kaydetmek bile mümkündür).
Archemar

1

Düşük seviyeli testlere erişebildiği, kötü sektörleri yeniden düzenleyebildiği, tüm akıllı sağlık durumunu test edebildiği için (bir SSD için, çoğumuz için bilinmeyen birçok kayıt var. ancak üreticinin sabit disk durumunu görmesine yardımcı olabilir)

hirensCD birçok test aracı var, ancak SSD özellikli olanlara güncellenmediğini düşünüyorum, bu yüzden doğrudan yapımcının web sitesini kontrol edin. Bazıları linux'u destekliyor, diğerleri bir windows liveCD (hirenCd'yi tekrar kontrol edin) veya bir pendrive'dan (freedos, özel işletim sistemi, vb.) Başlatma gerektirebilir.

Çoğu eski HD aracı, SSD'yi test etmek için iyi değildir, çünkü sektör asla aynı yerlerde değildir, yazımları sürücünün her tarafına yaymak için bellenim tarafından dinamik olarak eşlenir. Bu yüzden yazma testleri yaparlarsa, diski gerçekten test etmek yerine yazma döngülerini yakarsınız.

Okuma testleri SSD'yi yakmaz, aynı zamanda tüm SSD sektörlerini gerçekten test etmeyebilir, yine bellenim gerçek düzeni gizler.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.