Kaç tane SMART sektör yeniden tahsisi sorun olduğunu gösterir?


17

Bir aydan eski bir NAS cihazım var. Sabit sürücülerin SMART verilerinden oluşturulan uyarıları bana e-posta ile gönderecek şekilde yapılandırılmıştır. Bir günden sonra, sabit disklerden biri bir sektörün kötü gittiğini ve yeniden tahsis edildiğini bildirdi. İlk hafta boyunca, bu sayı söz konusu sabit disk için toplam altı sektöre yükseldi. Bir ay sonra, dokuz yeniden tahsis edilen sektörde duruyor. Oran kesinlikle yavaşlıyor gibi görünüyor.

NAS, RAID-5 yapılandırmasında altı adet 1,5 TB sürücü ile yapılandırılmıştır. Bu tür yüksek kapasiteli disklerle, bir sektörün zaman zaman başarısız olmasını beklerdim, bu nedenle ilk birkaç sektörün yeniden konumlandırılmasından endişe etmiyordum. Diğer disklerin hiçbirinin sorun bildirmediği halde beni rahatsız ediyor.

Sürücünün sağlığı için hangi yer değiştirme oranlarında veya toplam yer değiştirme sayısında endişelenmeye başlamalıyım? Bu, sürücünün kapasitesine bağlı olarak değişebilir mi?


iyi olan, jeremy. Burada birçok kişi yararlı bulacağı ve bir cevap bulmak kolay değil serverfault en iyi biri. kesinlikle +2'den fazlasını hak ediyor. soruyu NetGear'a özgü değil, genel olarak depolama alanı için yeniden ifade etmek isteyebilirsiniz
kullanıcı adı

Geri bildiriminiz için teşekkür ederiz, önerdiğiniz değişiklikleri yaptım ve durumu güncelledim.
Jeremy

1
Ben de sürücüleri yerine bir yeniden tahsis sektörü. Sürücünün garanti süresinin üstünde sıfır beklemeniz gerekir. Üreticiler bu sürücülerdeki garantiyi her zaman yerine getirmişlerdir.
Michael Hampton

Yanıtlar:


13

Sürücüler, çoğu bileşen gibi, bir küvet eğrisi arıza oranına sahiptir. Başlangıçta çok başarısız olurlar, ortada nispeten düşük bir başarısızlık oranına sahiptirler ve daha sonra yaşamlarının sonuna ulaştıklarında çok başarısız olurlar.

Tüm sürücünün bu eğriyi izlemesi gibi, diskin belirli alanları da bu eğriyi izleyecektir. Sürücüyü kullanmaya başladığınızda birçok sektör yeniden tahsisi göreceksiniz, ancak bu azalmalıdır. Sürüş ömrünün sonunda arızalanmaya başladığında, gittikçe daha fazla sektörü kaybetmeye başlayacaktır.

Yaklaşık 6 endişelenmenize gerek yok (sürücüye bağlı olarak - üreticiye danışın), ancak her yeni yeniden tahsinin sıklığını izlemeniz ve görmeniz gerekir. Bozulma hızlanırsa veya aynı kalırsa endişelenin. Aksi takdirde, ilk alıştırma döneminden sonra iyi olmalıdır.

-Adam


Küçük bir nokta: Sürücüler MTBF'lerinden önce UZUN arızalanır. Sanırım beklenen ömürlerine yaklaştıkça çok başarısız oluyorlar.
Eddie

5
Google "küvet eğrisi" teorisini yeterince derinlemesine çözmedi mi?
Insyte

20

Google'ın " Büyük Disk Sürücüsü Nüfusundaki Arıza Eğilimleri " konulu makalesini yeniden okuduğumda , Adam'ın cevabının yanlış olduğunu güvenle söyleyebilirim. Son derece büyük bir sürücü popülasyonunu analiz ederken, kabaca% 9'unda sıfır olmayan yeniden tahsis sayımı vardı. Söyleyen alıntı şudur:

İlk yeniden tahsis ettikten sonra, sürücülerin yeniden ayırma sayısı olmayan sürücülerden 60 gün içinde başarısız olma olasılığı 14 kat daha fazladır ve bu parametre için kritik eşik değeri de bir olur.

Gerçek zamanlı IO op'leri sırasında değil, sürücünün arka plan fırçalaması sırasında keşfedilen yeniden tahsisler olan "çevrimdışı yeniden tahsisler" ile uğraşırken daha da ilginçtir. Sonuç:

İlk çevrimdışı yeniden tahsis işleminden sonra, sürücüler 60 gün içinde çevrimdışı yeniden tahsisi bulunmayan sürücülerden 21 kat daha fazla arıza şansına sahiptir; toplam yeniden tahsislerden daha sert olan bir etki.

Şu anki politikam, sıfır olmayan yeniden tahsis sayılarına sahip sürücülerin değiştirilmek üzere programlanması olacak.


Bu ilginç, o kağıdı duymuştum ama tekrar okumam gerekebilir. FWIW, NAS'ımdaki 6 sürücüden 4'ü yeniden tahsis edilmiş sektörlere sahip. Cevap için teşekkürler.
Jeremy

3

Farklı sürücüler muhtemelen farklı parametrelere sahiptir. En son kontrol ettiğim bir sürücüde, bir tedarikçiden gelen 1 TB'lık bir kurumsal seri disk olduğunu, yeniden tahsis için 2048 ayrılmış sektör vardı.

Sıfır olmayan yeniden tahsis edilen sektörlere sahip bir sürücüde SMART raporunda yer alan ayrılmış sektör sayısını tahmin edebilirsiniz. Aşağıdaki başarısız sürücüde bir rapor düşünün.

...
ID# ATTRIBUTE_NAME          VALUE WORST THRESH TYPE      WHEN_FAILED  RAW
...          
  5 Reallocated_Sector_Ct   005   005   036    Pre-fail  FAILING_NOW  1955

Burada 1955 sektörü olan ayrılmış kapasitesinin% 95'i kullanılmıştır. Bu nedenle başlangıç ​​kapasitesi yaklaşık 2057'dir. Aslında 2048'dir, fark yuvarlama hatasından kaynaklanmaktadır.

SMART, yeniden tahsis edilen sektör sayısı belirli bir eşiğe ulaştığında sürücüyü başarısız duruma getirir. Söz konusu sürücü için bu eşik, ayrılan kapasitenin% 64'üne ayarlanır. Bu kabaca 1310 yenilenmiş sektör.

Ancak rezerve edilen sektörler sürekli bir kapsamda değildir. Bunun yerine birkaç gruba ayrılırlar, her grup sektörleri diskin belirli bir bölümünden yeniden eşlemek için kullanılır. Bu, verileri diskteki bir alanda yerel tutmak için yapılır.

Konumun dezavantajı, diskin birçok ayrılmış sektöre sahip olabilmesidir. Yine de bir alan zaten ayrılmış kapasiteden az olabilir. Bu durumda, davranış ürün yazılımına bağlıdır. Bir sürücüde FAILED durumuna geçtiğini ve artık korunmayan bir parçada bir hata oluştuğunda bloke olduğunu gözlemledik.


"Yeniden tahsis için 2048 ayrılmış sektör vardı" nasıl belirlediniz?
AJ.

Belki de 2047, yeniden tahsis edilebilir sektörlerin maksimum miktarıdır. Sürücülerimden biri, "yeni" için eBay'den satın alındığında tam 2047'ye sahipti, bu 0x7FF, ayrıca b11,111,111,111. 2048'e gitmek fazladan israf olurdu.
davide

2

Sürücü destekliyorsa, SMART uzunluğunda bir kendi kendine test çalıştırmak isteyebilirsiniz. Bu, sürücünün durumu hakkında daha fazla bilgi verebilir. NAS'ınız bunu yapamazsa ve sürücüyü birkaç saatliğine çekebilir veya NAS'ı kapatabilirseniz, sabit diski başka bir makineye takılıyken uzun bir otomatik test yapabilirsiniz.


1

Bu yeni bir sürüş böyle davrandığında hiç güvenilmez!

En kısa sürede geri gönderin ve yedek bir sürücü alın.


1

Farklı üreticilerin farklı "kabul edilebilir kayıp" sayıları vardır (monitörler ve bozuk piksellerle aynı fikir). Standartlarının ne olduğunu öğrenmek için sürücü üreticisine danışın.

Gerçi kötü bir trend gibi görünüyor ...


-1

Western Digital, özellikle TLER (RAID ) adı verilen donma diski yerine kötü sektörü kabul edilebilir bir sürede geri kazanan teknolojiden gurur duymaktadır ( http://en.wikipedia.org/wiki/Time-Limited_Error_Recovery ). Zaman tipik olarak 5,7 saniyedir.

Web'de bulduğum gibi, devre dışı bırakılmış seçenekli WD disk sürücüleri var, ancak bazı insanlar bu özelliği ucuz Yeşil WD sürücülerde etkinleştirdikten sonra RAID'e yerleştirdiler.

WDTLER yardımcı programı WD destek sitesinden kaldırıldı ancak Google üzerinden kolayca bulunabilir.

PS Bu programı sadece okuma durumu için kullanıyorum ve şu an RAID kullanmıyorum :)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.