tam olarak bir ÜRE nedir?


14

Son zamanlarda RAID5 Vs RAID6'ya bakıyorum ve UID değerleri ve sürücülerin boyutlarının artması nedeniyle RAID5'in artık yeterince güvenli olmadığını görmeye devam ediyorum. Temel olarak, bulduğum içeriğin çoğu, RAID5'te bir disk arızası olması durumunda, dizinizin geri kalanı 12 TB ise, bir URE ile tanışmak ve verilerinizi kaybetmek için neredeyse% 100 şansınız olduğunu söylüyor.

12 TB rakamı, disklerin bir URE'ye ulaşmak için okunan 10 ^ 14 bit olarak derecelendirilmesinden kaynaklanmaktadır.

Buraya gelmediğim bir şey var. Sektöre devam eden başkan tarafından bir okuma yapılır, okumayı başarısız kılabilecek şey ya kafa ölür ya da sektör ölür. ayrıca okuma başka bir nedenden dolayı işe yaramayabilir (bilmiyorum, başın atladığı bir titreşim gibi ...). 3 durumu da ele alalım:

  • okuma işe yaramıyor: bu kurtarılamaz değil, değil mi? tekrar denenebilir.
  • kafa ölür: bu kesinlikle kurtarılamaz olurdu, ancak bu aynı zamanda tam tabağın (veya en azından yanın) okunamayacağı anlamına gelir, daha endişe verici olurdu, değil mi?
  • sektör ölür: tamamen kurtarılamaz, ancak burada 4 TB diskinin neden URE için 10 ^ 14 ve 8 TB'ın URE için 10 ^ 14 olarak derecelendirildiğini anlamıyorum, 8 TB (büyük olasılıkla daha yeni teknoloji), 4 TB'dekilerin yarısı kadar güvenilirdir, bu mantıklı değildir.

Gördüğünüz gibi, tespit ettiğim 3 başarısızlık noktasından hiçbiri mantıklı değil. Yani somut olarak tam olarak bir URE nedir?

Bunu bana açıklayabilecek biri var mı?

Düzenle 1

İlk cevap dalgasından sonra, sektörün başarısız olmasının nedeni gibi görünüyor. İyi bir şey, ürün yazılımı, RAID denetleyicisi ve OS + dosya sisteminin bunu erken tespit etmek ve sektörleri yeniden tahsis etmek için prosedürü olmasıdır.

Şimdi URE'nin ne olduğunu biliyorum (aslında, ad oldukça açıklayıcıdır :)).

Hala altta yatan nedenlerden ve çoğunlukla verdikleri istikrarlı derecelendirmeden şaşkınım.

Bazıları başarısız sektörü dış kaynaklara (kozmik dalgalar) bağladı, daha sonra URE oranının yaşına değil, okuma sayısına bağlı olduğuna şaşırdım, kozmik dalgalar gerçekten daha eski bir diski daha fazla etkilemeli çünkü daha fazla, yanlış olsa da bu daha çok bir fantezi olduğunu düşünüyorum.

Şimdi diskin aşınmasıyla ilgili diğer neden geliyor ve bazıları daha yüksek yoğunlukların daha zayıf manyetik alanlar verdiğine dikkat çekti, bu tamamen mantıklı ve açıklamayı takip edeceğim. Ancak burada iyi açıklandığı gibi, yeni diskler farklı boyutlar çoğunlukla HDD kasasına aynı tablanın (ve daha sonra aynı yoğunluğun) az ya da çok yerleştirilmesiyle elde edilir. Sektörler aynı ve hepsi aynı güvenilirliğe sahip olmalı, bu nedenle daha büyük diskler daha küçük disklerden daha yüksek bir dereceye sahip olmalı, sektörler daha az okunuyor, durum böyle değil, Neden? Bu, daha yeni teknolojiye sahip yeni disklerin neden eskisinden daha iyi derecelendirme almadığını açıklayacaktır, çünkü daha iyi teknoloji kazancı, daha yüksek yoğunluktan kaynaklanan kayıp ile dengelenir.


"URE ve verilerinizi kaybetmek" afaik (ve ben yanlış olabilir), bir URE sadece bazı verilerin kaybedildiği anlamına gelir, hepsi değil - ve URE'ye çarptıktan sonra yeniden oluşturmayı deneyebilirsiniz. Bununla birlikte, 10 veya zfs baskını bugünlerde olduğu gibi.
Sirex

1
" sektörler [yeni disklerde], [eski disklerde] yarısı kadar güvenilir, bu mantıklı değil " Kabul ettiğimden emin değilim. Manyetik bölgeler daha küçük hale geldikçe (aynı boyuttaki paketteki daha yüksek veri yoğunlukları anlamına gelir), yanlışlıkla silinmeye (yerel gama ışını emisyonları, kozmik ışın olayı vb.) Her zamankinden daha duyarlı olmaları çok mantıklıdır. Modern sürücülerin bu artan duyarlılığı, hiçbirimizin RAID olmayan sürücüleri önemli olan herhangi bir şeye dağıtmamasının nedeni ve çoğumuzun RAID-5'ten vazgeçmesinin bir nedeni.
MadHatter


Buradaki asıl sorun, çok fazla RAID dizisinin tek bir URE'yi tüm dizi hatasına dönüştürmesidir. Tek bir URE, tek bir RAID bloğunun kaybına neden olmalıdır. Dosya sisteminin bu bloğun kullanımda olup olmadığını anlamasına izin verin, gerçekten önemli değil.
MSalters

1
@Memes no, sayılar iptal edilir. İki sektörden iki kat daha fazla başarısızlık fırsatının iki katıdır, bu nedenle aynı okuma hata oranı bayt bazında aynı güvenilirliğe eşittir. Bu yüzden ilk etapta kullanılır.
hobbs

Yanıtlar:


13

URE, Kurtarılamaz bir Okuma Hatasıdır. Bir sektörün okunmasının, sürücünün düzeltemediği başarısız olmasına neden olan bir şey oldu. Sürücü elektroniği karmaşıktır, verileri yalnızca diskten doğru okuyabildikleri takdirde iletirler. Sürücü elektroniği, hasarlı olduğunu beyan etmeden önce kötü bir sektörü okumak için birkaç kez deneyecek.

Ne okuma hatası neden - Ben burada bir uzman değilim (kol sallıyor) ama sürücü yaşlanma üretim toleransları alakalı hale neden olabilir. Manyetik alanlar zayıflayabilir. Kozmik ışınlar hasara vb. Neden olabilir. Temelde rastgele bir başarısızlıktır.

Bu RAID 5'i nasıl etkiler?

Bir RAID 5 dağıtılmış eşlikli blok düzeyinde şeritlemeden oluşur. Eşlik blokları, veri bloklarındaki bitlerin birlikte XORing'iyle hesaplanır. XOR işlevi temel olarak, tüm bitler aynı ise sonuç 0'dır, aksi takdirde 1'dir.

1010   data      or    1010 data
1100   data            1100 data
0110   parity          0011 data
                       0101 parity

XOR işlevinin doğası, herhangi bir disk ölür ve değiştirilirse, üzerinde olması gereken verilerin kalan disklerden yeniden yapılandırılabileceği şekildedir.

1010  data       or    1010 data
      damaged               damaged
0101  parity           0011 data
                       0101 parity

Gördüğünüz gibi hasarlı veriler, kalan veriler ve parite XORing ile yeniden oluşturulabilir.

Bir URE bunu nasıl etkiler?

Bir URE yalnızca RAID 5 yeniden oluşturma sırasında önemlidir.

Bir RAID 5'i yeniden yapılandırdığınızda, çok miktarda okuma yapılması gerekir. Yeni diskteki verileri yeniden oluşturmak için her veri bloğunun okunması gerekir. Bir URE meydana gelirse, ilgili bloğa ait veriler kurtarılamaz, böylece verileriniz tutarsız olur. Yeterince büyük bir R5'teki yeterince büyük diskler için, değiştirilen diski yeniden yapılandırmak için okunan bit sayısı, 10 ^ 14 okumada örneğin 1 bitlik URE değerini aşar.


2
Bir tek 8TB disk çok RAID-5, sadece bu gibi üç disklerle URE olan, 6 * 10 ^ 13 bit üzerinde bulunmaktadır fazla olası değildir daha bir yeniden inşa sırasında. Oh, ve benden +1.
MadHatter

3
12TB'yi okuduktan sonra bir okuma hatasının neredeyse kesin olduğu iddiası (soruda ve bazı cevaplarda ve yorumlarda, diğer sorularda, aslında tüm internette). İnanmıyor musunuz? Yapma. Biliyor. Disklerinizin herhangi birinden 12 (veya daha fazla) TB okuyarak ve hiçbir hata olmadığını gözlemleyerek. Lütfen yap ve bu efsaneyi durdur. Teşekkür ederim.
David Balažic

1
@IanKemp Hayır değil. Denedim. Açıkçası görmedin. (ayrıca, daha iyi derecelendirme efsaneyi biraz hareket ettirir, gerçek bir değişiklik olmaz)
David Balažic

1
DavidBalažic besbelli @, senin örnek boyutu bir geçersiz kılmaktadır olasılık teorisi tamamı! Nobel Komitesine bir makale göndermenizi tavsiye ederim.
Ian Kemp

1
@IanKemp Birisi tüm sayıların 7 ile bölünebileceğini iddia ederse ve bir tane bulmuyorum, o zaman evet, tek bir bulgu tüm teoriyi geçersiz kılabilir. BTW, hala tek bir kişi pratikte efsaneyi doğrulamamıştır (deneyle), değil mi? İnanç bilgiden daha fazlası olduğunda neden ...
David Balažic

9

Yani somut olarak tam olarak bir URE nedir?

Sabit diskler, yalnızca istediğiniz verileri depolamaz. Sürekli azalan manyetik etki alanı boyutları ve sabit disklerin verileri ikili biçim yerine analog olarak depolaması nedeniyle (sabit disk bellenimi, bir ikili sinyale çevrilen plakadan bir analog sinyal alır ve bu çeviri üreticinin gizli sosunun bir parçası), bir okumada telafi edilmesi gereken neredeyse her zaman bir derece hata vardır.

Verilerin tekrar okunabilmesini sağlamak için, sabit disk ayrıca saklamasını istediğiniz verilerle birlikte ileri hata düzeltme verilerini de saklar .

Normal operasyonlar altında, FEC verileri plakadan okunan sinyaldeki hataları düzeltmek için yeterlidir. Ürün yazılımı daha sonra orijinal verileri yeniden yapılandırabilir ve her şey yolundadır. Bu, SMART'ta okuma hatası oranı özniteliği (SMART özniteliği 0x01) ve / veya Donanım ECC Kurtarıldı (SMART özniteliği 0xc3) olarak ortaya çıkarılabilir kurtarılabilir bir okuma hatasıdır .

Herhangi bir nedenle sinyal belirli bir noktanın altına düşerse, FEC verileri orijinal verileri yeniden oluşturmak için artık yeterli değildir. Bu noktada, teori gider, ürün yazılımı yine de verilerin güvenilir bir şekilde okunamadığını tespit edebilecektir, ancak bu konuda hiçbir şey yapamaz. Bu tür birden fazla okuma başarısız olursa, diskin bir şekilde bilgisayarın geri kalanının okumanın başarıyla gerçekleştirilemediğini bildirmesi gerekir. Bunu, kurtarılamaz bir okuma hatası sinyali vererek yapar . Bu da Bildirilemeyen Hatalar (SMART özniteliği 0xbb) sayacını artırır.

Kurtarılamaz bir okuma hatası veya URE, her ne nedenle olursa olsun, veri yükü verilerinin ve FEC verilerinin orijinal olarak saklanan verileri yeniden oluşturmak için yetersiz olduğu bir rapordur.

URE oranlarının istatistiksel olduğunu unutmayın . 10 ^ 14 (veya 10 ^ 15) - 1 bit'i başarıyla okuyabileceğiniz ve sonraki bit başarısız olan herhangi bir sabit diskle karşılaşmazsınız. Aksine, üretici tarafından ortalama olarak 10 ^ 14 bit okursanız (o zaman), bu süreçte bir noktada okunamayan bir sektörle karşılaşacağınız ifadesidir.

Ayrıca, yukarıdaki son birkaç kelimeyi takiben, okunan sektör başına URE oranlarının verildiğini unutmayın . Verilerin plakalarda nasıl depolandığı nedeniyle, disk bir sektörün hangi bölümünün kötü olduğunu söyleyemez, bu nedenle bir sektör FEC kontrolünden geçemezse, tüm sektör kötü olarak kabul edilir.


Tamam, sektör başarısızlığa işaret ediyor gibi görünüyor. İstatistikleri tamamen alıyorum, endişelenme. Burada da yoğunluk arttıkça sektörün güvenilirliğinin azaldığını görüyorum, ancak bu yine de bir anlam ifade etmiyor. Yeni diskler genellikle fiziksel boyut ne olursa olsun aynı tabla yoğunluğuna sahiptir, 4 TB 6 TB'den daha az tablaya sahiptir. Temel olarak sektörler aynıdır, bu yüzden 8TB neden istatistiksel olarak daha yüksek bir değer elde edemez, her biri iki kat daha fazla sektör olduğundan, her biri yarı yarıya (istatistiksel olarak) okunur. o zaman daha az başarısız olurlar, değil mi?
Memes

3

sektör ölür: tamamen kurtarılamaz, ancak burada 4 TB diskinin neden URE için 10 ^ 14 ve 8 TB'ın URE için 10 ^ 14 olarak derecelendirildiğini anlamıyorum, 8 TB (büyük olasılıkla daha yeni teknoloji), 4 TB'dekilerin yarısı kadar güvenilirdir, bu mantıklı değildir.

Spesifikasyon genellikle " n bit okunurken ortalama 1 hata tespit edilir ", dolayısıyla sürücü boyutu önemli değildir. Sürücünüzde ve iş yükünüzde bir hata oluşması riskinizi hesaplarsanız önemlidir, ancak üretici yalnızca bir hata bulmak için n bit okunduğunu (ortalama olarak garanti edilmez) belirtir .

Örnek: 1 TB'lık bir sürücü satın alırsanız, bir hata bulmak için yaklaşık 12 kez okumalısınız, 8 TB'lık bir sürücü ikinci okumada karşılaşabilir - ancak okunan bit sayısı her iki seferde aynıdır, bu nedenle kalite manyetik iğlerin kabaca aynıdır.

Artan fiyat için ödediğiniz şey diğer faktörler, 8 TB'ı 1 TB'ın fiziksel alanına sıkıştırmak, büyük ölçüde azaltılmış enerji tüketimi, sürücüyü hareket ettirirken daha az kafa kazası vb.


0

Sanırım @Michael Kjörling açıkça cevap verdi.

Disk okuduğunda, kafa manyetik alanın yönünü tespit eder, daha sonra analog olan bazı elektronik sinyal gönderir. Bellenimin 0,5V'den daha yüksek bir voltaj aldığında 1 vermesi gerektiğini varsayıyoruz, ancak manyetik alan çok zayıf, bu nedenle kafa sadece 0.499V ile bir sinyal gönderiyor, bir hata karşılaşması. Bu hatayı düzeltmek için FEC'ye ihtiyacımız var.

İşte bir örnek: sektör verileri 0x0F23 olmalıdır, bunu 0 * 1 + F * 2 + 2 * 3 + 3 * 4 = 0x30 ile kodlarız. şimdi FEC'yi alıp sektörden sonra yazıyoruz. Okuduğumuzda 0x0E23 ve FEC 0x30'u okuyoruz, eşleşmiyor. Bazı hesaplamalardan sonra, 0x0F23 olması gerektiğini bulduk. Ancak 0x0E13 ve 0x30'umuz varsa VEYA 0x0E23 ve 0x32 alırsak, doğru olanı hesaplayamayız.

Bu derece çok düşük, belki de hdd imal edilmiş PB'leri EBs verileri sabit bir değer elde edemezse. Bu yüzden olasılık değerini verir: 10 ^ 14 bit veri okuduğunuzda, bir kez karşılaşabilirsiniz. Bir olasılık değeri olduğundan, belki sadece 1 sektör verisini okuduktan sonra şifrelenmiş olabilirsiniz, belki de 50 TB verisini okuyana kadar karşılaşmış olabilirsiniz. Ve bu değerin disk kapasitesiyle hiçbir ilgisi yoktu, sadece okuduğunuz veri boyutu ile ilgili bir şans endişesi. Veri ile dolu 4 TB'lık bir diski 6 kez okursanız, bu şans 6 TB'lık bir diski 4 kez veya 8 TB'lık bir diski 3 kez okur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.