MTBF verilerinizi nerede bulabilirsiniz?


9

Hatalar arasındaki ortalama süreyi yorumlamak zor olabilir, ancak bazı zor verileriniz varsa kullanabileceğiniz çok sayıda istatistiksel yöntem vardır.

Sorun şu ki, kimse artık MTBF numaralarını rapor etmiyor. (Zaten sabit disk üreticileri dışında.)

Nerede mi sen bileşenleri ve sunucular için MTBF verileri bulmak için gitmek?


MTBF verilerini nasıl kullandığınızı merak ediyorum.
dr.pooter

Yanıtlar:


2

MTBF neden önemli değil

Hata numarası arasındaki ortalama süre düzeltilemez hata oranı kadar önemli değildir. MTBF parçanın tamamen arızalanmasıyla ilgilenir, sürücüyü okuyun. Bununla birlikte, tek bir hata, bir RAID 5 panikine neden olacak ve etkin yedekleri devreye sokacaksa, bu sayı anlamsızdır.

Profesyonel ve tüketici seviyesi sürücüler için MTBF son yıllarda büyüklük sıralarında artmış olsa da, düzeltilemez hata oranı nispeten sabit kalmıştır. Bu oran 10 ^ 14 bit olarak tahmin edilir, bu nedenle tüketici SATA sürücüleri için 12 terabayt okuma başına bir bit kaynağı .

RAID 5 diziniz üzerinde neden uykuyu kaybetmelisiniz?

Yani, bu yeni 2Tb disk şaplak bir markanın sadece 6 geçişi. 12 TB veri okumak ne kadar sürer? Bu sürücü için MTBF'den çok daha az zaman.

http://storagemojo.com/2008/02/18/latent-sector-errors-in-disk-drives/

Daha da önemlisi, büyük sürücülerden oluşan bir RAID 5 dizisinde çift okuma hatası olasılığıdır. 7 1 TB sürücülü RAID 5 dizisi ile, RAID yeniden oluşturma işlemi yaparken muhtemelen ikinci bir okuma hatası% 50'dir.

http://blogs.zdnet.com/storage/?p=162


Belki RAID6'yı her zaman kullanabilirsiniz?
Chopper3

3
Harika yanıt, ancak sadece sabit sürücüleri kapsar
Mark Henderson

@ Chopper3, evet RAID6 durumu iyileştirir, ancak iki diski eşlik ve üçte birini çalışırken yedeklemeye ayırdığınızda, 7 sürücü dizisinde RAID10 dizisiyle aynı alana oldukça yaklaşırsınız.
Dave Cheney

Sadece sabit disklerden daha fazlası için veri arıyorum. Tüm sunucular zaman zaman başarısız olur, bu nedenle ne sıklıkta ölçülmeye değer.

1

MTBF Figürlerinin karmaşık sistemlere uygulanmadığını düşünmeleri utanç vericidir. Asıl sorun (afaik), üreticilerin donanım modülleri için MTBF rakamlarına sahip olmamasıdır. Bunlar, tüm hakların mevcut olması gereken rakamlardır. Dell, "Dell artık sunucuları için belirli MTBF'leri listelemiyor." aslında iğrenç! Onlar da "Bizim şeyler gerçekten bir MTBF rakamı gerekli yerlerde kullanılacak kadar güvenilir değildir" diyebilirler.

Güvenilirlik mühendisinin (veya RE'nin şapkasını takan kişinin) kullanılabilirlik çalışmasının kapsamını sınırlaması beklenir. Bu genellikle donanım modülleriyle sınırlıdır.

Neyin başarısızlık oluşturduğunun sınıflandırılmasına gelince ... İşte bu yüzden bir FMECA analizi gerçekleştiriyoruz.

Emin sistemler karmaşıktır ve hata modları yazılım hatalarını içerir, ancak bu genellikle çalışmanın kapsamı değildir. Donanım için MTBF Rakamları istiyoruz. Satıcınızdan bunu sağlamasını isteyin. Size sağlamak onların teknik sorumluluğudur ... Reddeder veya yan adım yaparlarsa, donanım için zorunlu kullanılabilirlik rakamlarına sahip telekom sınıfı sunucuları olan bir yere gidin.


Bir tedarikçinin MTBF'yi yayınlaması gerektiğinde sorun, gerçek verileri toplayabileceklerinden daha önce yayınlaması gerektiğidir. Bu nedenle bir çeşit ekstrapolasyon yoluyla MTBF üretmeleri gerekir. Bazen bu çok uzak olabilir. Gördüğüm en kötü durum, üçten fazla büyüklükten kaynaklandı.
kasperd

0

MTBF'nin şirket destek sitelerinde rapor aldığını gördüm. Bilgileri almak için satış temsilcinizle veya SE ile görüşün.


0

Bence, MTBF numaraları bir satış aracı haline geldi. Modern donanım, MTBF numaralarının esasen yararsız olduğu bir duruma ulaştı. Düşük bilyalı satıcıların en düşükleri bile, herhangi bir makul yükseltme döngüsüne dayanabilen donanım üretmektedir. Belirttiğiniz gibi, hiç kimse MTBF numaralarını bildirmiyor. Bunun nedeni olduğuna inanıyorum.


Yine de, bazı sunucular diğerlerinden daha güvenilirdir. "Buna değecek ikinci bir güç kaynağı mı?" Gibi soruları yanıtlamamız gerekiyor. Bunun için verilere ihtiyacımız var. İdeal olarak, benzer cihaz popülasyonunda rapor edilen gerçek başarısızlık istatistikleri olacaktır. Bu gerçek dağıtım için MTBF'yi zayıf bir proxy olarak kullanıyoruz.

Yeterince adil. Benim küçük dünyamda artıklık fikri sürecin beklenen bir parçası. Başka bir örnek için, büyük ölçekli barındırma sağlayıcılarının çoğuna veya google'a bakın. Ben hala wintel sunucularının emtia durumu göz önüne alındığında, bu azalan bir konudur. Z-serisi veya benzeri bir şeyden bahsediyorsanız, denklemler ve beklentiler çok farklıdır.
dr.pooter

0

Ne yazık ki, MTBF modern sunucularda pratik veya güvenilir bir ölçüm değildir. MTBF'nin tüm konsepti, belirli bir model / yapılandırma uzun süre birçok kişi tarafından kullanılıyorsa, güvenilirliğini muhtemelen bilebiliriz.

Bugün, çoğumuz, ekstra performans ve güç verimliliği için potansiyel ekstra güvenilirliği mutlu bir şekilde takas ediyoruz. Örneğin, yeni sunucularınızı güvenilirliğini kanıtladığı için 18-24 aylık bir donanım üzerine kurar mıydınız? ya da sadece daha fazla çekirdeğe, beygir gücüne ve güç verimliliğine sahip son nesil CPU'larla mı devam ediyorsunuz?

Ayrıca, eski telefon sistemlerinden farklı olarak, sistemler oldukça özelleştirilmiştir ve elbette yazılıma büyük ölçüde bağımlıdır. BIOS sürüm x.xx veya sürücü sürümü y.yyy ne kadar güvenilir? En son OS / DB / uygulama sunucusu yamaları kararlılığı artırıyor mu veya kararlılık gerilemesi var mı? Dünyadaki kaç sunucu aslında sizinle aynı donanım / yığın sürümü karışımını kullanıyor?

Yüksek kullanılabilirliğe ihtiyacınız varsa, yine de sisteminize yedeklilik eklemeniz gerekir (çift her şey, kümeleme, etkin yedek parçalar, DRP, neyiniz var). Bu nedenle, her bir donanım bileşeninin göreceli güvenilirliği tipik olarak önemli bir faktör değildir, çünkü tek bileşenli arızalardan kurtulmak için altyapı oluşturursunuz. Sadece belirsizlikle yaşayın (güvenilirlik geriye dönüktür) ve buna göre plan yapın.


Sürekli değişen yapılandırma sorunu gerçek bir problemdir. Bu, tek bir yapılandırma noktasıyla bir deneyim bütünü oluşturmayı zorlaştırır. Bununla birlikte, yedekli bir konfigürasyonda bile HA'yı planlıyorsanız, bireysel cihazların güvenilirliği hakkında bir fikriniz olması gerekir.

Görünüşe göre BT'nin bir bilim haline gelmesi için hiç umut yok. Varsayımlar, sabit veriler ve kaynak israfı üzerinde çalışmaya devam ediyoruz. Bugünlerde her şeyden çok kara büyü gibi. Mühendislik uzak bir hedef gibi görünüyor.
Giovanni Tirloni

0

Diğer cevapların çoğuna katılıyorum: MTBF numaraları benim için yararlı değil ve asla kontrol etmiyorum.

Tek istisna sabit diskler, ancak orada bile, MTBF'ye çok kaba bir şekilde bakıyorum, eğer bir seçenek varsa daha güvenilir "sunucu sınıfı" sürücüleri satın aldığınızdan eminim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.