Bir sunucuda tüketici MLC SSD'leri kullanmak güvenli midir?


44

Biz (ve biz Jeff'i kastediyoruz) yedekleme veri merkezimizde Consumer MLC SSD disklerini kullanma olasılığını araştırıyoruz.

Maliyetleri düşürmeye ve kullanılabilir alanı yüksek tutmaya çalışmak istiyoruz - bu nedenle Intel X25-E'ler yaklaşık 700 $ ve 64GB kapasiteyle neredeyse hiç bitmedi.

Yapmayı düşündüğümüz şey, daha düşük bir fiyat seviyesinde daha fazla kapasite sunan düşük seviye SSD'lerin bir kısmını satın almak. Patronum, yedekleme veri merkezi bitmeyen sunuculardaki diskler için yaklaşık 5 bin harcayarak yatırım yapmaya değmeyeceğini düşünüyor.

Bu sürücüler, bir Lenovo RD120'deki 6 sürücü RAID dizisinde kullanılır. RAID denetleyicisi bir Adaptec 8k'dir (yeniden markalandırılmış Lenovo).

Bu bir yaklaşım için ne kadar tehlikeli ve bu tehlikeleri azaltmak için neler yapılabilir?


4
İplikçi yerine SSD kullanmanın mantığı nedir? SSD performansıyla ilgili halk bilgeliği "maaş ya da canını sıkma" dır, ancak kesinlikle bir avantajı olabilecek başka yönleri de vardır.
peterchen

Burada çözmeye çalıştığınız sorunu merak ediyorum. Bu sadece maliyetlerden biriyse, neden SSD'ler geleneksel sürücüler yerine kabul ediliyor?
John Gardeniers

@peterchen, bir çift SSD veya elli 15K iğ kullanabilirsiniz.
Mircea Chirea

@iconiK - "Bir sunucu için yine de çok para harcamanız gerekiyor" mu demek istiyorsun? Öyleyse - evet, bu yüzden de merak ediyordum.
peterchen

Yanıtlar:


61

Birkaç düşünce;

  • SSD'lerin hafızasında fazla işlem var. Bu, 'zarar görmüş' hücrelerin yerine yazılan hafızadır. Düşük uçlu SSD'ler, fazla çalışma alanının yalnızca% 7'sine sahip olabilir; orta seviye% 28 civarında; ve işletme diskleri% 400 kadar. Bu faktörü göz önünde bulundurun.
  • Onlara günde ne kadar yazacaksın? Sandforce'un 1200 yongasına dayanan ürünler gibi aralarında orta seviye SSD'ler bile, aşırı tüketilen hafızayı ciddi şekilde kesmeden önce, günde yaklaşık 35GB'den fazla yazıyı nadiren takdir ediyor.
  • Genellikle, yeni bir SSD'nin 1. günü, ister işletim sistemi isterse veri olsun, yazıyla doludur. İlk günde önemli miktarda> 35GB'tan fazla yazma hakkınız varsa, SSD'ye gruplar arasında biraz 'düzenli çalışma zamanı' vermek için seri halinde kopyalamayı düşünün.
  • TRIM desteği olmadan, o dönemde çok fazla yazı varsa, rasgele yazma performansı haftalar içinde% 75'e kadar düşebilir - eğer yapabilirseniz, TRIM'i destekleyen bir işletim sistemi kullanabilirsiniz.
  • Modern SSD'lerin gerçekleştirdiği iç çöp toplama işlemleri çok özel olarak sessiz dönemlerde yapılır ve faaliyete son verir. Bu, normal 8 saatlik çalışma döngüsünün% 60'ı için diskin sessiz kalabildiği bir masaüstü bilgisayar için bir sorun değildir, ancak 24 saat hizmet veriyorsunuz ... bu işlem ne zaman çalışma şansına sahip olacak?
  • Genellikle teknik özelliklerin derinliklerinde gömülüdür, ancak ucuz 'normal' disklerde olduğu gibi, ucuz SSD'lerin de sadece% 30 civarında bir görev döngüsüne sahip olması beklenir. Onları neredeyse% 100 oranında kullanıyor olacaksınız - bu MTBF oranınızı etkileyecektir.
  • SSD'ler normal disklerde olduğu gibi aynı mekanik sorunlara sahip olmasalar da, tek ve çoklu bit hatalarına sahipler - içgüdüleri olmasa da, onları RAID olarak düşünün. Açıkçası, yeni aldığınız o güzel rastgele yazma hızını etkileyecektir ancak yine de düşünün.
  • Hala SAS değil SATA, bu nedenle sıra yönetiminiz bir sunucu ortamında o kadar iyi olmayacak, ancak daha sonra ilave performans artışı oldukça çarpıcı olacaktır.

İyi şanslar - sadece onları yazarken 'kızartma' :)


2
Fazladan alan için% 400 mü, yoksa% 40 mı demek istiyorsunuz? Cevabınızı düzenleyecektim ama bir alıntı bulamadım, sanırım% 400 olabilir. (Bu arada, çok iyi bir nokta)
ChrisInEdmonton

9
TRIM'in RAID yapılandırmasında desteklenip desteklenmediği de her zaman net değildir. Unutmayın, SSD'ler RAID ile işletim sisteminden uzaklaşıyor. RAID satıcısına danışın.
Matt Sherman

5
400 Chris'i, özellikle de FC SAN'larda kullanılanları çok ama çok cesurca kastettim.
Chopper3

5
Bir sürücüden daha fazla rezerv alanı elde etmenin bir püf noktası, güvenli silme işlemini yapmak, ardından kullanılmayan büyük bir kesir ile bölmektir. Bu boş alan SSD'nin performansına ve ömrüne katkıda bulunacaktır.
Zan Lynx

1
Sadece @ZanLynx ile +1 yapmak istiyorum. SSD + Raid kullanırken genellikle sürücünün sadece% 80'ini bölümlerim.
Tracker1

12

Sunucularda MLC ve SLC SSD'lerin ilginç ve kapsamlı bir analizini yapan bu bağlantıyı buldum.

Benim görüşüme göre, bir kurumsal uygulama için bir MLC flaş SSD dizisi kullanmak, en azından (iddia edilen) Easyco MFT gibi bir teknolojinin aşınma hafifletici etkilerini kullanmadan kullanmak, paraşütsüz bir uçaktan atlamak gibidir.

Bazı MLC SSD satıcılarının sürücülerinin yazma işlemine devam edebilecek kadar "enterprisey" olduklarını iddia ettiklerini unutmayın :

SandForce, sunucularda kullanılan katı hal sürücüleri için çok seviyeli hücre flaş çiplerini destekleyen bir denetleyiciye sahip ilk şirket olmayı hedeflemektedir. SF-1500, MLC yongalarını kullanarak, sunucu üreticilerinin istediği kadar düşük maliyetli ve daha yüksek yoğunluklu sürücülerin yolunu açıyor. Sunucular için flash sürücüler güncellemek için tek seviyeli hücre flaş çipleri kullandık. Bunun nedeni, MLC yongalarının dayanıklılığı ve güvenilirliğinin genellikle sunucuların gereksinimlerine bağlı olmadığıdır.

AnandTech'te bu iddiaların analizi de var .

Ek olarak, şimdi Intel, SLC'nin zamanının% 90'ındaki sunucularda aşırı yüklenebileceğini söyleyerek kayıtlara girdi :

Winslow, "SLC'nin [tek seviyeli hücre] gerekli olduğuna inandık, ancak Microsoft ve Seagate ile yapılan çalışmalarda bulduğumuz şey, bu yüksek hesaplama yoğun uygulamaların gerçekten düşündükleri kadar yazmadıkları" dedi. "Veri merkezi uygulamalarının yüzde doksanı bu MLC [çok düzeyli hücre] sürücüsünü kullanabilir."

.. geçen yıl boyunca, tedarikçiler sürücü kontrol ünitelerinde özel yazılımlar kullanarak, tüketici sınıfı MLC SSD'lerinin güvenilirliğini ve esnekliğini işletmelerin onları benimsemiş olduğu noktaya kadar artırabileceklerini fark ettiler. yüksek performanslı veri merkezi sunucuları ve depolama dizileri. SSD satıcıları, bu SSD'leri tanımlamak için eMLC (kurumsal MLC) NAND flaş terimini kullanmaya başladılar.

Winslow, "Hacim perspektifinden bakıldığında, hala SLC'ye ihtiyaç duyan yüksek yazma ağırlıklı, yüksek performanslı bilgi işlem ortamları olduğunu görüyoruz, ancak bu kurumsal veri merkezi gereksinimlerinin bile% 10'unda." Dedi.

Intel, kurumsal veri merkezi pazarının% 10'unun Hitachi Global Storage Technologies ile ortak girişimi yoluyla besleniyor. Hitachi, 6Gbit / sn'ye sahip Seri Bağlı SCSI SSD'lerin SSD400S hattını üretiyor. verim - MLC tabanlı SATA SSD'lerinin iki katı.

Intel, sunucu odaklı SSD sürücüleri için bile , yeni Intel SSD 710 serisi ile çok yüksek "aşırı tedarik" alanına sahip SLC'den MLC'ye geçti . Bu sürücüler dahili yedeklilik için toplam depolamanın% 20'sine kadar tahsis eder:

Performans SSD 710 için öncelikli değil. Bunun yerine Intel, daha ucuz eMLC HET NAND kullanarak SLC düzeyinde dayanıklılığı makul bir fiyata sunmayı hedefliyor. SSD 710 ayrıca, sürücü dayanıklılığını önemli ölçüde artıran, kullanıcı tarafından yapılandırılabilir aşırı provizyonu (% 20) destekler. SSD 710'un garantisi 3 yıl veya hangisi önce gelirse, bir aşınma göstergesi belirli bir seviyeye ulaşana kadar. Bu, SSD garantisini bu şekilde sınırlı ilk defa gördüğümüzde.


7

Bu tür şeyleri daima varsayımda bulunmak yerine gerçeklere dayandırın. Bu durumda, gerçekleri toplamak kolaydır: üretim sistemlerinizin uzun soluklu okuma / yazma IOPS profillerini kaydedin ve ardından bir felaket kurtarma senaryosunda ne ile yaşayabileceğinizi belirleyin. Ölçümünüzde yüzde 99 gibi bir şey kullanmalısınız. Do not IOPS cpacity üreticisi ölçerken ortalamalarını kullanmak - zirveleri tüm madde olduğunu vardır! Daha sonra DR siteniz için gereken kapasiteyi ve IOPS'leri satın almanız gerekir. SSD'ler bunu yapmanın en iyi yolu olabilir, belki de olmayabilir.

Bu nedenle, örneğin, üretim uygulamalarınız yüzde 99'da 7500 IOPS gerektiriyorsa, bir felakette 5000 IOPS ile yaşamaya karar verebilirsiniz. Ancak bu, DR sitenizde en az 25 15K disk gerektirir, bu nedenle kapasitenizin küçük olması durumunda SSD daha iyi bir seçim olabilir (oldukları gibi sesler). Ancak yalnızca 400 IOPS üretimde yaptığınızı ölçüyorsanız, yalnızca 6 SATA sürücü satın alın, kendinize biraz para kazandırın ve DR sitesinde daha fazla yedek anlık görüntü saklamak için fazladan boşluk kullanın. Ayrıca, kurumsal olmayan SSD'lerin özelliklerine göre iş yükünüz için ne kadar süre dayanacağını bulmak için veri koleksiyonunuzdaki okuma ve yazma işlemlerini ayırabilirsiniz.

Ayrıca DR sistemlerinin üretimden daha küçük belleğe sahip olabileceğini unutmayın; bu, daha fazla IOPS'ye ihtiyaç duyulduğu anlamına gelir (daha fazla takas ve daha az dosya sistemi önbelleği).


5

MLS SSD sadece bir yıl sürse bile, yıllar içinde değişiklikler çok daha ucuz olacaktır. Öyleyse, dışarıdayken MLS SSD'yi değiştirmek zorunda kalabilecek misiniz?


iyi bir nokta, özellikle bir RAID dizisinde olacağı için .. birçoğu bir kerede başarısız olmadıkça, bu gerçekten makul.
Jeff Atwood

@Jeff, masa üstü bilgisayarlarınızla içeri ve dışarı biraz takas edebiliyorsanız, böylece bazılarının kullanım pateni alamaması için, bunların hepsi aynı anda başarısız olacak, daha az yalama yapacaktır.
Ian Ringrose,

@Jeff, büyük ölçüde uzatacağımı düşünüyorum, Fail == "çok yavaş haklar yapmaya başladım" daha sonra "veri okumadı"
Ian Ringrose

otomatik düzeltmeyi
sevmiyor musun

3

Yazma miktarı problemini bir kenara bırakırsak (veya tüketici düzeyinde SSD'lerin üstesinden gelebileceğini ispatlarsak), SSD'lerin işletme düzeyinde ortamlara eklemek için iyi bir şey olduğunu düşünüyorum. Muhtemelen SSD'leri bir RAID dizisinde kullanacaksınız. RAID5 veya RAID6. Ve bunlarla ilgili sorun, tek bir sürücü arızasından sonra, dizinin arızalanmaya karşı daha savunmasız hale gelmesidir. Ve yeniden inşa etme zamanı büyük ölçüde dizinin hacmine bağlıdır. Birkaç TB dizisinin sürekli erişilirken yeniden oluşturulması günler alabilir. SSD'ler durumunda, RAID dizileri a) kaçınılmaz olarak daha küçük olacaktır b) yeniden oluşturma süresi büyük ölçüde azalır.


3

SuperTalent'ten SLC ve MLC arasındaki farklar üzerine bir Teknik Belge , MLC'nin dayanıklılığını ve bir SLC SSD'nin dayanıklılığının 10'unu koyar, ancak olasılıkla MLS SSD'lerin onları içine koyduğunuz donanımdan daha fazla yararlanma olasılığı vardır. Bu istatistiklerin / gerçeklerin SuperTalent'ten ne kadar güvenilir olduğundan emin değilim.

MLC SSD'lerin tedarikçisinden benzer bir destek seviyesi aldığınızı varsayarsak, daha düşük fiyat noktası onu çekmeye değer hale getirir.


1
Tipik masaüstü kullanımı için 5 yıl ömür belirtilmiştir. Bu doğru bir tahminse, sunucuyu veri merkezi ortamında aşmayacaklardır!
JamesRyan

@JamesRyan: Çoğu hesaplamada gösterilmese de, ömür boyu boş alanın oranına bağlıdır.
Ben Voigt

1
Çalıştığım organizasyonlarda her zaman sunucu donanımını 3 senedir yeniledik. Genelde en iyi uygulama olarak kabul edilen izlenimin altındaydım ama yanılıyorsam beni düzeltiyordum.
chunkyb2002

3

Şu anki kurulumunuzda sahip olduğunuz günlük yazı miktarını hesaplamanız ve üreticinin SSD sürücülerinin dayanabileceğini garanti ettiği değer ile karşılaştırmanız gerekir. Intel bu konuda en ön plana sahip görünüyor - örneğin, ana SSD sürücü veri sayfalarına bir göz atın: http://www.intel.com/design/flash/nand/mainstream/technicaldocuments.htm

Teknik belgedeki Bölüm 3.5 (özellikle 3.5.4), sürücünüzü günde en az 5 yıl boyunca 20 GB yazmayla garantilediğinizi garanti eder. Tahrik kapasitesinin tamamı kullanılırken hesaplandığını ve kendiniz için boş alan sağlamayacağını tahmin ediyorum.

Ayrıca ilginç olan şey, genel kullanıma uygun SSD'lerin kurumsal ortamda kullanılmasıyla ilgili veri sayfasıdır.


Maalesef hiç de basit değil çünkü aşınma seviyelendirme özelliği yazarları (bunları azaltmak için yazmadığını tasarladığını unutmayın) tescilli ve kullanım biçimine göre etkinliği değişkenlik gösterebilecek şekilde çoğaltır.
JamesRyan

Hm, çok iyi bir nokta. Ayrıca, sürücüleri bir RAID kurulumunda kullanıyorsanız, yazma amplifikasyonunu da arttırmanız gerekir. Sanırım her şey tipik bir kullanım şekli hakkında her üreticinin fikrine bağlı.
Cearny

2

Birkaç yıl önce, kullandığımız çok kötü tasarlanmış bazı uygulamalar için tampon olarak birkaç 32gb SLC sürücüsü kullandım.

Uygulama% 90 küçük yazma (<4k) idi ve bir kez SSD sürücülerinde 14k w / s hızında (24/7) çalışıyordu. RAID 1'i yapılandırmışlardı, her şey pembe, gecikme düşüktü!

Bununla birlikte, kabaca bir ay ve ilk sürücü toplandı, tam anlamıyla 3 saat içinde ikinci sürücü de öldü. RAID 1 sonuçta böyle iyi bir plan değil :)

Bir başka RAID 6 konulu diğer afişlerle aynı fikirde olanları başka sürücülere dağıtacaksa kabul ediyorum.

Şimdi bunun birkaç yıl önceydi ve bu şeyler şimdi çok daha güvenilirdir ve benzer bir G / Ç profiliniz olmayabilir.

Uygulama yeniden tasarlandı, ancak size yardımcı olabilecek veya yardım etmeyecek bir durma boşluğu olarak, büyük bir ram diski oluşturduk, ram diski yeniden inşa etmek / yedeklemek ve bazı saatlerde veri kaybına uğramak için bazı komut dosyaları oluşturduk. /iyileşme süresi.

Yine, verilerinizin yaşam döngüsü farklı olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.