Disk kapasitesine yanıt olarak depolama IOPS'si nasıl değişir?


12

Diğer tüm şeyler eşit olduğunda, bir depolama dizisinin IOPS performansı daha büyük diskler kullanırsa nasıl değişirdi.

Örneğin, 10 X 100GB diskli bir dizi alın.

Sıralı 256 kb blok yazma (veya herhangi bir IOPS metriği) için IOPS'u ölçme

Ortaya çıkan ölçülen IOPS'nin 1000 IOPS olduğunu varsayalım.

10 X 200GB diskli diziyi değiştirin. Aynı RAID yapılandırması, aynı blok boyutu vb. İle biçimlendirin.

IOPS'un aynı kalması, artması veya azalması beklenir mi? Değişiklik kabaca doğrusal olur mu? yani 2 kat artar veya 2 kat azalır (disk kapasitesini 2 kat arttırdığım için)

Bu soruları 10 X 50GB disklerle tekrarlayın.

Düzenle: Daha Fazla İçerik

Bu soru, Sysadmin ekibim arasında her türlü depolama alanında iyi bilgili olmayan bir konuşma ile sonuçlandı. (Depolamanın birçok yönüyle rahattır, ancak bir SAN'ı veya diğerlerini yönetme ayrıntılarını değil). Mevcut tepsilerimizden daha yüksek disk kapasitesi - çift kapasite - olan yeni bir Netapp tepsisi alıyoruz. Yeni tepsilerin IOPS'unun sadece diskler daha büyük olduğu için daha düşük olacağı yönünde yorum yapıldı. Sonra bunu açıklamak için bir araba benzetmesi geldi. Hiçbir yorum benimle iyi oturdu, bu yüzden Takım, yani Stack-Exchange-arazi çalıştırmak istiyorum.

Araba benzetmesi, farklı hızlanma, aynı maksimum hız ve çeyrek mil koşan iki araba hakkında bir şeydi. Ardından mesafeyi yarım mil olarak değiştirin. Aslında, tam benzetmeyi hatırlayamıyorum, ancak interwebz'de benzer olan başka bir tane bulduğumdan, bunun muhtemelen ortak bir IOPS benzetmesi olduğunu düşündüm.

Bazı yönlerden, bu satın alma işlemini değerlendirmek için bu bilgileri kullanmadığımızdan, sorunun gerçek cevabı benim için çok önemli değil. Ancak tepsileri mevcut bir kafaya tutturmanın en iyi yolunu ve agregaları ve hacimleri çıkarmak için en iyi yolu değerlendirmemiz gerekir.


2
Disk kapasitesi yükselirse saniyede G / Ç işlemleri yükselmez - aktarım hızı uçtan uca ve disk g / ç hızı (ve önbellekleme) ile ilgilidir. Çözmeye çalıştığınız sorun nedir?
EightBitTony

3
Bu varsayımsal (ve dolayısıyla konu dışı) mı?
mfinni

Gerçekten değişmez ... tabağın baş hareketini kısa
oklarla

Bir yan notta, daha büyük diskler genellikle daha modern kontrolörler, motorlar ve kafalar içerir, daha küçük diskler genellikle sadece "yeterince iyi" olan önceki genleri yeniden kullanır, bu nedenle yüksek kapasiteli diskler genellikle daha hızlıdır, çünkü daha büyük oldukları için değil, daha iyi yapılmış.
Vality

2
@mfinni: Maalesef (sanal) disk boyutuna göre IOPS üzerinde yapay bir kısıtlamaya sahip bulutlu hizmetler var. Ayrıntılar için cevabıma bakın. Daha önce bununla karıştırılmış "devops" gördüm.
dotancohen

Yanıtlar:


8

Sorunuzu doğrudan cevaplamak için - tüm diğer şeyler eşittir = GB değiştiğinde hiçbir değişiklik olmaz.

GB ile IOPS ölçmezsiniz. Arama süresini ve gecikmeyi kullanırsınız.

Hepsini buraya yeniden yazabilirdim, ancak aşağıdaki örnekler zaten tüm bunları yapıyor ve basitçe tekrarlıyorum:

https://ryanfrantz.com/posts/calculating-disk-iops.html

http://www.big-data-storage.co.uk/how-to-calculate-iops/

http://www.wmarow.com/strcalc/

http://www.thecloudcalculator.com/calculators/disk-raid-and-iops.html



Ancak bir diskin kapasitesi daha yüksekse arama süresi ve gecikme süresi artmaz mı?
JDS

@JDS olması gerekmez. Bazen yaparlar ve bazen yapmazlar çünkü üreticiler sürekli olarak plakalara daha fazla bit doldururlar (daha fazla GB) ve ayrıca sabit sürücülerinin diğer yönlerini sürekli olarak geliştirirler. Sürücü büyüdüğünde, aynı zamanda diğer donanım yükseltmelerini de aynı anda alır , bu da arama sürenizi veya gecikmeyi azaltabilir ve böylece IOPS'nizi artırabilir. Ancak hepsi tartışmalı bir nokta çünkü GB'ın IOPS ile doğrudan bir ilişkisi yok, sadece zaman arayın ve okuma ve yazma gecikmesi IOPS'yi etkiler.
Ian Macintosh

11

Bunun muhtemelen varsayımsal bir soru olduğunu biliyorum ... Ama BT dünyası gerçekten böyle çalışmıyor. Dikkate almak gerçekçi kısıtları, artı diğer şeyler vardır edebilirsiniz IOPS etkilemek ...

  • 50GB ve 100GB diskler artık mevcut değil. Daha fazla düşünün: kurumsal disklerde 72, 146, 300, 450, 600, 900, 1200GB ve yakın hat / orta hat yığın depolama ortamında 500, 1000, 2000, 3000, 4000, 6000GB .

  • Modern depolamada çok fazla soyutlama var; disk önbellekleme, denetleyici önbellekleme, SSD boşaltma, vb. farkların fark edilmesi zor olacaktır.

  • Dikkate alınması gereken farklı sürücü form faktörleri, arayüzler ve dönme hızlarınız var. SATA diskleri, SAS veya nearline SAS'tan farklı bir performans profiline sahiptir . 7.200 RPM diskler 10.000 RPM veya 15.000 RPM'den farklı davranır. Ve çeşitli dönme hızlarının mevcudiyeti belirli kapasitelerle sınırlıdır.

  • Fiziksel denetleyici düzeni. SAS genişleticiler, RAID / SAS denetleyicileri, disk düzenine, aşırı abonelik oranlarına, bağlantının sunucu içinde mi yoksa harici bir muhafazada mı olduğuna bağlı olarak IOPS'yi etkileyebilir. Çok sayıda SATA diski, genişleticilerde ve sürücü hatası koşullarında düşük performans gösterir .

  • Bunlardan bazıları, disk dizisinde kullanılan kapasite, parçalanmadan etkilenebilir.

  • Hiç kısa okşayarak duydunuz mu?

  • Yazılım ve donanım RAID, ön getirme, uyarlamalı profil oluşturma ...

İlk etapta kapasitenin performans üzerinde herhangi bir etkisi olacağını düşünmenize neden olan şey nedir ? Daha fazla bağlam sağlayabilir misiniz?

Düzenle:

Disk tipi, form faktörü, arabirim ve kullanılan kapasite aynıysa, IOPS'ta kayda değer bir fark olmamalıdır. Diyelim ki 300GB'dan 600GB'a kadar kurumsal SAS 10k disklere gidiyorsunuz. Aynı iğ sayısı ile, herhangi bir performans farkı görmemelisiniz ...

Bununla birlikte, bahsettiğiniz NetApp disk raflarında eski bir 3Gbps'ye karşı 6Gbps veya 12Gbps SAS arka planları kullanılıyorsa, daha yeni ekipmanlara gitmede bir verim değişikliği görebilirsiniz.


Bağlam eklemek için orijinal sorumu düzenledim. Seçtiğim sayılar gerçek dünya değildi, sadece varsayımsal hesaplamaları kolaylaştırmak içindi. Ayrıca, diğer yorumlarınızın çoğu "her şey eşit" sütununa girer. Değişen tek şeyin tek tek disklerin kapasitesi olduğunu varsayın
JDS

@JDS Yukarıdaki düzenlememe bakın.
ewwhite

9

Orada tek yer olan , disk boyutu ve IOPS arasında doğrudan bir ilişki içindedir Amazon AWS Cloud ve diğer "bulutlu hizmetler". İki tür AWS hizmeti ( Elastik Blok Deposu ve İlişkisel Veritabanı Hizmeti ) daha büyük disk boyutları için daha yüksek IOPS sağlar.

Bunun Amazon tarafından hizmetlerine getirdiği yapay bir kısıtlama olduğunu unutmayın . Bunun olması için donanıma bağlı bir neden yoktur. Ancak, bu kısıtlamanın masaüstü sistemleri ve benzerleri için de uygun olduğuna inanan, sanallaştırılmamış donanıma aşina olmayan devops türlerini gördüm . Disk boyutu / IOPS ilişkisi, donanım kısıtlaması değil, bulut pazarlama kısıtlamasıdır.


1
İyi bir noktaya değindin. Müşterilere performans ve kapasite sağlamak için performans SLA'larına bakıyoruz. Ve seviye bazında 'terabayt başına iops' modelini - yükseltme döngülerimizi bilgilendirmek için kullanabileceğimiz - GİB: TB oranı yüksekse SSD ve düşükse SATA satın almayı düşünüyoruz. Herhangi bir dizi limiti veya kısıtlaması nedeniyle değil, maliyet ve şarj modellerini kavramamız gerektiğinden.
Sobrique

2
İlginç. Buradaki bulutlu bağlamı düşünmedim . Sanırım geldiğim perspektifi gösteriyor ...
ewwhite

4

IOPS'un sıralı yazmalarda büyük bir hız ölçümü olmadığını belirtmeliyim, ancak bununla devam edelim.

Disk kafalarının arama ve yazma sürelerinin, disklerin boyutuna rağmen oldukça tutarlı olduğundan şüpheleniyorum. 20 yıl önce hepimiz aynı okuma / yazma hızlarında (kabaca - kesinlikle doğrusal değil) 60GB diskler kullanıyoruz.

Eğitimli bir tahminde bulunuyorum ancak diskin yoğunluğunun diskin performansı ile doğrusal bir ilişki içinde olduğunu düşünmüyorum.

Örneğin, 10 X 100GB diskli bir dizi alın.

Sıralı 256 kb blok yazma (veya herhangi bir IOPS metriği) için IOPS'u ölçme

Ortaya çıkan ölçülen IOPS'nin 1000 IOPS olduğunu varsayalım.

tamam

10 X 200GB diskli diziyi değiştirin. Aynı RAID yapılandırması, aynı blok boyutu vb. İle biçimlendirin.

IOPS'un aynı kalması, artması veya azalması beklenir mi?

Muhtemelen birbirine kabaca eşit kalır.

Değişiklik kabaca doğrusal olur mu?

Dönen medyanın tarihi bana muhtemelen bir ilişki olmadığını söylüyor.

Bu soruları 10 X 50GB disklerle tekrarlayın

Yine, kabaca eşdeğer.

Tüm bu durumlarda hızınız, RAID'in on yazma kafasına sahip tek bir disk gibi davranması gerçeğinden kaynaklanır, böylece her diske paralel olarak işin 1 / 10'unu gönderebilirsiniz.

Size gösterecek zor sayılarım olmasa da, geçmiş deneyimlerim disk performansınızı artırmanın daha fazla kapasite elde etmek kadar basit olmadığını söylüyor.

Pazarlama insanlarının size söylediklerine rağmen inovasyon olmasına rağmen, ucuz (er) katı hal disklerinin başlangıcından önce, son 20 yılda dönen medyanın performansında çok az önemli gelişme olmuştur, muhtemelen sadece pastan kurtulabileceğiniz çok fazla şey vardır. ve sadece o kadar hızlı ki mevcut disk kafası modellerimizi kullanmaya başlayabiliriz.


Bir sürücüdeki plakaların artması veya plaka yoğunluğunun artması (bayt başına daha az hareket) nedeniyle bazı iyileştirmeler olabilir, ancak bunun büyük olduğundan şüpheliyim.
Bill Weiss

Doğruluk için ödediğiniz yoğunluğun ne olacağını tahmin ediyorum.
Matthew Ife

1994 yılında 60GB'lık diskleriniz vardı !?
warren

3

Depolama birimine eklenen performans, her bir fener mili eklenerek ölçeklenir. Sürücünün dönme hızı en büyük faktördür, bu nedenle 10k RPM sürücü eklemek 7.2k RPM sürücüden daha fazla performans (rastgele IO'da IO / s veya IO'da MB / s açısından) verecektir. Sürücünün boyutunun neredeyse hiçbir etkisi yoktur.

İnsanlar küçük disklerin daha hızlı gittiğini söylüyor çünkü kullanılabilir TB başına daha fazla iğ gerekiyor. Bu iğlerin sürücü boyutunun arttırılması performansı düşürmez, ancak disklere daha fazla veri sığdırmanıza izin verir, bu da iş yükünün artmasına neden olabilir.


2

Diğerlerinin eşit olduğunu varsayarsanız, daha büyük kapasiteli disklerin performans özellikleri çok fazla değişmez. 10K RPM FC sürücü, 300GB veya 3TB olmasına bakılmaksızın çok benzer özelliklere sahiptir. Plakalar aynı hızda döner ve kafalar aynı hızda arama yapar.

Aynı şekilde sürekli verim - çok fazla fark yok. Bu, birçok performans sorununun köküdür, ancak birçok durumda insanlar terabayt satın alır, GİB veya MB / sn satın almazlar.

3 TB'lık bir sürücüyü 300 GB'lık bir sürücü olarak yeniden oluşturmak / kopyalamak 10 kat daha uzun sürer.

Sonuç olarak, depolama projeleri için önemli ölçüde aşırı kapasiteye bakmak zorunda kaldık - sürücü boyutları hala büyüyor, ancak performans yetenekleri fazla değil. Bu nedenle, en az bir durumda, 100 TB'lik bir gereksinimi karşılamak için ~ 400 TB depolama alanı satın aldık, çünkü iğlere ihtiyacımız var.


0

Diskleri (SSD'yi değil) döndürüyorsanız, diğer her şey eşitse, diskin dış izlerini kullanırsanız aktarım hızı daha yüksektir. Yalnızca kısmen doldurulmuş bir disk kullanırsanız bu otomatik olarak gerçekleşir. Aynı zamanda, bir disk sadece kısmen doldurulmuşsa, ortalama kafa hareketiniz daha az olur ve kafa hareketlerinin sayısı daha az olur, çünkü parça başına daha fazla veri vardır.

İster tek bir disk isterse RAID sürücü kullansanız da bu doğrudur.

Şimdi 100GB ve 2000GB diskleri karşılaştırıyorsanız, diğer her şeyin eşit olmadığından emin olabilirsiniz . Ancak aynı üretici bir, iki, üç ve dört plakalı 500 GB, 1 TB, 1.5 TB ve 2 TB sürücüler sunuyorsa, diğer her şeyin eşit olması muhtemeldir ve 10 x 500 GB, 4 TB veri depolamak için 10 x 2 TB'den daha yavaş olacaktır. (500 GB sürücüler de neredeyse boş olacağından, yalnızca 100 GB depolarsanız hiçbir fark olmaz).

Ancak RAID sürücüler için, aktarım hızı ile değil, dönme gecikmesi ile çok sınırlı olacaksınız. Bu nedenle daha yüksek RPM daha önemli olacaktır. Ve genellikle daha düşük kapasite ile birlikte daha yüksek RPM bulacaksınız. Öte yandan, yüksek RPM / düşük kapasite ile giderseniz, SSD sürücülerine de bakabilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.