Matematiksel olarak, bir dizi düğüme ve ilgili çalışma süresi yüzdesine göre bir çalışma süresi yüzdesi nasıl hesaplanır?


11

Bu soru, bir sunucu sorusundan daha çok bir matematik sorusudur, ancak kesinlikle sunucu ile ilgilidir.

Eğer 95% çalışma süresini garanti edebilecek bir sunucum varsa ve bu sunucuyu 2 kümesine koyarsam, çalışma süresi ne kadar olur? Şimdi diyelim ki ben de aynısını yapıyorum, ama ben bunu 3'lük bir kümeye mi dönüştürüyorum?

Tek bir başarısızlık noktası gibi şeyleri düşünmeyelim, sadece burada matematiğe odaklanalım. Bunu biraz karmaşıklaştıran şeylerden biri, örneğin 2 sunucum varsa, her ikisinin de kapalı olma şansının 2 ^ 2 olması, bu yüzden 1/4; veya 3 için 2 ^ 3 yani 1/8. Bu sunucuların her biri için% 5 kesinti yaşadığım düşünüldüğünde, toplam ortalama% 5'in 1 / 8'i kadar mı?

Böyle bir şeyi nasıl hesaplarsınız?


"% 95 çalışma süresi" - taaat nedir? 5 gün ya da 5 yıl çalışmanın ne olduğunu biliyorum. 0,95 çalışma süresi nedir? Hangi birimler?
poige

1
Bunu neden bilmeniz gerekiyor? Kullanım durumu nedir?
ewwhite

@poige Muhtemelen, "% 95 çalışma süresi", "çalışma süresi zamanın% 95'ini içerir" anlamına gelir, ancak bu konuda bilgiçlik yapmaya karar verdiyseniz, bu nedenle her şeyin ~% 0 çalışma süresine sahip olduğunu söyleyebilirsiniz. .
Monica'nın Davası

1) Yazarın cevaplaması gerekir mi? ;) 2) Bir şeyi hesaplamadan önce ne olduğunu anlamak daha iyi olduğunu düşünüyorum. ;)
poige

Yanıtlar:


11

Uptime bir kullanılabilirliğini hesaplamak isterseniz ... Kaygan şeydir hizmet o zaman basitçe

amount of time service is available
-----------------------------------   x 100
  amount of time that has passed 

Hizmeti sağlayan bir kümeniz varsa, hizmetin kullanılamaması olasılığı azalır, ancak hizmetin kullanılabilirlik (çalışma süresi) hesaplaması aynı kalır.


8

Bir sunucunun çevrimdışı olma şansı (1 - 0.95) Her iki sunucunun da çevrimdışı olma şansı (1 - 0.95) * (1 - 0.95) = 0.0025 vb.

Bu nedenle, modelinizi kullanarak ve tamamen matematiksel bir bakış açısıyla, sunuculardan birinin veya her ikisinin de zamanının% 99,75'i kadar olması gerekir

Ancak, böyle bir matematiksel model kullanmanın potansiyel çalışma sürenizi çözmek için doğru yol olduğundan emin değilim, çünkü her iki sunucu için ortak olan diğer faktörler de olabilir. BOTH sunucularını etkileyecek bir elektrik kesintisi var, bu yüzden bir kümeye sahip olmak fark yaratmayacak


Merhaba Phil. Güç, kesinlikle birden fazla rafa kurulumlar yaparak ve farklı kaynaklardan vb. Güç alarak hafifletilebilecek bir kullanılabilirlik bileşenidir. Fikir sadece matematiksel bir bakış açısına sahiptir, çünkü buna sadece birkaç sunucudan daha fazla bileşen girmektedir. :)
Jeroen Landheer

8
Mesele şu ki, bu ve Jeroen'in cevabındaki hesaplamalar sadece çalışma süreleri bağımsızsa (matematiksel anlamda) çalışır. Eğer korelasyonlar varsa (örn. Her iki rafı besleyen güç kablosu) işler o kadar basit değildir.
TripeHound

@TripeHound Bu yüzden cevabımı yazdım :)
Seamus

5

Bu, sunucularınızın neden% 5 zaman kaybettiğine bağlıdır. Zamanın güç% 95 var, ama sizin sunucuları aksi kusursuz ise, daha sonra aynı yere ikinci bir sunucu çalışma süresini artmaz hiç biri aşağı giderse, hem aşağı gitmek. Bu, ilişkili olan başarısızlıklara bir örnektir . Kesinti sürelerinizin en azından bir kısmının, tüm sunucuları birlikte etkileyen hatalardan kaynaklanması muhtemeldir (güç ...). Ancak bazı kesinti süreleri bağımsız olacaksunucular arasında. Eğer doğru bir şekilde yapmak istiyorsanız, bu şeylerle ayrı ayrı ilgilenmelisiniz. Bu nedenle, sunucu 1'in bağımsız bir hata (p) olmaması ve sunucu 2'nin bağımsız bir hata (q) olmaması ve her ikisini de (r) öldüren sistemik bir hata olmaması olasılığını çözmek istersiniz. Bu hataların bağımsız olduğunu varsaymak nispeten güvenlidir ve böylece bunları birlikte çoğaltabilirsiniz: p q r, bir sunucunun hazır olma olasılığıdır.

Sorun şu ki, gerçek çalışma zamanı verilerini p, q ve r için değerler vermek için kullanamazsınız, ancak sadece sunucu 1'iniz varsa ve zamanın% 95'inde ise, p * r = 0.95.


5

Her şeyden önce, bir kümenin toplam kullanılabilirliği veya çalışma süresi, tüm kümenin 'yukarı' olarak değerlendirilebilmesi için kümenin bir kısmının ne kadar aktif olması gerektiğine bağlıdır.

  • Çalışan bir makine yeterli mi? Bu, herhangi bir makinenin gerektiğinde tam yükü alabileceği anlamına gelir.
  • Hepsinin aynı anda aktif olması gerekiyor mu? Yani artıklık yoktur.
  • Ya da belki her üç çevrimiçi kişiden ikisi yeterlidir? Bu, ilk durumdan daha büyük bir iş yüküne izin verecektir.

Bildiğiniz gibi, ilk iki vakanın hesaplanması oldukça basittir. Tek bir sunucunun herhangi bir zamanda çevrimiçi olma olasılığı p = 0,95 olsun. Şimdi, üç sunucu için, hepsinin aynı anda çevrimiçi olma olasılığı p 3 = 0.857375'tir.

Belirli bir zamanda en az bir makinenin aktif olması gereken tersi durumda, sorunu tersine çevirerek ve makinelerin çevrimdışı olma olasılıklarına bakarak hesaplamak daha kolaydır . Tek bir makinenin çevrimdışı olma olasılığı q = 1- p = 0.05'dir ve bu nedenle hepsinin aynı anda düşme olasılığı q 3 = 0.000125'tir, bu da 1- q 3 = 1- (1- p ) olasılığı verir. 3 = 0.999875 en az bir tane yukarıda.

3 durumdan 2'sinin hesaplanması biraz daha zordur. Üç sunucudan en az ikisinin bulunduğu dört olası durum vardır. 1) ABC yukarı, 2) AB yukarı, 3) AC yukarı, 4) BC yukarı. Tüm bunların olasılıkları sırasıyla ppp , ppq , pqp ve qpp'dir . Olgular ayrık olduğundan, toplam A = p 3 + 3 p 2 q = 0.992750 vererek olasılıklar birlikte eklenebilir.

(Bu daha fazla makineye genişletilebilir. Faktörler iyi bilinen binom katsayılarıdır , bu nedenle farklı vakaları elle saymak çoğunlukla bir egzersiz olarak çalışır.)


Tabii ki, bunun gibi hesaplamalar hazır bir bilgisayar programı kullanarak başa çıkmak için çok daha kolay ... En az bir çevrimiçi hesap makinesi burada bulabilirsiniz:
http://stattrek.com/online-calculator/binomial.aspx

Giriş değerlerinin girilmesi: başarı olasılığı = 0.95, deneme sayısı = 3, başarı sayısı = 2, "Kümülatif Olasılık: P (X ≥ 2) = 0.99275") sonucunu alırız. Bazı diğer ilgili değerler de verilir ve çevrimiçi araç diğer numaralarla oynamayı da kolaylaştırır.


Ve evet, yukarıdakilerin tümü, sunucuların bağımsız olarak başarısız olduğunu varsayar, yani a) Kümeyi bir bütün olarak etkileyen herhangi bir sorunu göz ardı ettim, b) sunucuların başarısız olmasını olası kılacak bileşen yaşlanması gibi bir şey yok ya da neredeyse aynı anda.


3

Her sunucu için% 5 kesinti süreniz vardır, bu nedenle bunu çarpın - 0.05 * 0.05 = 0.0025, size 1-0.0025 = 0.9975 ->% 99 çalışma süresi sağlar. 3 sunucu ile 1-0.000125 = 0.999875>% 99.9 kesintisiz çalışma süresine sahipsiniz.

Normalde bağımsız ana bilgisayar (yedek HDD ve PSU ile) için% 97 kullanılabilirlik sağlayarak 2N için>% 99.9 ve 3N artıklık için>% 99.99 veririm.


3

Biraz daha kazma yaptım ve bulmacanın bu parçasını buldum.

Kullanılabilirliği% 95 olan bir sunucu örneği kullanmak, daha sonra ikinci bir sunucu eklemek kullanılabilirliği şu şekilde artıracaktır:% 95 + (% 1-95) *% 95 =% 99,75. Bunun ardındaki mantık, 1. sunucu kapalı olduğunda (zamanın% 5'i), ikinci sunucunun hala% 95 oranında artmasıdır.

3. bir sunucu eklemek de aynı şekilde tekrar eder. İlk 2 birlikte zaten% 99,75 kullanılabilir, bu nedenle 3. tanesini eklemek% 99,75 + (% 1-99,75) *% 95 =% 99,9875 olacaktır. Ve bu böyle devam eder. Bu, Phil'in cevabına yakın, ancak yine de biraz farklı çünkü önceki yinelemenin sonucunu almanız ve bir sonrakinde kullanmanız gerekiyor.

Birbirine bağımlı bileşenler için kullanılabilirlik yüzdelerini çoğaltırsınız, bu nedenle% 50 kullanılabilir olan 2 bileşene sahipseniz,% 25 toplam kullanılabilirliğe sahip olursunuz (yani sistem yalnızca her iki bileşen çalıştığında da çalışır.)


0

Her sunucunun çalışma süresinin diğerlerinden bağımsız olduğunu varsayarsak, toplam çalışma süresi

1 - (0.05) ^ n

N, sunucu sayısıdır ve 0.05, bir sunucunun kesinti olasılığıdır

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.