Sunucu yanıt süresini modellemek için en yaygın olarak hangi dağıtım kullanılır?


16

Bu sunucu uygulamasına yapılan her isteği tamamlamak için geçen zamanı ölçtüğüm sunucu uygulaması tabanlı bir uygulamam var. Zaten ortalama ve maksimum gibi basit istatistikleri hesaplıyorum; Ancak biraz daha karmaşık analizler yapmak istiyorum ve bunu yapmak için, bu tepki sürelerini doğru bir şekilde modellemem gerektiğine inanıyorum.

Elbette, yanıt sürelerinin iyi bilinen bir dağılımı izlediğini ve dağıtımın doğru model olduğuna inanmak için iyi nedenler olduğunu söylüyorum. Ancak bu dağılımın ne olması gerektiğini bilmiyorum.

Log-normal ve Gamma akla geliyor ve her iki tür gerçek tepki süresi verisini de sığdırabilirsiniz. Yanıt sürelerinin takip etmesi gereken dağıtım hakkında bir fikri olan var mı?

Yanıtlar:


17

Giriş-Normal dağılım ben bir süre boyunca bütün kullanıcı tabanı genelinde sunucu yanıt kez gecikmeleri anlatan en iyi bulmak biridir.

Uygun bir şekilde adlandırılmış lognormal.com sitesinde, zaman içinde site gecikme dağılımını ve daha fazlasını ölçme işinde bazı örnekler görebilirsiniz . Mutlu bir kullanıcı olmak dışında siteyle hiçbir bağlantım yok. Dağıtım şöyle görünür; yanıt (ör. web sayfası yükleme) süresi ile yanıt sayısı:

log-normal dağılım

Bu grafikte, yükleme süresi (X ekseni) ölçeğinin doğrusal olduğunu unutmayın. X eksenini bir günlük ölçeğine değiştirirseniz, dağılımın şekli zirvenin sağ tarafında daha normal (çan şeklinde) görünecektir.


Bu PDF bence gerçekten bir Fréchet gibi görünüyor.
usεr11852 diyor Reinstate Monic

4

Örnek Grafik.  Daha fazla derinlik için makaleye bakın.

Araştırmam en iyi modelin birkaç şeyle belirlendiğini gösteriyor: 1) Beden, kuyruk veya her ikisiyle ilgileniyor musunuz? "Her ikisi de" değilse, filtrelenmiş bir veri kümesinin modellenmesi daha yararlı olabilir. 2) Çok basit veya çok doğru bir tane ister misiniz? yani kaç parametre?

Eğer 1'in yanıtı "ikisi de" ve 2'si "basit" ise, Pareto en iyi sonucu verir gibi görünüyor. Aksi takdirde, 1 "gövde" ve 2 "basit" ise - filtrelenmiş bir erlang modeli seçin. 1 "ikisi birden" ve 2 "doğruysa", büyük olasılıkla günlük alanındaki verilerinizde bir gauss karışım modeli istersiniz - etkin bir şekilde lognormal bir uyum.

Son zamanlarda bunu araştırıyorum ve genel internette yeterince iyi ele alınacak bir konu bulamadım, bu yüzden araştırmamı bu konuyla ilgili ayrıntılı bir blog yazısı yazdım .


1
Grafik için teşekkürler. Sahip olduğunuz (kabaca) tri-modal dağılımına dayanarak, bunun basit (tek bir sunucu) ayarı olmadığına inanıyorum. Daha yavaş olan bazı ara katman yazılımlarınız veya arka uçlarınız var gibi görünüyor. Bunlar, kullanıcıya bakan sunucu potansiyel olarak önbelleğe alınmış arka uç alt sistemlerin yanıt vermesini beklediğinde genel yanıtın yavaşlamasına neden olur. Ayrıca X ve Y eksenlerinin neyi temsil ettiği de net değil. Yükleme süresini (orijinal olarak X ekseni) ve sayımları (orijinal olarak Y ekseni) ters çevirdiniz mi?
arielf

Geri bildiriminiz için teşekkürler! Kaynak veri seti, web hizmeti isteklerinden pinglere daha çok benziyordu, ancak trimodal dağılımının esas olarak iki şeyden kaynaklandığını tahmin ediyorum: 1) Ana iki modlu asimetri iki ağ yolundan kaynaklanırken, 2) uzun kuyruk 3. bileşeni, tcp hata kurtarma senaryolarından kaynaklanmaktadır. Bu sadece bir tahmin ... ana odak noktam süreç ve teori değil, çeşitli modellerin ampirik faydasıydı. Tersine çevrilmiş eksen hakkında ne sorduğunuzdan tam olarak emin değilim, ama ... örnek bir planınız var mı?
Andrew Charneski

Ayrıca özensiz grafikte özür dilerim. X ekseni mikrosaniyedir ve y ekseni olasılık yoğunluğudur. (Evet, biliyorum ... özür dilerim ... yeniden üretilebilir bilim için not defterine bakın.)
Andrew Charneski
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.