Yanıtlar:
Bu var 99 persentil . Bu, isteklerin% 99'unun verilen gecikmeden daha hızlı olması gerektiği anlamına gelir. Diğer bir deyişle, taleplerin sadece% 1'inin daha yavaş olmasına izin verilmektedir.
Bunu bir benzetme ile açıklayabiliriz, eğer 100 öğrenci bir yarış koşuyorsa 99 öğrenci yarışı "gecikme" süresinde bitirmelidir.
Hizmetinizin performans verilerini topladığınızı ve aşağıdaki tablonun sonuçların toplamı olduğunu hayal edin (gecikme değerleri fikri açıklamak için kurgusaldır).
Latency Number of requests
1s 5
2s 5
3s 10
4s 40
5s 20
6s 15
7s 4
8s 1
Hizmetinizin P99 gecikmesi 7 saniyedir. Taleplerin sadece% 1'i bundan daha uzun sürüyor. Dolayısıyla, hizmetinizin P99 gecikmesini azaltabilirseniz performansını artırırsınız.
Buradan bir örnek alalım
Request latency:
min: 0.1
max: 7.2
median: 0.2
p95: 0.5
p99: 1.3
Dolayısıyla, web isteklerinin yüzde 99'unu, bulunan gecikmenin 1,3 ms (ms / mikrosaniye yapılandırılan sistem gecikme ölçülerinize bağlıdır) veya daha düşük olduğunu söyleyebiliriz. @Tranmq'in söylediği gibi, hizmetin P99 gecikmesini azaltırsak performansını artırabiliriz.
Ve p95'i de belirtmekte fayda var, çünkü birkaç istek p99'u p95'ten daha pahalı hale getiriyor olabilir, örneğin) önbellek oluşturan ilk istekler, sınıf nesneleri ısınır, iş parçacıkları başlatılır ...
En sonunda; ölçümlerimizde (ağ tıkanıklıkları, kesintiler, hizmet bozulmaları gibi) kabaca% 1 gürültü olabilir, bu nedenle p99 gecikmesi, pratik olarak en kötü durumun iyi bir temsilcisidir. Ve neredeyse her zaman hedefimiz p99 gecikmesini azaltmaktır.
Should
değilwill
.