Prometheus'u , çalışan altyapıyla ilgili ayrıntılı metrikleri toplamak için izleme iş akışlarıma kademeli olarak entegre ediyorum .
Bu sırada, sık sık tuhaf bir sorunla karşılaştığımı fark ettim: Bazen Prometheus'un veri çekmesi gereken bir ihracatçı yanıt vermiyor. Belki bir ağ yanlış yapılandırması nedeniyle - artık erişilebilir değil - ya da sadece ihracatçı çöktüğü için.
Sebep ne olursa olsun, Prometheus'da görmeyi beklediğim bazı verilerin eksik olduğunu ve dizide belirli bir süre için hiçbir şey olmadığını görüyorum. Bazen, bir ihracatçı başarısız olur (zaman aşımı?) Başkalarının da başarısız olmasına neden olur (ilk zaman aşımı tüm işi üst düzey zaman aşımının üzerine itti? Sadece spekülasyon).
Tek gördüğüm, yukarıdaki görselleştirmede gösterildiği gibi serideki bir boşluk. Bu olduğunda günlükte hiçbir şey yoktur. Prometheus öz ölçümleri de oldukça kısır görünüyor. Ben sadece Prometheus ne yaptığını çoğaltmak ve nerede kırıldığını görmek için el ile başvurmak zorunda kaldı. Bu çok rahatsız edici. Daha iyi bir yol olmalı! Gerçek zamanlı uyarılara ihtiyacım olmasa da, en azından bir ihracatçının veri teslim edemediğini görmek istiyorum. Bir boolean "hey verilerinizi kontrol edin" bayrağı bile bir başlangıç olacaktır.
İhracatçılardan veri alamama konusunda Prometheus hakkında nasıl anlamlı bilgiler edinebilirim? Prometheus veri toplama işlemini manuel olarak yapmak zorunda kalmadan boşlukların neden olduğunu nasıl anlayabilirim? Bu bağlamda, belki de Prometheus'un ötesinde veri toplamalarını izlemeye genişletildiğinde bile mantıklı uygulamalar nelerdir?