Bant genişliği ölçümü Kaktüs grafiği üzerinde neden yüksek dalgalanma oluyor?


14

Ağımızda Etherchannel ve Routing yedeklilik testindeydik. Bu müdahale sırasında bazı ölçümler yaptık. İzleme aracımız grafik kaktüsleridir. İzlenen ekipman VSS'de 4500-X'dir. Her bağlantı farklı bir fiziksel kasa üzerindedir.

Şema:

eterkanal 1

Test kronolojisi:
[t0] te1 / 1/14 bağlantı noktasındaki bağlantı fiziksel olarak kaldırıldı. Te2 / 1/14 aktif. Po1 çalışır durumda.
[t0 + 15] Te1 / 1/14 bağlantı noktasındaki bağlantı hizmete döndü ve eterchannel Po1'deki bağlantı noktasının
[t0 + 20] te1 / 1/14 bağlantı noktasındaki bağlantının fiziksel olarak kaldırıldığını kontrol etti. Te2 / 1/14 aktif. Po1 çalışır durumda.
[t0 + 35] Te1 / 1/14 bağlantı noktasındaki bağlantı hizmete döndü ve tekrar eterchannel Po1'deki bağlantı noktasının kontrol edildiğini kontrol etti

Testlerimizde, Kaktüslerden Po1 trafik eterkanalını izledik (aşağıdaki grafik) ve ters yönde oldukça kararlı te1 / 1/14 bağlantısını (bağlantı te2 / 1/14 varlıkları) devre dışı bıraktığımızda akış değerinde önemli bir değişiklik fark ettik. . Biz de int Po1 sayaçları kontrol ve bunlar oldukça kararlı tutuldu.

grafik

LACP yapılandırılmış Etherchannels'da 10G'nin iki arayüzü paketlenmiştir. Eterchannelin içinde 2 vlans vardır. Biri Çok Noktaya Yayın trafiği ve diğeri İnternet / Tüm Trafik için.

Bu davranışın olası bir nedenini biliyor musunuz?


Her testi ne kadar sürdün?
laf

Her port bağlantısının kesilmesi, kronolojide görebileceğiniz gibi 15 dakika sürer.
13'te cgasp

Her iki taraftaki bağlantı noktası kanalı yapılandırmanız ve yük dengesi türünüz nedir? Test paketiniz ve bu trafiği üreten parametreler hakkında bize ne söyleyebilirsiniz - bir akış, çoklu akışlar, protokol, vb.
generalnetworkerror 4:13

LACP yapılandırılmış Etherchannels'da 10G'nin iki arayüzü birlikte verilir. Eterchannelin içinde 2 vlans vardır. Biri Çok Noktaya Yayın trafiği ve diğeri İnternet / Tüm Trafik için. Soru güncellendi.
13'te

Test, yönlendirme protokolleri ve eterkanallar üzerinde genel bir artıklık testinde yapıldı. Bir bağlantı aşağı giderse ne olur. Tüm testler beklendiği gibi çalışıyor ancak bandwitdh ölçümünde bu davranışın nedenini merak ediyoruz.
13'te

Yanıtlar:


11

Ytti'nin yorumunu uzatmak için.

Eğer doğru okursam 10 saniyede bir anket aralığınız gerçekten küçük görünüyor. Bu sonucu elde etmenizin birkaç nedeni var.

Ekipman tarafı:

  • Kötü sayaç seçimi, 32 bitlik sayaçlar kullanıyorsanız, hat hızında 10g arayüz çalıştırıyorsanız her ~ 3.4 saniyede bir dönüyor olabilirler
  • Sayaç güncelleme, birçok büyük cihaz sayacı yalnızca dakikada iki veya üç kez günceller ve senkronize olmalarına asla güvenilemez. Her 30 saniyede bir oylamayı rahatsız edebileceğim kadar düşük ve o zaman bile herhangi bir uyarıyı tetiklemeden veya harekete geçmeden önce her zaman en az iki puan isterim
  • CPU işlemesi için gönderilen paketler (belki de netflow), toplu olarak RE'ye gitmeyecek olanlara (Juniper MX'de görmüş) karşı hemen sayılabileceğinden bir gotcha olabilir.

Poller tarafı:

  • Poller aralıkta doğru bir şekilde yoklanıyor mu ve eğer değilse, gerçek yoklama süresi ile sonucunu enjekte ediyor mu (örneğin, yz saniye cinsinden x bit), böylece makul bir oran hesaplanabilir
  • Sayaçlar sıfırlandığında veya SNMP GET'lere yanıt verilmediğinde ne olur, farklı araçlar bunlara farklı şekillerde yanıt verir

1
Her N'yi çok doğru bir şekilde yoklasanız bile, kutu HW sayaçlarını doğru aralıklarla kirletmeyebilir, bu da t1, t2 trafik artışı görmez ve t2, t3 hat hızını görür. Şimdi alabileceğiniz en doğru sonuçlar belki de math.stackexchange alanındadır, ancak yapabileceğiniz en iyi şey 2 * the_slowest_update_interval, eğer kutu her 10 saniyede bir güncellenirse, her 20 saniyede bir ölçüm verileri olabilir. Ama muhtemelen bazı istatistik sihirleri ile 10'lara yaklaştırabilirsiniz (buradaki sorun güncelleme aralığının doğru bir şekilde zamanlanmamış olmasıdır)
ytti

1
Ayrıca, Kaktüsler ile hangi poller kullandığınızı 10 saniyelik bir yoklama aralığında yaparsınız. Bu düşük yoklama aralıklarında varsayılan poller ile kötü deneyimler yaşadım. Spine veya varsayılan poller kullanıyorlarsa, söz edilmez.
Brett Lykins

6

Sorununuz, yönlendirici örneklemeniz ve kendi yoklamanız aynı anda çarpmıyor. Yani, yoklama aralığı statik olsa da, yoklama aralıkları, matematiğinizin dikkate almadığı farklı miktarda örnek içerir.
T1, t2, t3'ü yokladığınızı düşünün, ancak yönlendirici t1, t2 aralığında hiçbir şey örneklemedi, bu nedenle t1, t3 arasındaki tüm trafik t2, t3 yoklamalı değerde sona erdi. Oranınızın t1, t2'de 0 ve t2, t3'te aşırı hıza neden olması

Şimdi bir çözüm önereceğim, ama lütfen bunu matematik anlayışına sahip biriyle doğrulayın.

İlgilendiğiniz ilk arayüzü (eğer ge-1/1/1 ise):

snmpbulkwalk ANAHTARI ifDescr | grep ge-1/1/1

Sonra onun ifIndex numarasını göreceksiniz, diyelim ki '42'.

Sonra şöyle bir şey yapın:

while true; do
  snmpbulkwalk SWITCH ifHCInOctets.42 >> DATA
  date >> DATA
  sleep 1
done

Şimdi sayaçların ortalama olarak ne sıklıkta güncellendiğini belirlemek için sonuçları analiz edin. (Gerekirse analiz için senaryo üretebilirim)

Sonra matematiğe ihtiyaç duyacağımız kısım geliyor, ama saf bir çözüm önereceğim.

Güncelleme aralığınız 10s ise, her 5 saniyede bir anket yapın, yani güncellenen sürenin iki katı. Sonra örnekleri olurdu

t0, t5, t10, t15, t20, t25, t30

Şimdi bu, kullanamayacağınız ham verileriniz olurdu, ancak gerçek örnekleri bundan böyle kurtarmayı tercih edersiniz

s1 = (t0+t5+t10)/3
s2 = (t10+t15+t20)/3
s3 = (t20+t25+t30)/3

Buradaki gerekçe, anahtarınızdaki hatalı yoklama aralıklarının etkisini azaltmak için sınırların üzerinden sızmak istiyoruz.

Daha sonra s1, s2, s3'ü çizerdiniz ve şimdi gördüğünüzden çok daha düzgün / doğru bir sonuca sahip olmalısınız.

Ancak bunun yeni bir sorun olmadığından eminim ve en uygun doğruluğu nasıl elde edeceğime dair resmi bir çözüm olduğundan eminim. Bir şey math.stackexchange insanlar mücadele için daha iyi donanımlı olacaktır.


3

Sayaçlar güncellendiğinde aynı oranda yoklama yaptığınız için eşzamanlı olmayacaksınız.

Yapılandırarak

snmp-server hc poll <<hundredths of a second>>

SNMP sayaçlarının 1 saniye gibi bir sürüme güncellenme aralığını azaltabilirsiniz. Bu, her 10 saniyede bir yoklama yaparken verim için daha doğru bir değerle sonuçlanmalıdır.

Bilginize, bu gizli bir komut.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.