“Aşağı BGP” bağlantılarında sorun giderme


21

BGP rotalarımızdan biri dün kısa bir süre için indiğinde ağımız kısa bir kesinti yaşadı. Neyse ki, birkaç dakika sonra bağlantılarımız ikincil BGP rotamızda başarısız oldu ve ISP tarafındaki bir kapanma / kapanma sonrasında ana rota devreye girdi.

İOS 12.2 58 ile çalışan 2 yığılmış (arka panel) Cisco 3750e anahtarını çalıştırıyoruz.

ISS ile yaptığım konuşmada, sebebine kesin bir cevap veremediler. Gelecekte bu sorundan kaçınmak için tarafımızın nedenini belirlemek için yapabileceğimiz bir şey var mı?

Hata anında giriş yapın

172258: May  6 14:43:06: %BGP-5-ADJCHANGE: neighbor xxx.xxx.12.34 Down BGP Notification sent
172259: May  6 14:43:06: %BGP-3-NOTIFICATION: sent to neighbor xxx.xxx.12.34 4/0 (hold time expired) 0 bytes
172260: May  6 14:43:06: %BGP_SESSION-5-ADJCHANGE: neighbor xxx.xxx.12.34 IPv4 Multicast topology base removed from session  BGP Notification sent
172261: May  6 14:43:06: %BGP_SESSION-5-ADJCHANGE: neighbor xxx.xxx.12.34 IPv4 Unicast topology base removed from session  BGP Notification sent

ISS kendi tarafındaki BGP'yi sıfırlamak için kapandığında / kapatılmadığında oturum açın

172542: May  6 15:04:15: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet2/0/49, changed state to down
172543: May  6 15:04:16: %LINK-3-UPDOWN: Interface GigabitEthernet2/0/49, changed state to down
172544: May  6 15:04:16: %PIM-5-NBRCHG: neighbor xxx.xxx.12.34 DOWN on interface GigabitEthernet2/0/49 non DR
172545: May  6 15:04:16: %PIM-5-NBRCHG: neighbor xxx.xxx.12.34 UP on interface GigabitEthernet2/0/49 
172546: May  6 15:04:16: %PIM-5-DRCHG: DR change from neighbor 0.0.0.0 to xxx.xxx.12.35 on interface GigabitEthernet2/0/49
172547: May  6 15:04:18: %LINK-3-UPDOWN: Interface GigabitEthernet2/0/49, changed state to up
172548: May  6 15:04:19: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet2/0/49, changed state to up

BGP bağlantısı nihayet boşta durumdayken Yukarı

172828: May  6 15:27:33: %BGP-5-ADJCHANGE: neighbor xxx.xxx.12.34 Up

Bizim tarafımızdan BGP arayüzü (not: CRC, düşme, çarpışma bildirilmedi ...)

GigabitEthernet2/0/49 is up, line protocol is up (connected)
Hardware is Gigabit Ethernet, address is xxxx.xxxx
Internet address is xxx.xxx.12.35/31
MTU 1500 bytes, BW 1000000 Kbit/sec, DLY 10 usec,
reliability 255/255, txload 1/255, rxload 3/255
Encapsulation ARPA, loopback not set
Keepalive not set
Full-duplex, 1000Mb/s, link type is auto, media type is 1000BaseLX SFP
input flow-control is off, output flow-control is unsupported
ARP type: ARPA, ARP Timeout 04:00:00
Last input 00:00:09, output 00:00:12, output hang never
Last clearing of "show interface" counters never
Input queue: 0/75/52/0 (size/max/drops/flushes); Total output drops: 0
Queueing strategy: fifo
Output queue: 0/40 (size/max)
5 minute input rate 14536000 bits/sec, 1655 packets/sec
5 minute output rate 1010000 bits/sec, 640 packets/sec
413176726 packets input, 428902543141 bytes, 0 no buffer
Received 143495 broadcasts (0 IP multicasts)
0 runts, 0 giants, 0 throttles
0 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored
0 watchdog, 139275 multicast, 0 pause input
0 input packets with dribble condition detected
125748632 packets output, 42915625632 bytes, 0 underruns
0 output errors, 0 collisions, 0 interface resets
0 unknown protocol drops
0 babbles, 0 late collision, 0 deferred
0 lost carrier, 0 no carrier, 0 pause output
0 output buffer failures, 0 output buffers swapped out

Meta'da (zaten!) etiketlerle ilgili bir tartışma olduğunu unutmayın. Lütfen cisco model numaranızı bir MANUFAC-MODELSERIES haline getirin (3750e hakkında emin değilsiniz ama 3700 serisi olabilir mi?) Sonra etiketi için "cisco-3700". Aksi takdirde, donanım modeli çorba denizi olacak. Lütfen 'cisco' etiketinizi de saklayın, böylece insanlar da 'cisco'yu arayabilir / izleyebilir / abone olabilir.
Craig Constantine,

Önerildiği gibi yapıldı.
John Lee,

2 BGP eşinin doğrudan bağlı olup olmadığından söz edilmez. Aralarında başka bir cihaz varsa, onlar tarafından başka olası sorunların üretilmesi mümkün olabilir.
noaru

3700 eski bir model yönlendirici olduğundan cisco-3750 olarak yeniden etiketlendi. Catalyst anahtarları 3750'dir.
Dave Noonan

@ noaru, 2 BGP eşine doğrudan bağlı.
John Lee,

Yanıtlar:


19

172259: 6 Mayıs 14:43:06:% BGP-3-BİLDİRİM: komşuya gönderildi xxx.xxx.12.34 4/0 (bekleme süresi doldu) 0 bayt

Bu, genellikle bağlantının diğer tarafının bekletme zamanlayıcısı içindeki herhangi bir saklayıcıya yanıt vermediği anlamına gelir (varsayılan 180 saniye). Buna sebep olabilecek çeşitli sorunlar var. Genellikle onun bir layer3 erişilebilirlik sorunu. Tekrar olursa, p3 ve telnet üzerinden eşe test ederek layer3 sorununu dışlamalısınız (telnet port 179, cevap verip vermediğine bakın).

Tabaka3 ulaşılabilirliği sorunu değilse, o zaman komşunun bir ucunda bir sorun vardı (bu durumda muhtemelen daha fazla taraf).


4

Basitçe 'kök neden' arıyorsanız, bu sorun:

Sağlayıcınızdan, bu durumdan hemen önce kendi uçlarında bir yapılandırma değişikliği olup olmadığını sormak isteyebilirsiniz. Cisco yönlendiricileri üzerinde (bir anda şu anda hangi kodun döndüğünden% 100 emin değil) BGP oturumlarının açılacağı durumlar var; "BGP eşliğinde yapılandırma. Her ne kadar bu tür bir bakım akran oturumunda sorunlara neden olmamalıysa da, bunun olayla ilgili hikayelerini duydum.

Ayrıca, arayüzü düşürmek ve sorunu 'düzeltmek' için geri getirmek için gerekenlere kadar gitmeleri gerekeceğinden emin değilim. Bence sadece peering oturumunu sıfırlamak yeterli olurdu, ancak başarısızlık anında hiç trafik geçmediyse, bir şeyleri tekrar almak için arayüzü bırakmaları önemli değil.


Eşleme oturumunu sıfırlamayı duymadım. Burada belirtilenlere benzer mi? link Ayrıca, bağlantıyı sıfırlamak için elimizden gelenin en iyisini yapabilir miyim?
John Lee,

1
Bu sadece basit bir 'temizle ip bgp nei xx.xx.xx.xx', 'oturumu temizlemek' olarak da bilinir. Basitçe BGP komşuluğunu sıfırlar (kesin olarak oturumu kapatır ve yeniden kurar).
Justin Seabrook-Rocha

Hızlı soru: 'net ip bgp nei'nin ISS'nin sonunda yapılması gerekiyor mu, yoksa başlatabilir miyiz?
John Lee,

Her iki uç da oturumu temizlemeye başlayabilir. Bazen "garip" şeyler olduğunda, buradaki gibi, her iki uçta da denemeye değer. Sorun giderme uğruna her bir ucu birer birer yapardım.
GoatAtWork

Yazılım sıfırlaması yapabileceğinizi belirtmeniz gerekir (komutun sonuna 'yumuşak' anahtar kelimesini ekleyin) - bağlantıyı (ve komşu ilişkisini) kesmeden güncellemeleri tekrar göndermeye zorlar.
noaru

4

Bir MTU problemi olabilir. Bunu bir süre önce vardı. İyi başlar ancak çok fazla rota içeren bir GÜNCELLEME alındığında, MTU uyumsuzluğundan dolayı kaybolur. Ayrıca, iki yönlendiricinizin arasında L2 cihazlarınız varsa (anahtar? Medya dönüştürücüsü?) Varsa, arayüz kesilmeden bağlantının kesilmesi mümkün olabilir.


0

Gördüklerimden değil. ISS'nizin yönlendiricisi, yönlendiricinizden gelen merhaba mesajlarına yanıt vermeyi bıraktı, bu yüzden BGP bağlantınızı kaybettiniz. Yönlendiricinizin ISS'den gelen merhaba mesajlarını dinlemeyi bırakması da olasıdır, ancak bu sorunun tespit edilmesine yardımcı olacak mesajlarda bariz bir şey göremiyorum. Belki ISS pistine daha fazla odaklanan biri yorum yapabilir ve biraz ışık tutabilir?


Keepalives demek istiyorsun, merhaba mesajları değil - bu BGP, OSPF değil.
Niels

Teşekkürler, evet. Bazen biraz karışık oluyorum.
Avery Abbott
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.