Ağ çıkış sorunu (ARP ile ilgili)


9

Çalıştığım küçük kolejde çok garip ağ sorunları var. Burada herhangi bir tavsiye veya fikir arıyorum. Yaz boyunca iyiydik, ama sorun öğrenciler sonbahar döneminde yürürlükte olan kampüse döndükten birkaç gün sonra başladı.

belirtiler

Ana semptom, internet erişiminin işe yarayacağı, ancak çok yavaş ... sık sık zaman aşımı noktasına kadar. Örnek olarak, Speedtest.net'ten tipik bir sonuç .4Mbps indirmeyi döndürür, ancak 3 ila 8 Mbps yükleme hızına izin verir. Küçük belirtiler arasında dosya sunucumuza ve dosya sunucumuzdan veri aktarımı ciddi şekilde sınırlı olabilir, hatta bazı durumlarda bilgisayarda oturum açamama (etki alanı denetleyicisine erişilememe) söz konusu olabilir. Sorun birden fazla vlanstan geçiyor ve işlettiğimiz neredeyse her vlandaki cihazları etkiledi.

Sorun ağdaki tüm makineleri etkilemez. Etkilenmemiş bir makine, speedtest.net'ten en az 11Mbps indirmeyi görür ve belki de o zamanki daha büyük kampüs trafik modellerine bağlı olarak çok daha fazlasını görür .

Daha büyük konuda bir varyasyon vardır. Kullanıcıların neredeyse tüm makinelerde oturum açamadıkları bir vlanımız var. BT personeli yerel bir yönetici hesabı (veya bazı durumlarda önbelleğe alınmış kimlik bilgileri) kullanarak oturum açacaktır ve oradan ağ geçidinin serbest bırakılması / yenilenmesi veya pinglenmesi, makinenin bir süre çalışmasına izin verecektir. Bu sorunu karmaşık hale getirmek, bu vlanın, bir yeniden başlatmanın ardından sabit sürücüleri tamamen sıfırlamak için Deep Freeze adlı yazılımı kullanan bilgisayar laboratuvarlarımızı kapsamasıdır. Aynı sorun, haftalardır düşük düzeyli bilgileri kalıcı olarak değiştirmeyen makinelerdeki eski veriler nedeniyle farklı bir şekilde ortaya çıkabilir. Bununla birlikte, yeni bir vlan oluşturarak ve laboratuvarları yeni vlan toptancılığına taşıyarak bunu çözebildik.

kışkırtmalar

Sonunda, etkilenen makinelerin hepsinin son dhcp kiralamaları olduğunu fark ettik. Bir dhcp kiralama yenilendiğinde izleyerek bir makinenin ne zaman "yavaş" olacağını tahmin edebiliriz. Bir test vlan için kiralama süresini çok kısa ayarlamakla oynadık, ancak tüm bunlar makinenin ne zaman yavaşlayacağını tahmin etme yeteneğimizi kaldırmaktı. Statik IP'li makineler hemen hemen her zaman normal şekilde çalışmıştır. El ile serbest / bir adres yenileyen olacak asla bir makine yavaş olmaya neden olur. Aslında, bazı durumlarda bu süreç olmuştur sabitbu durumda bir makine. Ancak çoğu zaman yardımcı olmuyor. Ayrıca, dizüstü bilgisayarlar gibi mobil makinelerin yeni vlanslara geçtiklerinde yavaşlayacağını fark ettik. Kampüste kablosuz, her bölgenin küçük bir bina kümesiyle eşleştiği "bölgelere" ayrılmıştır. Yeni bir binaya taşınmak sizi bir bölgeye yerleştirerek yeni bir adres almanıza neden olabilir. Uyku modundan devam eden bir makinenin de yavaş olması muhtemeldir.

azaltıcı etkenler

Bazen, ancak her zaman değil, etkilenen bir makinede arp önbelleğinin temizlenmesi, normal şekilde çalışmasına izin verir. Daha önce de belirtildiği gibi, yerel bir makinenin IP adresini serbest bırakmak / yenilemek o makineyi düzeltebilir, ancak garanti edilmez. Varsayılan ağ geçidine ping atmak da bazen yavaş bir makineye yardımcı olabilir.

Sorunu hafifletmek için en fazla yardımcı olan şey, çekirdek katman-3 anahtarımızdaki arp önbelleğini temizlemektir. Bu anahtar, tüm vlanslarda varsayılan ağ geçidi olarak dhcp sistemimiz için kullanılır ve inter-vlan yönlendirmesini yönetir. Model bir 3Com 4900SX'dir. Sorunu azaltmaya çalışmak için, anahtarda önbellek zaman aşımı süresini mümkün olan en düşük süreye ayarladık, ancak yardımcı olmadı. Ayrıca, anahtara otomatik olarak bağlanmak ve önbelleği sıfırlamak için birkaç dakikada bir çalışan bir komut dosyası bir araya getirdim. Ne yazık ki, bu her zaman işe yaramaz ve hatta bazı makinelerin kısa bir süre için yavaş durumda olmasına neden olabilir (ancak bunlar birkaç dakika sonra kendilerini düzeltir gibi görünmektedir). Şu anda çekirdek anahtarını ARP önbelleğini temizlemeye zorlamak için her 10 dakikada bir planlanan bir işimiz var, ancak bu mükemmel veya arzulanan bir şey değil.

üreme

Artık yavaş duruma zorlayabileceğimiz bir test makinemiz var. Vlanslarımızın her biri için bağlantı noktaları ayarlanmış bir anahtara bağlanır. Makineyi farklı vlanslara bağlayarak yavaşlatıyoruz ve yeni bir veya iki bağlantıdan sonra yavaş olacak.

Bu bölümde, bunun önceki dönemlerin başlangıcında daha önce gerçekleştiğini de belirtmek gerekir, ancak geçmişte birkaç gün sonra sorun kendi başına ortadan kalkmıştır. Çok fazla tanısal çalışma yapma şansımız olmadan önce kendi kendini çözdü ... bu yüzden neden bu sefer bu kadar uzun bir süre bu süreye sürüklenmesine izin verdik; beklenti bunun kısa ömürlü bir durum olmasıydı.

Diğer Faktörler

Geçtiğimiz yıl yaklaşık yarım düzine anahtarımız olduğunu açıkça belirtmek gerekir. Bunlar çoğunlukla 2003/2004 dönemi 3Coms'tur (çoğunlukla 4200'ler) ve hepsi aynı anda konulmuştur. Bunlar hala garanti kapsamında olmalıdır, HP'yi satın almak hizmet almayı biraz zorlaştırdı. Çoğunlukla başarısız olan güç kaynaklarında, ancak birkaç durumda, arızalı güç kaynağı olan bir anahtarı hayata döndürmek için arızalı anakartlı bir anahtardan bir güç kaynağı kullandık. Şu anda dört anahtarın üçü dışında UPS cihazlarımız var, ancak iki buçuk yıl önce başladığımda durum böyle değildi. Şiddetli bütçe kısıtlamaları (Ed'in mali açıdan zorlanan kurumlar bölümünde birkaç yıl önce bulunduk) beni değiştirmeler için Netgear ve TrendNet gibi şeylere bakmaya zorladı,

Bu yaz ağımızdaki büyük değişikliğin, tek bir kampüs içi kablosuz SSID'den daha önce bahsedilen bölgeli yaklaşıma geçtiğini belirtmek gerekir. Dediğim gibi, bu sorunun kaynağı olduğunu düşünmüyorum: bunu daha önce görmüştük. Ancak, bu konuyu daha da kötüleştirebilir ve izole edilmesinin çok zor olmasının sebebi olabilir.

Teşhis

İlk başta, sorunun zamanlaması ve kalıcı doğası göz önüne alındığında, sorunun kaynağının ARP önbellek zehirlenmesi yapan enfekte (veya kötü amaçlı) bir öğrenci makinesi olduğu açıktı. Ancak, kaynağı ayırmaya yönelik yinelenen girişimler başarısız oldu. Bu girişimler arasında çok sayıda wireshark paket izleri ve hatta kısa bir süre için tüm binaları çevrimdışına alma bulunuyor. Bir sigara tabancası kötü ARP girişi bile bulamadık. Mevcut en iyi tahminim aşırı yüklenmiş veya arızalı bir çekirdek anahtarı, ancak bunun nasıl test edileceğinden emin değilim ve körü körüne değiştirmenin maliyeti dik.

Yine, herhangi bir fikir takdir.

Güncelleme:
Çekirdek anahtarı değiştirilir. 4 gün sonra her şey yolunda gidiyor ... ama sorun çözülmeden önce iki hafta işaretini bekleyeceğim.


Etkilenen makinelerde paket kaybı görüyor musunuz? Öyleyse, paket kaybı nerede gerçekleşir? mtrburada yardımcı olabilir.
EEAA

3
Bu şüpheli bir şekilde, anahtarlarınızdan biri arp tablolarını bozan hatalı ve bozuk girişleri diğer anahtarlara yayar gibi görünüyor. Bu nedenle, tablolar L3 çekirdeğinde temizlendiğinde kısmi rahatlama. Daha fazla sorun giderme girişiminden önce TÜM anahtarları sıfırlamanızı kesinlikle öneririz. Biraz şans ile bu sorunu tamamen ortadan kaldırır. Bir anahtar gerçekten arızalıysa, yeniden başlatmadan sonra açılış tanılamasında başarısız olur. PS Güç şebekesindeki hafif dalgalanmalar bu etkiye neden olabilir. Anahtarlarınız UPS'de değilse, bunun nedeni olabilir.
Tonny

@ErikA bazı paket kayıplarımız var. Daha iyi bir iz elde edip edemeyeceğimi göreceğim ... ama paket kaybı kampüsteki her yerden geliyor, yani tek ortak bağlantı noktası çekirdek anahtar ve sunucularımıza bağlı anahtar.
Joel Coel

1
@Tonny Sorun giderme işleminin bir parçası olarak tüm (iyi, neredeyse tüm) anahtarları en az iki kez sıfırladık. Bu şikayet yaklaşık bir gün / bir buçuk gün (ortadan kaldırmak değil) azaltmak gibi görünüyordu. Üç veya dört hariç tümü için UPS cihazları olan yaklaşık 40 anahtar ünitemiz var. Buradaki en önemli şey, tüm anahtarlarımızın aynı anda takılmış olması ve geçen yıl boyunca 6 kesin hata yaşadık, bu yüzden çok fazla güvenilirlik var.
Joel Coel

1
3com deneyimim yok, ancak belirli bir porttan öğrenilen mac adreslerinin sayısını sınırlamanın bir yolu olabilir. Birisi mac su baskını yapıyorsa, anahtarlarınızı hub'lara çevirirse, öğrenci makineleri için tüm erişim portlarında bunu yapabilirsiniz.
Bad Dos

Yanıtlar:


2

Joel

Trunks kurulumunuz olduğundan ve sorunu istediğiniz zaman çoğaltabilirsiniz. Wireshark'ı bir dizüstü bilgisayara kurun ve bir yer-uydu hattı bağlantı noktasını aynalayın / açın. Paket hızını 10.000'in üzerinde veya bağlantı noktası kullanımını maksimum hızın yakınında görürseniz sorun yaşarsınız.

Kötü bir donanım / yayılan ağaç sorununuz olabilir. Normalde kullanıcıların "daha fazla verim elde etmek" için makinelerinde her iki ağa da taktıklarını gördüm.

Normalde Yayılan ağaç sorunları için, satıcınızdan bağlantı noktası başına Döngü algılamayı veya yayın sınırlamasını açabilirsiniz. Bu, bulunan bir döngü ile herhangi bir bağlantı noktasını öldürür. "Bpdu korumasını" da açabilir, yani bpdu'nun alındığı bağlantı noktasını devre dışı bırakabilir ve syslog / snmp trap alıcılarına bir hata atabilirsiniz.

Joe


1

Daha önce buna benzer sorunları gördüm ve tüm alt ağın (muhtemelen ek bir bağlantı noktasında kendi MAC'sini gördüğü geçiş nedeniyle yayın trafiğinden) kaos ve doygunluğa neden olan LAN'da bir döngü olmuştur.

EDIT: Ayrıca, eğitim kurumlarında (benim önceki sysadmin işlerimin ikisi) yaygındır, çünkü küçük sevgililer yama kabloları / soketleri ile uğraşmak ister ...


Tam olarak bunu kontrol etmek için çok zaman harcadık, ancak sonunda bunu dışladı.
Joel Coel

0

Bana ses geliyor, çünkü yayın fırtınalarına neden olan kötü bir donanım var. Yayınları izlemek ve sorun çıkaran bir sunucu bulmak için Wireshark'ı kullanın ...


Bazı makineler iyi çalışıyor ve diğerleri çalışmıyorsa, bunun olması pek olası değildir. Bir yayın fırtınası kısa sürede tüm VLAN'ı dizlerine getirecektir.
Paul Gear

0

Joe'nun fikri iyi bir fikir, ancak sorununuzu yaratan bir yayın fırtınası olmayacağı düşünüldüğünde (sanırım ARP önbellek zehirlenmesi veya benzer bir sorunla doğru yoldasınız; hatta bir IP adresi çakışması olabilir), muhtemelen sorunu çözmez.

Anahtarlarınız destekliyorsa dinamik ARP ve DHCP denetimini kullanmak için ilgili bir teknik. Bunu açarsanız, anahtarlar DHCP işlemlerini izler ve yalnızca DHCP veritabanındaki bilinen girişlerle veya el ile belirttiğiniz girişlerle eşleşen ARP girişlerine izin verir.

Anahtarlarınız bu özelliğe sahip değilse, onu izlemek için başka bir seçenek Linux yardımcı programı arpwatch'dur - tüm ARP isteklerini takip eder ve bir IP-MAC eşleme değişikliği fark ettiğinde size bildirir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.