Birinci Düzen: Duyarlı mı?
Giriş yapamıyorsanız, daha büyük sorunlar var. Bu genellikle iki çeşittir: donanım arızası ve yazılım arızası. Her ikisi de potansiyel olarak felaket. DFA hatalarını önlemek için, önce genel donanım sağlığını kontrol edin - genellikle basit bir bakış yeterli olacaktır.
İkinci Düzen: Sistemin temel yapıları sağlıklı ve düzenli mi?
Sistemlerin "Altın Triadını" kontrol edin:
- İşlem için yeterli CPU süresi ücretsiz
- Depolama için yeterli disk alanı boş
- İş yükleri için yeterli bellek ücretsiz
Son birkaç on yılda, üçlü iletişim (ağ oluşturma) içeren bir "dörtlü" haline geldi:
- Bağlantı işlevsel, duyarlı ve kapasiteye sahip
Üçüncü Düzen: Sorunun şiddeti nedir?
Hangi programlar veya hizmetler etkilenir? Şiddeti azalan sırada, sistemik (sistem çapında), kümelenmiş (bir grup program) veya yalıtılmış (belirli bir program) mı? Belirli bir temel hizmet başarısız olduğu veya yanıt vermediği için program kümeleri genellikle açılır. Sistemik sorunlar bazen bununla ilgilidir (DNS veya IP çatışmalarını düşünün), ancak nereye bakılacağını bilmek genellikle anahtardır.
Dördüncü Düzen: Tanılama araçları, yararlı veriler sağlayan sorunla ilgili mi?
Artık sistemin sağlığı (ikinci derece) ve hangi bölümlerinde sorun yaşandığı (üçüncü derece) hakkında bilgi sahibi olduğunuza göre, bu sorunun nerede olduğunu daraltmayı kolaylaştıracaktır.
Hata mesajları veya günlük dosyaları bu yolculukta ortak bir yol noktası olmalıdır.
CPU sorunları:
Disk alanı / GÇ sorunları:
Bellek sorunları:
Bağlantı sorunları:
- ping
- rota (ve arp ve rarp ve arkadaşları)
- iptables, ipchains, ipfw (orada BSD millet için)
- traceroute veya mtr
- hosts, nslookup veya dig
- netstat
En yaygın şikayet (duyduğum):
E-posta yeterince hızlı teslim edilmiyor (alıcıdan makbuza gönderime bir dakikadan fazla) veya e-posta gönderme girişimimi reddediyor. Bu genellikle Postfix'teki spam fırtınası sırasındaki hız sınırlayıcısına iner ve bu da dahili teslimatı kabul etme yeteneğini etkiler.
Gerçek hayattan bir örnek:
Ancak, bu her zaman böyle değildir. Bir kez, hizmetin yeniden başlatılmasına bakılmaksızın sorun devam etti; 3 dakika sonra etrafa bakmanın zamanı gelmişti. CPU meşguldü, ancak% 100'ün altındaydı, ancak yük sadece 2 çekirdekli bir kutuda 15'e yükseldi ve daha yükseğe çıkmakla tehdit ediyordu. Üst komut, posta sisteminin posta tarayıcıyla birlikte aşırı hızda olduğunu, ancak görülmesi gereken amavis alt işlemleri olmadığını ortaya çıkardı. İpucu buydu - posta kuyruğu komutu (mailq), % 80'inden fazlası spam olan 150'den fazla teslim edilmemiş ileti gösterdi, son 20 dakika içinde. Alt e-posta tarayıcısı işlemlerinin sayısını artırırken (birikmiş işlenmeye yardımcı olmak için) hız sınırlayıcıyı düşürmek (spam fırtınasının alım oranını düşürmek) için hızlı bir ayarlama, ardından bir hizmetin yeniden başlatılması, sorunu çözdü ve sistem teslimatları kısa sürede tamamlamak.
Sorunun nedeni, amavis ebeveyn sürecinin ölü olarak sallanması ve çocuk süreçlerinin sonunda kendi yollarını çalıştırmalarıydı (bellek sızıntılarını önlemek için birçok taramadan sonra kendiliğinden sona erdi). Bu yüzden postfix'te ihtiyaç duyulan spam / virüs taramasını yapmak için ... ince hava ... ile temas kurmaya çalışan SMTP süreçleri vardı. Kullandığım dağıtımda hiç güncellenmeyecek güncel olmayan paketler vardı; Kurulumun bir yıl içinde değiştirilmesi nedeniyle, kurulumu birkaç hata düzeltmesi içeren en son sürüme manuel olarak "aştım". O zamandan beri aynı problemi yaşamadım.