LInux: “Rastgele” askıda kalmaya ve kendiliğinden yeniden başlatmaya neden olanları nasıl teşhis edebilir / yalıtabilirim?


20

(başlangıçta serverfault üzerinde yayınlanmıştır )

Öyleyse, sebebinin ne olduğunu tahmin etmek yerine (param nvidia sürücülerinde olsa da), bazı gerçekleri nerede tespit etmeye başlarım?

Ben birkaç kez / var / log geçirdim ama orada bir sürü şey var ve (henüz) önemli bit nokta olamaz.


Arka plan: Kısa Versiyon

WinXP'den Ubuntu Karmic'e ulaştıktan hemen sonra taşındım.

O zamandan beri ben ya da olarak tezahür görünüşte rastgele çöküyor bir dizi oldu :

  • kendiliğinden yeniden başlatma
  • USB klavyem ve farem yanıt vermiyorken tam bir kilitlenme (LED'lerin tümü kapanana kadar). Ayrıca bu olduğunda genellikle kutuyu ssh yapamam.

Çok fazla arama yaptım ve Nvidia asıl şüpheli gibi görünüyor, ancak gerçek nedenin ne olduğunu bulmaya nereden başlayacağımı bilmiyorum.

Bir sunucu hatası, RAM'in MemtextX86 + ile kontrol edilmesini önerdi. Hata bulunamadı. Şimdi baktığım video kartı sıcaklığının izlenmesi de önerildi.

Bundan başka, öneriniz var mı?



Arka plan: Uzun Versiyon

Bazen, bir hafta boyunca kaza yapmadan gidebilirim, sonra 2 günde 5 tane alabilirim.

Olası şüphelileri ortadan kaldırma arzusuyla motive olan, zaman içinde boşuna birkaç değişiklik yaptım:

  • Başlangıçta sanallaştırma için KVM kullandım, şimdi VirtualBox OSE kullanıyorum
  • Çekirdekte NFS vardı ama şimdi Samba kullanıyorum
  • Compiz kullanıyordum ama o zamandan beri kapattım
  • 64-bit Karmic'ten 32-bit'e geçtim (başka nedenlerle de)
  • Ubuntu, Kubuntu ve Xubuntu'yu denedim. Her seferinde aynı sorun (geç olsa da Gnome'da XFCE'den daha sık görülüyor).
  • Nvidia sürücüsünü 185 sürümünden 96 sürümüne geri aldım (NVIDIA Linux x86 Çekirdek Modülü 96.43.13 Per 25 Haziran 18:42:21 PDT 2009). Bu , hata sıklığını azaltmış görünmektedir .


O sırada nelerin koştuğuna göre, bu değişebilir. Aşağıdakiler yaygındır, ancak her kilitlenme için gerekli değildir:

  • Firefox 3.5
  • 1 veya 2 Windows XP VM'li VirtualBox OSE
  • Skype
  • Ritim kutusu veya Exaile


Donanımım 2-3 yaşında:

  • Çekirdek 2 Duo 6300
  • 4GB RAM
  • o vintage Intel anakart bazı cins
  • GeForce 7300 GS yonga setine sahip bir Asus çift kafalı ekran kartı
  • 2 x SATA HDD
  • çift ​​monitör (dolayısıyla tescilli nvidia sürücülerine güveniyorum)


Sistem güncellemelerimle güncel kalıyorum.

Umarım yukarıdaki veriler birisini araştırmaya değer belirli bir günlük veya yapılandırma türü önerebilir.


Güncelleme 1

hoparlörlerin çıldırdığı bir çarpışma oldu. Bazı googling yaptı ve PulseAudio'nun geçmişte birkaç sorunu oldu gibi görünüyor. Bu konuyla ilgili olup olmadığından henüz emin değilim ama PulseAudio her çöküşümde çalışıyor olacak.


Güncelleme 2

@ CarlF'ın Debian Sysadmin Rehberine bağlantısının ardından beni bir sonraki kilitlenmede deneyeceğim sihirli sysrq anahtarına götürdü. Bunun bana sebeple ilgili çok ipucu vereceğinden değil, ama en azından umarım incelikle kapanabilirim.


Güncelleme 3

lm-sensörleri GPU'mun yaklaşık 70C / 158F'de çalıştığını bildiriyor - ilginç. Tahmin etmeliydim, bunun önemli bir ipucu olduğunu söyleyebilirim.


Güncelleme 4

Son güncellememden kısa bir süre sonra - sistemin sonucunu bir airduster ile vurun - net sonuç: o zamandan beri sadece bir çökme. Buna termal bir sorun diyeceğim.


3
Mükemmel biçimlendirme ve arka plan bilgileri, tüm soruların böyle olmasını dilerdim. +1.
John T

Yanıtlar:


8

Debian Yönetici Kılavuzu'ndan iyi tavsiyeler var: http://www.debian-administration.org/articles/492


Bilgilendirici olmayan günlükler hakkında gerçek donanım sorunlarının bir işareti olduğunu söylemek istediklerini görmek ilginç. Son / var / log / message girişi ile yeniden başlatma arasında altı saatlik bir boşluk var. Hmmmm.
LRE

bağlantının günlüklerdeki hiçbir şeyin donanım sorununa eşit olmadığını açıkça ortaya koyduğu gerekçesiyle kabul etti - beni doğru yöne götürdü.
LRE

4

Önyükleme sırasında donanım sorunları olup olmadığını kontrol etmek isteyebileceğiniz ilk şey. Önyükleme işlemi, çekirdek halka arabelleğindeki verileri günlüğe kaydeder /var/log/boot.log. Sistem önyüklendikten sonra, yeni arabellekler bu ara belleğe temizlenir ve dmesgkomutla o anki durumunu görebilirsiniz . Ayrıca araştırmak isteyeceğiniz önemli bir günlük /var/log/messages. Bu, zaman damgalarını, tesisleri ve hataların önceliklerini ve bunları oluşturan uygulamayı içerecektir. Hataların ayıklanmasında zaman damgasının bulunması paha biçilmez bir varlıktır.

Rastgele kilitlenmeler kesinlikle donanım ile ilgili ses. Anakarttaki tüm donanımları yeniden yerleştirmeyi deneyin ve bir memtest86 + run verin.


/ Var / log / mesajlarında "imklog 4.2.0, günlük kaynağı = / var / run / rsyslog / kmsg başladı" yazan bir satır görüyorum. Bu sistem önyüklemesinin iyi bir göstergesi midir? Eğer öyleyse bunu, günlüğün bir alanını tespit etmek için kullanabilirim.
LRE

Evet, sanırım bir önyüklemeden sonraki ilk satır olmasa da ilklerden biri. Çekirdek günlük giriş modülüdür.
John T

2

Belleğinizi, işlemcinizi ve diğer yongalarınızı yeniden yerleştirmeyi denediniz mi? Ayrıca, bazı olasılıkları ortadan kaldırmak için başka bir işletim sistemi (FreeDOS) çalıştırmayı deneyebilirsiniz.

İpucu olarak, nvidia sürücülerini kullanmadan Gnome üzerinden iki monitörü de oldukça iyi kullanabilmelisiniz.


en iyi ben kesinlikle çift monitör kullanmak için nvidia özel sürücüler gerekir söyleyebilirim. İhtiyaç duymamanız için beni doğru yöne yönlendirebilir misiniz?
LRE

Yanlış olabilirim. Ben biraz etrafında dürttü ve xinerama (ki ben sürücü için uzantıları olduğunu düşünüyorum) referanslar bakın ama tescilli olmayan driverws ile ilgili bir şey. Ne yazık ki, nVidia kartlı bir makinem yok.
Nerdfest
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.