Kendiliğinden yeniden başlatılan düzinelerce


0

7/24 çalışan SUSE Linux tabanlı bir sistem üzerinde çalışıyorum ve yaklaşık 3 yıldır bu zamanda yeniden başlatılmadığını söyleyemem.
9 Haziran’da görünüşte bir çeşit site kapatması vardı, ama bu kapatmanın nasıl yapıldığını bilmiyorum.
O zamandan beri sayılamayan anlık yeniden başlatmalar oldu.

Hata, hemen hemen her akla gelebilecek test durumunda, örneğin; 20 veya daha fazla çarpışmadan sonra fsck çalıştıran veya sadece hiçbir şey yapmadan çalışan veya olmayan, verileri arşivleyen veya olmayan, yeni verileri kaydeden veya olmayan kullanıcı uygulamaları.

  • RAM değiştirildi.

  • CPU soğutucusundaki soğutma fanı, oldukça gürültülü olduğu için değiştirildi (bununla birlikte sadece 20 mm uzağa üfleyen daha büyük bir fan olmasına rağmen).

  • Güç kaynağı değiştirildi ve kapanmasını önlemek için yeşil kablo sert bir şekilde topraklandı.

Bu yeniden başlatmalar biraz daha az sıklıkta bir etki yaratıyor gibi görünmektedir.

Görünüşe göre yapmamama rağmen, fsck [muhtemelen] üzerinde çalıştı [250GB sürücüde bazı 220GB'lık veri bölümü var], ancak tüm bölümlerin kontrol edilip edilmediğini bilmiyorum. Ama görünüşe göre şimdi 2 gün boyunca sürekli çalışıyor.

Herhangi bir problemin Linux'un anında ölmesine ve yeniden başlamasına neden olabileceğini öneren var mı?


Diğerlerinin dediği gibi, bir donanım sorunu gibi geliyor. Ancak gelecek için, düzenli aralıklarla yeniden başlatma işlemlerine sahip olmalısınız. Şimdi olduğu gibi, son 3 yılda yapılan yapılandırma değişikliklerinden herhangi birinin sorundan sorumlu olup olmadığını bilmiyorsunuz. Bu zaman penceresini azaltmak çok değer.
Jenny D

Yanıtlar:


0

Bu bana bir sorun gibi geliyor. Sıcaklık, PSU veya mobo olabilir.

Günlükleri kontrol edebilirsin /var/log/*, veya çıktısı dmesg ipuçları için komut

RAM değiştirildi. CPU soğutucu üzerindeki yorgun soğutma fanı şu şekilde değiştirildi:   sadece boyunca üfleme daha büyük bir fan olmasına rağmen oldukça gürültülü   yaklaşık 20 mm uzakta Güç kaynağı değiştirildi ve yeşil kablo sert   kapatılmasını önlemek için topraklı, ancak bu sadece yeniden başlatmalar anlamına geliyordu   biraz daha az gecikmeli.

Kontrol ediyorum lm-sensörleri veya içinde " / Proc / ACPI / thermal_zone "(sizin için geçerliyse) herhangi bir aşırı ısınma işareti için.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.