Sistem çökmesinin nedenini nasıl belirleyebilirim?


10

Sunucum haftada bir kez kilitleniyor ve buna neyin sebep olduğu konusunda herhangi bir ipucu bırakmıyor. Kontrol ettim /var/log/messagesve sadece bir noktada kaydı durduruyor ve sabit bir yeniden başlatma gerçekleştirdiğimde bilgisayar posta bilgisinde başlıyor.

Kontrol edebileceğim veya yükleyebileceğim bir neden var mı?

CentOS 7 kullanıyorum.

İşte benim tek hata / sorun /var/log/dmesg: https://paste.netcoding.net/cosisiloji.log

[    3.606936] md: Waiting for all devices to be available before autodetect
[    3.606984] md: If you don't use raid, use raid=noautodetect
[    3.607085] md: Autodetecting RAID arrays.
[    3.608309] md: Scanned 6 and added 6 devices.
[    3.608362] md: autorun ...
[    3.608412] md: considering sdc2 ...
[    3.608464] md:  adding sdc2 ...
[    3.608516] md: sdc1 has different UUID to sdc2
[    3.608570] md:  adding sdb2 ...
[    3.608620] md: sdb1 has different UUID to sdc2
[    3.608674] md:  adding sda2 ...
[    3.608726] md: sda1 has different UUID to sdc2
[    3.608944] md: created md2
[    3.608997] md: bind<sda2>
[    3.609058] md: bind<sdb2>
[    3.609116] md: bind<sdc2>
[    3.609175] md: running: <sdc2><sdb2><sda2>
[    3.609548] md/raid1:md2: active with 3 out of 3 mirrors
[    3.609623] md2: detected capacity change from 0 to 98520989696
[    3.609685] md: considering sdc1 ...
[    3.609737] md:  adding sdc1 ...
[    3.609789] md:  adding sdb1 ...
[    3.609841] md:  adding sda1 ...
[    3.610005] md: created md1
[    3.610055] md: bind<sda1>
[    3.610117] md: bind<sdb1>
[    3.610175] md: bind<sdc1>
[    3.610233] md: running: <sdc1><sdb1><sda1>
[    3.610714] md/raid1:md1: not clean -- starting background reconstruction
[    3.610773] md/raid1:md1: active with 3 out of 3 mirrors
[    3.610854] md1: detected capacity change from 0 to 20970405888
[    3.610917] md: ... autorun DONE.
[    3.610999] md: resync of RAID array md1
[    3.611054] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
[    3.611119] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for resync.
[    3.611180] md: using 128k window, over a total of 20478912k.
[    3.611244]  md1: unknown partition table
[    3.624786] EXT3-fs (md1): error: couldn't mount because of unsupported optional features (240)
[    3.627095] EXT2-fs (md1): error: couldn't mount because of unsupported optional features (244)
[    3.630284] EXT4-fs (md1): INFO: recovery required on readonly filesystem
[    3.630341] EXT4-fs (md1): write access will be enabled during recovery
[    3.819411] EXT4-fs (md1): orphan cleanup on readonly fs
[    3.836922] EXT4-fs (md1): 24 orphan inodes deleted
[    3.836975] EXT4-fs (md1): recovery complete
[    3.840557] EXT4-fs (md1): mounted filesystem with ordered data mode. Opts: (null)

Yanıtlar:


6

Eğer varsa crashkernel/kdumpyüklenmiş ve etkinleştirilmiş, kullanmakta nispi kolay çekirdeği çöktü incelemek gerekir crashyarar. Örneğin, çöktüğünüz çekirdek yığınlarını sakladığınız varsayılarak /var/crash: crash /var/crash/2009-07-17-10\:36/vmcore /usr/lib/debug/lib/modules/uname -r /vmlinux.

Ek ayrıntılar için buraya ve buraya bir göz atın .


Ben /dev/md1 not foundçalışırken grub2-probeve yüklü ve crashkernel / kdump yapılandırılmış hatayı tamir var ve tekrar çöküyor / ne zaman geri rapor.
Brian Graham

5

/var/log/dmesgÇekirdek iletilerini günlüğe kaydeden dmesg dosyasını kontrol edebilirsiniz . İleti günlüğü yalnızca hizmet ve uygulama iletilerini günlüğe kaydediyor ve bir çekirdek hatası varsa, hizmetler ve uygulamalar çalışmayı durdurur, ancak çekirdek hatası hala dmesg'de oturum açar.


Dmesg ve dmesg.old'u kontrol ettim, her ikisi de sadece başlangıç ​​bilgilerini içeriyor (yaklaşık 4.8 saniye). Görebildiğim tek "sorun", başlangıç ​​diski veya raid sürücülerinin yanlış bir şeyleri var gibi göründüğü halde sistem bunu düzeltir ve ne olursa olsun çalışır. Bağlantı için ana gönderiyi kontrol edin.
Brian Graham

2
  • bios hafıza testi
  • bios sabit disk testi
  • Akıllı sürücü günlüğünü kontrol edin smartctl /dev/sda -a
  • Akıllı sürücü testleri
  • bırakın dmesg -wHbir pencerede çalışan

3 sürücüde de akıllı sürücü testleri yaptım, bunlar bozulmamış. Ben var dmesg -wHbir pencerede çalışan (ve günümüzde hala SSH üzerinden kazadan sonra çıkış okuyabilir tekrar çöküyor kadar varsayıyorum). Makineye fiziksel erişimim yok, ana bilgisayarımdan bios belleği ve sabit sürücü testleri yapmasını istiyor muyum?
Brian Graham
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.