çekirdek: günlük taahhüdü G / Ç hatası


9

Dell 1950 sunucusuyla ilgili bazı sorunlar yaşıyorum. Burada Oracle ve diğer bazı yazılımlarla birlikte RHEL 4.6 yüklüyorum.

Rastgele ssh oturumumda "çekirdek: günlük taahhüt I / O hatası" diyerek bir hata mesajı alıyorum ve ben sunucuya bağladım monitörde "EXT3-fs hatası (cihaz sda5) yazan bir hata kaydırma görüyorum in start_transaction: Dergi iptal edildi. "

Birkaç kez oldu ama kurulum sırasında asla aynı noktada değil. Aslında, bu son kez sistem çalışır durumda ve ben sadece bir veritabanını oracle içine almaya çalışıyordum.

Bu birkaç sabit diskte oldu, bu yüzden sorun olmadığından eminim. Bu bana baskın denetleyicisinin kötü gittiğini düşündürüyor.

Siz ne düşünüyorsunuz?

** GÜNCELLEME **

Kötü bir sabit disk olduğundan eminim. Sunucuya başka bir sürücü attım ve yaklaşık 48 saat boyunca problemsiz çalışıyor.

Yanıtlar:


9

Bu hataları daha önce gördüm, ancak yükleme işlemi sırasında görmedim.

Bu, sürücünün işletim sisteminin salt okunur moda aldığı kadar yeterli hata aldığı anlamına gelir. Günlüklerin tamamını bulabildiyseniz, muhtemelen gördüğünüz tam hata hatalarından önce yeniden denenen ve çalışan bazı G / Ç hataları olurdu. Bahsedilen gerçek bloklarla ilgili bir şey.

Bir depolama sistemi hatası. Kesinlikle RAID kartı, RAID dizisindeki sürücüler, karttan sürücülere giden kablolar, sürücülerin bağlandığı arka panel, raid kartın takılı olduğu yuva, sabit sürücülerin güç kaynağı veya başka bir şey CPU ve gerçek depolama blokları arasında.


2

Akla gelen üç olasılık var:

  1. Bellek sorunları var (genellikle "rastgele" çökmelere neden olurlar). Orada ECC koçunuz varsa, açıkçası daha az olasıdır.

  2. Otobüs ile ilgili bir sorun var. Birkaç yıl önce bir Tyan çift Opteron anakartında kırık bir APIC denetleyicisi ile aynı sorunu yaşadım. Buna işaret eden başka günlük girişleri de vardı, ancak semptomların büyük kısmı otomatik salt okunur yeniden disklere sahip disk sürücülerinde rastgele bozulma idi. Benim durumumda, harici bir FC RAID kutusu olduğu ve gayet iyi olduğu için diskle ilgili olmadığını biliyordum.

  3. RAID denetleyicisi ranza.

Bu sorunları dikkate alacağım sırayla.


Muhtemelen hafıza problemleri değil; bunların sadece depolama ile sınırlı kalmadan segfaultlara ve daha rastgele hatalara neden olma olasılığı daha yüksektir.
freiheit

Doğru. Ancak bir yükleme veya erken önyükleme durumunda, bellek kullanımı arabellek önbelleğidir, bu nedenle sorunlar önce orada görünme eğilimindedir. Makine bir süre çalıştırıldığında, kullanıcı işlemi bellek G / Ç ve dolayısıyla segfault prevalansına hakim olur. Bununla birlikte, bir PE1950, Xeon işlemcilere ve ECC ram'a sahip olmalı, böylece RAM onu algılayabilmeli ve Linux'a bildirebilmelidir.
Alexandre Carmel-Veilleux

2

Dediğin gibi kötü giden RAID denetleyicisi olabilir (eğer varsa bir yedek deneyin.) Denetleyicinin sürücüsü olabilir (eğer performans daha kötü olsa bile, alternatif sürücüleri kontrol edin, bir referans noktasına sahip olmak iyidir) .) Çekirdek olabilir (RHEL'de daha az muhtemeldir, oldukça iyi test edilmiştir.) Blok önbelleği bozmak kötü RAM olabilir.

Görünüşte rastgele hata davranışına bağlı olarak, bir donanım sorunu en olası nedendir.


2

Diskin dolu olmadığından emin olun - özellikle kök bölümü. Dosya sistemi disk kullanımını görmek için df kullanın:

df -h

% 100 kullanıma yakın veya buna yakın bölümler arayın


-5

Deneyin:

Şimdi -rF kapatılıyor

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.