Evde çalışan 2 sabit diskli küçük bir Ubuntu sunucum var. Mdadm tarafından yönetilen, ilgisiz olduğuna inandığım, ama yine de bahsettiğim disklerde iki yazılım baskını (baskın1) var.
Her iki sabit disk de Western Digital'dir ve bunlardan biri tık sesi duymaya başladığında ve öldüğünde yaklaşık 2 senedir kullanılmaktadır. 2 yıl sonra belki de doğal olduğunu düşündüm, bu yüzden yeni bir tane aldım ve baskın dizilerini yeniden uyarladım. Yaklaşık bir ay sonra, diğer sürücü de öldü.
Şüphelenmedim, çünkü her iki sürücü de aynı anda satın alındığı için, ikisini de yan yana görmek şaşırtıcı değil, bu yüzden başka bir tane aldım.
Şimdiye kadar, 2 eski sürücü arızalandı ve sistemde 2 yeni marka oldu. Bir ay sonra, yeni sürücülerden biri öldü. Şüphelenmeye başladığında bu. PC bazı eski parçalardan (AthlonXP düşünün) bir araya getirildiğinden beri, anakartın SATA denetleyicisinin suçlu olduğunu düşündüm. Tabii ki bunun gibi eski bir bilgisayarda parçaları kolayca değiştiremezsiniz, bu yüzden bütün bir sistem, yeni MB, yeni CPU, yeni RAM aldım. Sadece başarısız sürücü geri aldı, çünkü garanti altındaydı ve değiştirdi.
Bu yüzden eskilerinden 2 arızalı sürücü ve yenilerinden 1 arızalı sürücü. 1 aydır sorun yok. Bundan sonra / var / log / messages'de hatalar tekrar kayıyordu ve mdadm, baskın dizisi hatalarını rapor ediyordu. Saçlarımı yırtmaya başladım. Sistemde her şey yeni, üçüncü marka yeni sabit diske bağlı, aldığım tüm yeni sürücülerin hatalı olması mümkün değil.
Bakalım hala ortak olan ne ... kablolar. Tamam, uzun atış, hadi SATA kablolarını değiştirelim. Sabit sürücüyü geri alın, tezgahtaki adama gülümseyin ve gerçekten şanssız olduğumu söyleyin. Sabit sürücünün yerini alıyor. Eve geliyorum, bir ay geçiyor ve sabit sürücülerden biri yine başarısız oluyor. Şaka yapmıyorum.
Yepyeni sabit sürücülerden ikisi arızalandı. Belki bu işletim sistemi bir hata. Üreticinin test aracının ne dediğini görelim. Test aracını indirin, CD'ye yazın, yeniden başlatın, gece boyunca sabit sürücü testini bırakın. Test, sürücünün arızalı olduğunu ve hala yapabilirsem her şeyi yedeklemem gerektiğini söylüyor. Ne olduğunu bilmiyorum, ama bir yazılım sorunu gibi görünmüyor, kesinlikle bir şey kesinlikle sabit diskleri çalıyor.
Şimdi söylemeliyim ki, tüm sistem bir ayakkabı kutusunda. “Kendi ikea vakanızı yaratın” meselesiyle ilgili bir sürü şey olduğundan, bir şeyi bir kutuya koyup bir yere koymakta herhangi bir sorun yaşanmaması gerektiğini düşündüm. Kutu iyi havalandırılmış, ancak sadece sürücülerin aşırı ısındığını düşündüm. Bunun başka bir olası cevabı yok. Böylece sabit sürücüyü geri aldım ve değiştirdim (3. kez) ve sabit sürücü soğutucuları aldım.
Ve şimdi, kıyamet sesini duydum. whizzzzzzzzz tıklayın . Kutuya SSH:
You have new mail!
mail
r 1
DegradedArrayEvent on /dev/md0 ...
dmesg çıkışı:
[47128.000051] ata3: lost interrupt (Status 0x50)
[47128.000097] end_request: I/O error, dev sda, sector 58588863
[47128.000134] md: super_written gets error=-5, uptodate=0
[48043.976054] ata3: lost interrupt (Status 0x50)
[48043.976086] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[48043.976132] ata3.00: cmd c8/00:18:bf:40:52/00:00:00:00:00/e1 tag 0 dma 12288 in
[48043.976135] res 40/00:00:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
[48043.976208] ata3.00: status: { DRDY }
[48043.976241] ata3: soft resetting link
[48044.148446] ata3.00: configured for UDMA/133
[48044.148457] ata3.00: device reported invalid CHS sector 0
[48044.148477] ata3: EH complete
Recap:
- Aşırı ısınma olasılığı yok
- 6 sürücü arızalandı, bunlardan 4'ü yeni. Şimdi orjinal ikisinin hatalı olduğundan ya da yenileri ile aynı ıstırap çektiğinden emin değilim.
- Şu anda Ubuntu Karmic olan işletim sistemi dışında (Jaunty ile başlayan), sistemde ortak bir şey yok. Yeni MB, yeni CPU, yeni RAM, yeni SATA kabloları.
- Hayır, sabit sürücüdeki küçük delikler kapatılmamış
Ağlıyorum. Gerçekten mi. Artık mağazaya dönecek yüzüm yok, 4 sürücünün 4 ayın altında arıza yapması mümkün değil.
Düşündüğüm birkaç fikir: Sürücüleri böldüğümde ve yeniden açtığımda bir şeyi karıştırmam mümkün mü? O kadar kötü olabilir mi fiziksel olarak diski mahveder? (satıcı tarafından verilen araç sürücünün zarar gördüğünü söylediğinden) fdisk ile bölümleme yapıyorum ve raid1 bölümleri için aynı blok boyutunu kullandım (fdisk -lu ile tam blok boyutlarını kontrol ediyorum)
Linux çekirdeğinin veya mdadm'in veya bu sabit disk sürücüsü markasına uygun olmayan bir şey olması mümkün değil mi?
Ayakkabı kutusu olabilir mi? Başka bir yere yerleştirmeyi deneyin? Artık rafın altında, bu nedenle nem de sorun değil. Normal bir bilgisayar kasasının sorunumu çözmesi mümkün mü (o zaman kendimi vuracağım)? Yarın bir resim çekeceğim.
Sadece sadece lanetli miyim?
Herhangi bir yardım veya spekülasyon büyük beğeni topluyor.
Düzenleme : Güç şeridi aşırı gerilime karşı korunur.
Düzenleme2 : Bu 4 ay içinde taşındım, bu nedenle her iki yerde de "kirli" elektrik olma olasılığı çok düşük.
Düzen3 : BIOS'taki voltajları kontrol ettim (bir multimetreyi ödünç alamadım) ve hepsi doğru görünüyor, en büyük farklılık 12V'de, çünkü 11.3 sağlıyor. Bunun için endişelenmeli miyim?
Düzen4 : Masaüstü bilgisayarımın PSU'sunu sunucuya yerleştirdim. BIOS çok daha doğru voltaj değerleri rapor etti ve ayrıca 3-4 saat süren raid1 dizisini başarıyla yeniden oluşturdu, bu yüzden şimdi biraz olumlu hissediyorum. Bununla test etmek için yarın yeni bir PSU alacaksınız. Ayrıca, resmi kutuya iliştirmek: (3. sürücüyü dikkate almamak)