Sunucularımızın disklerinde SMART testleri çalıştıramıyorum ve bu özelliği destekleyip desteklemediklerinden emin olamadım (CentOS 7.2).
Kısa hikaye : Büyük bir veri kümesinde birleştirilen bir sürü aynı sunucuya sahibiz. Bunlardan birinde, salt okunur olarak yeniden yerleştirilen (haftada yaklaşık olarak ortalama iki) disk alıyoruz.
Bu yinelenen sorunun altında yatan nedeni bulmak için bu diskler için SMART testleri yapmak istedim, ancak SMART testleri yapamıyorum. Sadece bilgi istediğimde sorun değil:
[root@bigd08 ~]# smartctl -i /dev/sdj
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Vendor: HP
Product: LOGICAL VOLUME
Revision: 4.52
User Capacity: 6,001,141,571,584 bytes [6.00 TB]
Logical block size: 512 bytes
Physical block size: 4096 bytes
Lowest aligned LBA: 0
Logical Unit id: 0x600508b1001c3738fab048c29ade60d9
Serial number: PDNNK0BRH510G6
Device type: disk
Local Time is: Tue Dec 19 13:51:32 2017 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Disabled or Not Supported
"Etkin" yazıyor. Eğer tam bilgi edinmek istersem:
[root@bigd08 ~]# smartctl --all -d scsi /dev/sdj -H
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Vendor: HP
Product: LOGICAL VOLUME
Revision: 4.52
User Capacity: 6,001,141,571,584 bytes [6.00 TB]
Logical block size: 512 bytes
Physical block size: 4096 bytes
Lowest aligned LBA: 0
Logical Unit id: 0x600508b1001c3738fab048c29ade60d9
Serial number: PDNNK0BRH510G6
Device type: disk
Local Time is: Tue Dec 19 10:47:10 2017 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Disabled or Not Supported
=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK
Error Counter logging not supported
Device does not support Self Test logging
veya testi deneyin:
[root@bigd08 ~]# sudo smartctl -t short /dev/sdj1
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
Short offline self test failed [unsupported scsi opcode]
Ayrıca scsi'yi cihaz tipi olarak ve izin verilen modda seçerek çalıştırmayı denedim ama çıktı aynı. Ancak, diğer olası cihaz türlerini denemedim: ata, oturdu [, otomatik] [, N] [+ TİP], usbcypress [, X], usbjmicron [, p] [, x] [, N], usbsunplus, marvell , areca, N / E, 3ware, N, hpt, L / M / N, megaraid, N, cciss, N, otomatik, test
("test" seçeneği scsi olduklarını söylüyor) Onları denemeli miyim? Çıktının altından bazı ipuçları almaya çalıştım:
root@bigd08 ~]# lspci -knn | grep 'RAID bus controller'
03:00.0 RAID bus controller [0104]: Hewlett-Packard Company Smart Array Gen9 Controllers [103c:3239] (rev 01)
07:00.0 RAID bus controller [0104]: Hewlett-Packard Company Smart Array Gen9 Controllers [103c:3239] (rev 01)
Hayır, hiçbir ipucum yok. Hala SMART'ı desteklediklerine inanmak istiyorum. Bu yılın başında satın alındı ve 2017 değil mi? Onlar olmalı! Diskler, HP markasının yanı sıra sunucular ve RAID denetleyicileridir, ancak üretici Seagate'dir (ST6000NM0024).
Ürün kılavuzunu kontrol ettim ve SMART desteğini gösteren bazı parçalar gördüm. Seagate'in kullanım kılavuzundan ekran görüntüsü
Hangi bitlerden bahsettiğini ve komut satırından nasıl kontrol edebileceğimi bilmiyorum. Çalıştırdığım ilk smartctl komutundan gördüğüm bitlerin onlar olduğunu farz ediyorum: "Available", "Enabled".
İnternet üzerinden benim davama benzeyen pek çok konu var ama birçoğu USB disklerle ilgili ve dışarıda kalıyor.
Kararlı diskler almam için gereken her türlü yardımı takdir ediyorum. Ayrıca neden bu kadar sık okuyabilecekleri konusundaki yorumlarınızı da kabul ediyorum.