2 sunuculu bir HA kümesinde garip bir davranış fark ettim ve birisinin şüphemi onaylayabileceğini veya belki başka bir açıklama sunabileceğini umuyordum ... İşte kurulumum:
- 2 sunuculu bir SQL 2012 SP1 yüklemesi
- SQL AlwaysOn HA birkaç veritabanı için etkinleştirildi
- İşlemciler 2.4GHz, 4 çekirdekli
- RAM 34 GB'dir (bu bir AWS örneğidir, dolayısıyla tek sayıdır)
- Kaynak kullanımı nispeten düşüktür - her sunucuda 14+ GB boş bellek vardır ve SQL ne kadar bellek kullanılacağına ilişkin sınırlamalara sahip değildir
- Disk erişim süresi iyi - nadiren 15ms / Okuma veya Yazma
- Veritabanları büyük değil - 1 GB, 1.5 GB, 7.5 GB
- SQL sunucu işlemi 16 GB Özel Bayt, 15 GB Çalışma Seti kullanıyor
Genel olarak, herhangi bir kaynak sorunu kaydedilmemiştir. Şimdi tuhaf kısım için. SQL yeniden başlatılmaz (süreç neredeyse 6 aydır çalışmaktadır), ancak her ~ 50 günde bir Sayfa Yaşam Beklentisi sayacının (neredeyse) 0'a düştüğü görülüyor. Bu noktaya kadar sabit bir şekilde tırmanıyor, damla yok. İşte mükemmel bir grafik:
Sayaç verilerine baktığımda (tam sayıya sahip değilim, sadece bir saatlik toplama) PLE sayaç değeri her seferinde (en azından her veri için her seferinde) yaklaşık 4.295.000 saniyeye (kabaca 50 gün) ulaştı.
Benim çılgın teorim, PLE sayısının imzasız bir uzun int (4,294,967,295 sınırına sahip) olarak milisaniye olarak tutulması ve 49.71 günlerde, tasarım veya hata nedeniyle sıfırlanması. Bu, iki sunucunun davranışını ve sahip oldukları özdeş düzeni açıklar. Ya da tamamen farklı bir şey olabilir ve ben hiç mantıklı değilim. :)
Herkes böyle bir şey gördü, ya da bu davranışı açıklayabilir?
PS Bu yazı gördüm , ama benim durumum biraz farklı görünüyor.
PPS Bu bir repost - Başlangıçta buraya gönderdim , ancak buradaki izleyiciye daha uygun olduğu söylendi.
Teşekkürler!