SQL Server 2012 Sayfa Yaşam Beklentisi yaklaşık 50 gün sonra sıfırlanır


12

2 sunuculu bir HA kümesinde garip bir davranış fark ettim ve birisinin şüphemi onaylayabileceğini veya belki başka bir açıklama sunabileceğini umuyordum ... İşte kurulumum:

  • 2 sunuculu bir SQL 2012 SP1 yüklemesi
  • SQL AlwaysOn HA birkaç veritabanı için etkinleştirildi
  • İşlemciler 2.4GHz, 4 çekirdekli
  • RAM 34 GB'dir (bu bir AWS örneğidir, dolayısıyla tek sayıdır)
  • Kaynak kullanımı nispeten düşüktür - her sunucuda 14+ GB boş bellek vardır ve SQL ne kadar bellek kullanılacağına ilişkin sınırlamalara sahip değildir
  • Disk erişim süresi iyi - nadiren 15ms / Okuma veya Yazma
  • Veritabanları büyük değil - 1 GB, 1.5 GB, 7.5 GB
  • SQL sunucu işlemi 16 GB Özel Bayt, 15 GB Çalışma Seti kullanıyor

Genel olarak, herhangi bir kaynak sorunu kaydedilmemiştir. Şimdi tuhaf kısım için. SQL yeniden başlatılmaz (süreç neredeyse 6 aydır çalışmaktadır), ancak her ~ 50 günde bir Sayfa Yaşam Beklentisi sayacının (neredeyse) 0'a düştüğü görülüyor. Bu noktaya kadar sabit bir şekilde tırmanıyor, damla yok. İşte mükemmel bir grafik:

resim açıklamasını buraya girin

Sayaç verilerine baktığımda (tam sayıya sahip değilim, sadece bir saatlik toplama) PLE sayaç değeri her seferinde (en azından her veri için her seferinde) yaklaşık 4.295.000 saniyeye (kabaca 50 gün) ulaştı.

Benim çılgın teorim, PLE sayısının imzasız bir uzun int (4,294,967,295 sınırına sahip) olarak milisaniye olarak tutulması ve 49.71 günlerde, tasarım veya hata nedeniyle sıfırlanması. Bu, iki sunucunun davranışını ve sahip oldukları özdeş düzeni açıklar. Ya da tamamen farklı bir şey olabilir ve ben hiç mantıklı değilim. :)

Herkes böyle bir şey gördü, ya da bu davranışı açıklayabilir?

PS Bu yazı gördüm , ama benim durumum biraz farklı görünüyor.

PPS Bu bir repost - Başlangıçta buraya gönderdim , ancak buradaki izleyiciye daha uygun olduğu söylendi.

Teşekkürler!


Yorumlar uzun tartışmalar için değildir; bu görüşme sohbete taşındı .
Paul White 9

Yanıtlar:


3

Bu davranışı SQL2012 SP1 çalıştıran bir istemci sitesinde gördüm. Buradaki özellikler NUMA idi ve PLE, bir 'testere dişi' desenini gösteriyor, ancak saatlik bir döngüde.

SQLServerCentral'daki birkaç iş parçacığı bu sorunu ele aldı:

http://www.sqlservercentral.com/Forums/Topic1415833-2799-1.aspx http://www.sqlservercentral.com/Forums/Topic1424826-2799-1.aspx

Sonuç olarak, SP1 CU4'ü uygulamak sorunu çözüyor gibiydi.

CU4 masum görünümlü düzeltme içeriyor SQL Server 2012 Bellek Yönetimi KB2845380 için bir güncelleştirme kullanılabilir

Denemeye değer?


Bunu gönderdiğiniz için teşekkürler (gecikmiş cevap için üzgünüm, herhangi bir nedenden dolayı gönderinizi hiç bildirmedim). Bağlantılara bir göz attım - biraz benzer görünüyorlar, bu yüzden QA'daki kurulumu kopyalamaya, CU4'ü uygulamaya çalışacağım (veya muhtemelen doğrudan SP2'ye gideceğim), sonra tekrar kontrol edeceğim. Hızla bunu görüyorum (her 50 günde bir) onaylayabilmem için bir süre olacak, ancak sonuç aldığımda geri göndereceğim. BTW, kalıplarım hala devam ediyor - ~ 50 gün boyunca sabit tırmanış, sonra ~ 0'a keskin düşüş ve tekrar tırmanış - hizmet Aralık ayında başladığından bu yana toplam 4.
CRCerr0r

Güncelleme ... Bunu KG ortamımızda onayladım. Oradan aldığım istatistikler: Sıfırlamalar arasındaki Toplam Gün - 49.71 (+/- 1 dakika); Maks PLE değerine ulaşıldı - 4.294.961 (1 dakika örneklerde, bu yüzden biraz daha yüksek olabilir). Bu, üretim gözlemlerini hemen hemen doğrular. CU4 uygulayacağım ve ~ 50 gün içinde rapor vereceğim ... :)
CRCerr0r

1
Bu konuda haber var mı?
Michael Green
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.