Güçlü kümelenmenin olduğu verilerle kullanılacak uygun önyükleme tekniği ile ilgili bir sorum var.
Modelin hangi bakım bölümlerinin en yüksek seans sıklığını içerdiğini (üst kısım) ne kadar iyi tahmin ettiğini belirlemek için, mevcut temel modeli daha yeni talep verileri üzerinde puanlayarak sigorta talep verileri üzerindeki çok değişkenli karışık etkileri öngörme modelini değerlendirmekle görevlendirildim. 95. persentil). Hassasiyet, özgüllük ve pozitif prediktif değer (PPV) model etkinliğini değerlendirmek için kullanılacaktır.
Önyükleme, duyarlılık, özgüllük ve PPV yüzdeleri için güven aralıkları oluşturmanın doğru yolu gibi görünüyor. Ne yazık ki, istem verilerinin 1) bakım sağlayıcısı ile ilişkili olduğu, 2) bakım bölümünden önceki aylarda daha sık ziyaretlerle gruplanan (bu nedenle bazı otokorelasyon mevcut) göz önüne alındığında saf bir bootstrap uygun değildir. Hareketli blokların önyükleme tekniğindeki bir varyasyon burada uygun olur mu?
Ya da belki de üç aşamalı bir önyükleme prosedürü işe yarayacaktır: 1) verilerdeki farklı sağlayıcılardan değiştirilen örnek, daha sonra 2) seçilen sağlayıcılar tarafından farklı bakım bölümlerinden değiştirilen örnek, daha sonra 3) her biri içindeki farklı iddialardan değiştirilen örnek seçilen bölüm.
Herhangi bir öneriniz için çok teşekkürler!