Çoklu impütasyondan sonra havuzlama kalibrasyon grafikleri


15

Çoklu impütasyondan sonra kalibrasyon grafiklerini / istatistiklerini birleştirme konusunda tavsiye istiyorum. Gelecekteki bir olayı tahmin etmek için istatistiksel modeller geliştirme ortamında (örneğin, hastaneden taburculuk sonrası hayatta kalmayı veya olayları tahmin etmek için hastane kayıtlarından elde edilen verileri kullanma), bazı çok fazla eksik bilginin olduğu hayal edilebilir. Birden fazla itimat, bu tür bir durumun üstesinden gelmenin bir yoludur, ancak içsel ithalatın belirsizliği nedeniyle ilave değişkenliği hesaba katarak, her itim veri kümesinden test istatistiklerinin havuzlanması ihtiyacı ile sonuçlanır.

'Düzenli' Rubin'in havuzlama kurallarının geçerli olabileceği çoklu kalibrasyon istatistikleri (hosmer-lemeshow, Harrell Emax, tahmini kalibrasyon indeksi vb.) Olduğunu anlıyorum.

Bununla birlikte, bu istatistikler genellikle modelin yanlış kalibre edilmiş bölgeleri göstermeyen genel kalibrasyon ölçümleridir. Bu nedenle, bir kalibrasyon grafiğine bakmayı tercih ederim. Ne yazık ki, arsaların veya arkasındaki verilerin nasıl 'havuzlanacağı' konusunda hiçbir fikrim yok (birey başına tahmin edilen olasılıklar ve birey başına gözlemlenen sonuç) ve biyomedikal literatürde (aşina olduğum alan) fazla bir şey bulamıyorum, veya burada, CrossValidated'da. Tabii ki, her bir impütasyon veri setinin kalibrasyon grafiğine bakmak bir cevap olabilir, ancak çok sayıda impütasyon seti oluşturulduğunda oldukça rahatsız edici olabilir.

Bu nedenle, bir çoklu kalibrasyondan sonra toplanan bir kalibrasyon grafiğine yol açacak teknikler olup olmadığını sormak istiyorum (?)


Önyükleme yapılan örnekleri doğrudan havuzda toplamak ve bu örneğin kalibrasyonunu değerlendirmek mümkün müdür?
AdamO

@AdamO Doğrudan havuzlama ile tam olarak ne demek istiyorsun? Ve hangi bootstrap örneklerine başvuruyorsunuz?
IWS

2
Üzgünüm, geri dönmeme izin ver, (MI'yı bir bootstrap olarak düşünüyorum). Diyorum ki, n'iniz 1000 ise ve 5 MI veri kümeniz varsa, neden 5000'den tek bir kalibrasyon grafiği oluşturmuyorsunuz ve bu 5.000'de istediğiniz şekilde gözlemlenmiş / beklenen şekilde karşılaştırmıyorsunuz?
AdamO

@AdamO Kulağa ilginç geliyor, yine de bir güven aralığı sağlayan fonksiyonların ayarlanmasını gerektiriyordu. Bu fikri destekleyecek referanslar veya teoriler var mı?
IWS

2
Referans yok, kısa bir süre önce, bootstrap standart hataları ve bu şekilde bir araya toplayarak çoklu impütasyon için çıkarım aldığımızı kanıtlamadığımız bir makale yayınladık. Analizin amacının 0,05 düzeyinde test ettiğini, beklentilerin / gözlem oranının veya farkın normal dağılım aralığında olduğunu ve niceliksel tahminlerin örneklem büyüklüğüne değişmediğini söyleyebilirsiniz, bu nedenle% 95 CI havuzdan etkilenmez.
AdamO

Yanıtlar:


1

[...] n'niz 1.000 ise ve 5 MI veri kümeniz varsa, neden 5000'den tek bir kalibrasyon grafiği oluşturmuyorsunuz ve bu 5.000'de istediğiniz şekilde gözlemlenmiş / beklenen şekilde karşılaştırmıyorsunuz?

Referanslar ile ilgili:

Referans yok, kısa bir süre önce, bootstrap standart hataları ve bu şekilde bir araya toplayarak çoklu impütasyon için çıkarım aldığımızı kanıtlamadığımız bir makale yayınladık. Analizin amacının 0,05 düzeyinde test ettiğini, beklentinin / gözlem oranının veya farkının normal bir dağılım aralığında olduğunu ve niceliksel tahminlerin örneklem büyüklüğüne değişmediğini söyleyebiliriz, bu nedenle% 95 CI havuzdan etkilenmez.


1
Bu yorumu @AdamO tarafından bir topluluk wiki yanıtı olarak kopyaladım çünkü yorum az çok bu sorunun cevabı. Cevaplar ve sorular arasında dramatik bir boşluk var. Sorunun en azından bir kısmı yorumlarda bazı soruların cevaplanmasıdır: soruyu cevaplayan yorumlar cevaplar olsaydı, daha az cevaplanmamış soru olurdu.
mkt - Monica'yı
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.