Çoklu impütasyondan sonra posterior araçları ve güvenilir aralıkları nasıl bir araya getirebilirim?


20

Bir dizi tamamlanmış veri kümesi elde etmek için çoklu gösterim kullandım.

Bir parametre (rastgele etki) için posterior dağılımlar elde etmek için tamamlanmış veri kümelerinin her birinde Bayesian yöntemleri kullandım.

Bu parametre için sonuçları nasıl birleştirebilirim / havuzlayabilirim?


Daha fazla bağlam:

Modelim okullarda kümelenmiş bireysel öğrenciler (öğrenci başına bir gözlem) anlamında hiyerarşiktir. Veri hiyerarşisini impütasyonlara dahil etmeye çalışmak için eksik veriler için tahmin edicilerden biri olarak MICEdahil ettiğim verilerim üzerinde birden fazla imputasyon ( R kullanarak ) yaptım school.

Tamamlanan veri kümelerinin her birine basit bir rastgele eğim modeli ekledim ( MCMCglmmR kullanarak ). Sonuç ikili.

Rastgele eğim varyansının arka yoğunluklarının, şöyle bir şey olduğu anlamında "iyi davrandığını" buldum: resim açıklamasını buraya girin

Bu rastgele etki için, her bir engellenen veri kümesindeki posterior araçları ve güvenilir aralıkları nasıl birleştirebilir / havuzlayabilirim?


Güncelleme1 :

Şimdiye kadar anladığım kadarıyla, Rubin'in kurallarını posterior ortama uygulayabilirim, çarpma çarpıntılı posterior ortalama vermek için - bunu yaparken herhangi bir sorun var mı? Ancak% 95 güvenilir aralıkları nasıl birleştirebileceğim hakkında hiçbir fikrim yok. Ayrıca, her impütasyon için gerçek bir posterior yoğunluk örneğim olduğu için - bunları bir şekilde birleştirebilir miyim?


Güncelleme2 :

@ Cyan'ın yorumlardaki önerisine göre, çok sayıda impütasyondan her tam veri kümesinden elde edilen posterior dağılımlardan örnekleri birleştirmeyi çok seviyorum. Ancak, bunu yapmanın teorik gerekçesini bilmek istiyorum.


Herhangi bir verideki eksiklik ilişkili sonuç değerinden bağımsız ise, sadece farklı çarpık veri kümelerindeki tüm arka örnekleri bir araya getirmek ve kombine arka örneklerin ortalama ve% 95 güvenilir aralıklarını almak doğrudur.
Camgöbeği

@Cyan, eksiklik mekanizmasının ya "rastgele eksik" ya da "rastgele rastgele eksik" olduğunu söylemekle "rastgele değil eksik" (MI yapmak için öğrendiğim olağan varsayımlar) demekle aynı mıdır? Bu "bir araya gelmenin" resmi olarak haklı olduğu bir referans biliyor musunuz?
Joe King

Çoklu impütasyon, kalbinde Bayesci bir prosedürdür. Tahmin için Bayesian yöntemlerini (MCMC ve benzeri) kullanırsanız, eksik verilerin tamamen tam bir Bayesian modeli için ek bir MCMC örnekleme adımı olarak hafifletilmesini sağlamalısınız ve bu yaklaşımlar arasında bir arayüz bulmaya çalışmaktan rahatsız olmayacaksınız.
StasK

@StasK Yorumunuz için teşekkür ederim. Bu yaklaşımı bir sonraki projemde kullanmaya çalışacağım ama maalesef şu anda modeli değiştirmek için zamanım yok. Zaten empedansları ve Bayesian modelini her bir empoze veri kümesinde çalıştırdım - çalıştırmak yaklaşık 3 hafta sürdü. Posterior örnekleri birleştirmem benim için geçerli değil mi?
Joe King

Rubin'in kuralları sadece anlar için geçerlidir. Onları anlamlı bir şekilde bir dağılıma uygulayıp uygulayamayacağınızı bilmiyorum. Belki, belki değil. Yapabileceğiniz en iyi şey, MCMC çalışmasının nokta tahminleri (posterior ortalamalar) ve standart hatalar (posterior varyanslar) ürettiğini ve ardından genel nokta ve varyans tahminlerini almak için Rubin'in kurallarını kullandığını söylemek olabilir. Hiyerarşik modeldeki dfs kayıplarının ne kadar trajik olabileceğini ve verileri bir araya getirmenin ne kadar tehlikeli olduğunu biliyorsunuz: Her birinde 5 çarpılmış tam veri kümesi ve 1M MCMC örneğiniz varsa, 5M iid MCMC değil, 5 kümeniz olduğu anlamına gelir puan.
StasK

Yanıtlar:


4

Bir dağılımın parametrik açıklaması ile yeterince tanımlanabilen özellikle iyi davranılmış posteriorlar ile, posteriorunuzu en iyi tanımlayan ortalama ve varyansı alıp oradan gidebilirsiniz. Bunun gerçekten garip posterior dağılımları alamadığınız birçok durumda yeterli olabileceğinden şüpheleniyorum.


0

Stata kullanırsanız, karışık efekt modelleri için imputasyondan sonra verileri toplayan "mim" adlı bir prosedür vardır. R'de mevcut olup olmadığını bilmiyorum.


Teşekkür ederim. İyi açıklamamış olabilirim - zaten birkaç çarpık veri kümesinden poster örnekleri var ve bunları birleştirip daha sonra çarpma güvenilir bir aralık oluşturabilir miyim bilmek istiyorum?
Joe King
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.