Bu tür önyükleme için bir ad var mı?


9

Her biri iki koşulda birden çok kez ölçülen birden fazla insan katılımcıyla bir deney yapmayı düşünün. Karışık efektler modeli ( lme4 sözdizimi kullanılarak) şu şekilde formüle edilebilir:

fit = lmer(
    formula = measure ~ (1|participant) + condition
)

Şimdi, bu modelin tahminleri için önyüklenmiş güven aralıkları oluşturmak istediğimi varsayalım. Bence basit ve hesaplamalı olarak etkili bir yöntem buldum ve eminim ilk düşünen ben değilim, ama bu yaklaşımı tanımlayan önceki yayınları bulmakta sorun yaşıyorum. İşte burada:

  1. Modeli takın (yukarıdaki gibi), buna "orijinal model" deyin
  2. Orijinal modelden tahminler alın, bunlara "orijinal tahminler" deyin
  3. Her bir katılımcıdan gelen her bir yanıtla ilişkili orijinal modelden kalıntılar edinin
  4. Kalanları yeniden örnekleyin, katılımcıları değiştirerek örnekleyin
  5. İçin Gauss hata ile doğrusal karışık etkiler modeli Fit artıkların , bu "geçici modeli" dediğimiz
  6. Her koşul için ara modelden tahminleri hesaplayın (bu tahminler sıfıra çok yakın olacaktır), bunlara "ara tahminler" deyin
  7. Orijinal tahminlere ara tahminler ekleyin, sonucu "yeniden örnek tahminler" olarak adlandırın
  8. CI'leri hesaplayabilen her koşul için yeniden örnek tahminlerinin bir dağılımını oluşturarak 4 ile 7 arasındaki adımları birçok kez tekrarlayın.

Basit regresyon bağlamında "artık önyükleme" prosedürlerini gördüm (yani karışık bir model değil), artıkların yeniden örnekleme birimi olarak örneklendiği ve daha sonra her bir yinelemeye yeni bir model yerleştirmeden önce orijinal modelin tahminlerine eklendiği önyükleme, ancak bu kalıntılar sadece insanlar, resampled ve asla ben açıklamak yaklaşımından ziyade farklı görünüyor sonraara model elde edilirse orijinal model tahminleri devreye girer. Bu son özellik, orijinal modelin karmaşıklığı ne olursa olsun, ara modelin her zaman bazı durumlarda çok daha hızlı olabilen bir gauss lineer karışık model olarak uygun olabilmesi açısından gerçekten güzel bir yan yararı vardır. Örneğin, son zamanlarda binom verileri ve 3 öngörücü değişkeni vardı, bunlardan biri kesinlikle doğrusal olmayan etkilere neden olacağından şüphelendiğim için, bir binomiyal bağlantı fonksiyonu kullanarak Genelleştirilmiş Katkı Karma Modelleme kullanmak zorunda kaldım . Bu durumda orijinal modelin takılması bir saatten fazla sürdü, oysa gaussian LMM'yi her yinelemeye oturtmak sadece birkaç saniye sürdü.

Zaten bilinen bir prosedür varsa, bu konuda öncelik talep etmek istemiyorum, bu yüzden daha önce tarif edilmiş olabilecek yerler hakkında bilgi sağlayabilirse çok minnettar olurum. (Ayrıca, bu yaklaşımla ilgili göze çarpan sorunlar varsa, bana bildirin!)


1
Sadece bir yan yorum, ancak ilgili olabilir. Peter McCullagh, Bernoulli'de hiçbir bootstrap'in rastgele efekt modelindeki varyansı doğru bir şekilde tahmin etmediğini gösterdiği bir makaleye sahiptir .
kardinal

@Mike (+1) Bu çok iyi yazılmış bir soru!
chl

1
Katılımcıları neden değiştirerek yeniden örneklemiyorsunuz ve sonra da verilerini yeniden örneklemiyorsunuz? Bu, bir dağıtım diğerinin içine yerleştirilmiş çok düzeyli bir modelin ruhuna daha fazla benziyor gibi görünüyor. Başka bir nokta, örneklerin uç uçlarının yakınsama olasılığının daha düşük olacağı için binom verileriyle ilgili potansiyel bir sorun olduğudur.
John

@John: Kalıntıları yeniden örneklemeyi tercih ediyorum çünkü (1) orijinal modelin tahmin edilmesi zahmetli olduğunda daha hızlıdır ve (2) katılımcı araçlar arasındaki değişkenliğe atfedilebilen değişkenliği ortadan kaldıran CI'leri verir. # 2, ham verileri ve tekrarlanan ölçümler efektini göstermek istediğinizde birden fazla grafik oluşturmanız gerekmediği anlamına gelir; varyansla kaldırılan bu CI'leri ham veriler üzerine çizebilirsiniz ve bunlar bireyler içinde tekrarlanan koşulların karşılaştırılması için uygun olacaktır. Bu tür CI'lerin anlamı konusunda karışıklık olabilir, ancak şekil altyazıları bunun içindir.
Mike Lawrence

@John: Bu yaklaşımın binom verisine uygulanabilirliği konusundaki korkularınızı ayrıntılandırabilir misiniz?
Mike Lawrence

Yanıtlar:


-1

Kitabım Bootstrap Methods 2nd Edition 2007'ye kadar çok büyük bir bibliyografyaya sahip. Bu yüzden kitaptaki konuyu kapsamasam bile referans kaynakçada olabilir. Elbette doğru anahtar kelimeleri içeren bir Google araması daha iyi olabilir. Freedman, Peters ve Navidi doğrusal regresyon ve ekonometrik modellerde tahmin için önyükleme yaptılar, ancak karışık model durumunda ne yapıldığından emin değilim. Stine'nin 1985 JASA kağıdı Regresyon için Bootstrap tahmin aralıkları, daha önce görmediyseniz çok ilginç bulacağınız bir şeydir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.