Artıkları karışık efektler modelinden önyüklemek neden anti-muhafazakar güven aralıkları veriyor?


11

Tipik olarak, birden fazla bireyin her biri 2 veya daha fazla koşulda birden çok kez ölçüldüğü verilerle ilgilenirim. Son zamanlarda, koşullar arasındaki farklılıklar için kanıtları değerlendirmek için karışık efekt modelleme ile, individualrastgele bir etki olarak modelleme ile oynuyorum . Böyle bir modellemeden tahminlerle ilgili belirsizliği görselleştirmek için, bootstrap'i her bir yinelemede hem bireylerin hem de bireyler içindeki koşullar içindeki gözlemlerin yerine koyulduğu ve yeni bir karma etki modelinin hangi tahminlerden hesaplandığı elde edildi. Bu, gauss hatası kabul eden veriler için iyi çalışır, ancak veriler binom olduğunda, her yineleme nispeten hesaplama yoğun bir binom karışık efekt modeli hesaplaması gerektiğinden önyükleme çok uzun zaman alabilir.

Sahip olduğum bir düşünce, muhtemelen orijinal modeldeki kalıntıları kullanabileceğim ve daha sonra önyüklemedeki ham veriler yerine bu kalıntıları kullanabileceğim ve bu da önyüklemenin her yinelemesinde bir gauss karışık efekt modelini hesaplamama izin verecekti. Ham verilerin binom modelinden orijinal tahminlerin kalıntılardan önyüklemeli tahminlere eklenmesi, orijinal tahminler için% 95 CI verir.

Ancak, son zamanlarda kodlanmış iki durum arasında bir fark modelleme ve zaman oranını işlem, bu yaklaşımın kolay bir değerlendirme, bir% 95 güven aralığı, sıfır sağlamadılar ve bulundu yukarıda artıklar tabanlı önyükleme işlemi verimleri oldukça güçlü anti-o muhafazakar aralıklar (zamanın% 5'inden fazlasını sıfırlar hariç tutarlar). Ayrıca, daha sonra bu yaklaşımın orijinal olarak gauss olan verilere uygulanan benzer bir değerlendirmesini kodladım ve benzer şekilde (aşırı olmasa da) anti-muhafazakâr CI'ler elde ettim. Bunun neden olabileceğine dair bir fikrin var mı?


hm, sadece her iki durum için veri üreten kodda aslında bir kişinin rastgele etkiler olarak modelleme ile ortadan kaldırmakla ilgilenen bireyler arası değişkenlik eklemediğimi fark ettim. Bu değişkenliği eklemenin sonucu değiştirip değiştirmediğini göreceğim; birkaç saat içinde ...
Mike Lawrence

Doğru hatırlarsam, bootstrap tahmini gerçek nüfus tahminine daha yakın yapar. Güven aralığı hakkında hiçbir şey söylemez. (bkz. Kesar Singh, Efron'un bootstrapinin asimptotik doğruluğu üzerine. Ann. Statist., 1981, 9, 1187-1195)
suncoolsu

@me: Veri oluşturma işlevine bireyler arası değişkenlik eklenmesinin önyüklemenin performansını iyileştirmediğini onaylayabilirim. Orijinal yazıda bağlı gist bu onaylamak için kullandığım kodu yükledim.
Mike Lawrence

@ suncoolsu: Bootstrapped güven aralıklarının oldukça uzun süredir standart olduğundan eminim. Efron, genel olarak önyükleme prosedürünü açıklayan 1978 tarihli makalesinde bundan sonra, daha doğru güven aralıkları (önyargı düzeltme, hızlanma, öğrenci, vb.)
Mike Lawrence

1
Morris tarafından şu makaleyi okudunuz mu: "BLUP'lar önyükleme söz konusu olduğunda en iyisi değil". İşinizle ilgili olabilir. bağlantı
julieth

Yanıtlar:


7

Tüm bootstrap güven aralıklarının yalnızca asimtotik olarak belirtilen güven düzeyinde olduğunu unutmayın. Ayrıca, Bootstrap güven aralıklarını seçmek için bir dizi olası yöntem vardır: Efron'un yüzdelik yöntemi, Hall'un yüzdelik yöntemi, çift önyükleme, önyükleme t, eğik önyükleme, BC, BCa ve belki birkaç tane daha. Hangi yöntemi kullandığınızı söylemediniz. Schenker'in JASA 1985'teki makalesi, bazı ki kare dağılımları için BC önyükleme güven aralığının ilan edilen yüzdeyi gizlediğini gösterdi. Küçük örneklem büyüklüğü problemlerinde bu problem ciddi olabilir. LaBudde ve ben, BCA'nın bile küçük örneklerde lognormal dağılımdan bir varyansı tahmin ederken nasıl çok zayıf bir kapsama sahip olabileceğini gösteren iki makalemiz var ve benzer bir problem, iki varyansın eşitliğini test etmek için var. Bu sadece basit bir problem için. Aynı şeyin karışık modellerden kalıntılarda da olmasını bekliyorum. Wiley tarafından 2011 yılında yayınlanan yeni kitabımız "R Uygulamalarına Yönelik Bootstrap Yöntemlerine Giriş" Bölüm 3.7'de bu konuyu ele alıyor ve referanslar sağlıyoruz. Sürpriz, yüzdelik yöntemin, örnek boyutu küçük olduğunda bazen yüksek mertebeden doğru BCa yönteminden daha iyi sonuç vermesidir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.