Hiyerarşik verilerden önyüklenmiş güven aralıklarını edinme ve yorumlama

Bu miktar 10 kişiden 10'unda ölçüldüğünde, X miktarı üzerinde önyüklenmiş bir güven aralığı elde etmekle ilgileniyorum.

Bir yaklaşım, her bir birey için ortalamanın elde edilmesidir, daha sonra vasıtaların önyüklenmesini sağlar (örn., Vasıtaları değiştirerek yeniden örnekleme).

Başka bir yaklaşım, önyükleme prosedürünün her yinelemesinde aşağıdakileri yapmaktır: her bireyde, bireyin 10 gözlemini değiştirme ile yeniden örnekleyin, sonra o birey için yeni bir ortalama hesaplayın ve son olarak yeni bir grup ortalaması hesaplayın. Bu yaklaşımda, orijinal veri setinde gözlemlenen her birey, her zaman bootstrap prosedürünün her yinelemesinde grup ortalamasına katkıda bulunur.

Son olarak, üçüncü bir yaklaşım yukarıdaki iki yaklaşımı birleştirmektir: bireyleri yeniden örnekle sonra bu bireyler içinde yeniden örnekleme. Bu yaklaşım önceki yaklaşımdan farklıdır, çünkü aynı bireyin her bir yinelemede grup ortalamasına katlanmasına izin vermesine rağmen, her katkı bağımsız bir yeniden örnekleme prosedürü ile üretildiğinden, bu katkıların birbirinden biraz farklı olması beklenebilir.

Uygulamada, bu yaklaşımların güven aralığı için farklı tahminler verdiğini görüyorum (örneğin, bir veri kümesiyle, üçüncü yaklaşımın ilk iki yaklaşımdan çok daha büyük güven aralıkları verdiğini düşünüyorum), bu yüzden her birinin ne olabileceğini merak ediyorum temsil etmek için yorumlanır.

confidence-interval bootstrap

— Mike Lawrence
kaynak

Yanıtlar:

İlk yaklaşımınız S CI arasında. S içinde ölçmek istiyorsanız, bu yanlış bir yaklaşımdır.

İkinci yaklaşım, S CI içinde sadece bu 10 kişi için geçerli olacak bir in üretecektir.

Son yaklaşım, S CI için doğru yaklaşımdır. CI'daki herhangi bir artış, CI'nizin, 10 S yerine popülasyona uygulanabilecek bir CI'yi daha fazla temsil etmesidir.

— John
kaynak

Davison ve Hinckley'e göre ("Bootstrap yöntemleri ve uygulamaları", 1997, Kısım 3.8), üçüncü algoritma muhafazakardır. Dördüncü bir yaklaşımı savunuyorlar: basitçe konuları yeniden örneklemek.

— Andrew Robinson
kaynak

İlginç, bu referansa bakmam gerekecek. "Dördüncü" yaklaşım demek istediğinizden emin misiniz? Listelediğim ilk yaklaşım "konuları sadece yeniden örnekleme" yi anlatıyor.

— Mike Lawrence

Evet, öyle ama konu araçlarının yeniden örneklenmesini anlatıyor. D&H deneklerin yeniden örneklenmesini ve orijinal modele uymasını savunuyor.

— Andrew Robinson

Ayrıca son yayınlananları da görmek isteyebilirsiniz: Ren, Shiquan, Lai, Hong, Tong, Wenjing, Aminzadeh, Mostafa, Hou, Xuezhang ve Lai, Shenghan (2010) 'Hiyerarşik veriler için parametrik olmayan önyükleme', Journal of Applied Statistics, 37: 9, 1487 - 1498

— Andrew Robinson

@Mike: tüm clsuter'ı yeniden örneklemek, anket istatistiklerinin önyüklemelerinde yaptıkları şeydir. Bu gerçekten de (i) yalnızca ortalamayı tahmin ediyorsanız ve (ii) veriler ağırlıksız ve dengeli ise "ilk" yaklaşımınıza eşdeğer olacak farklı bir prosedürdür. Ayrıca bkz. Citeulike.org/user/ctacmo/article/1334050 , citeulike.org/user/ctacmo/article/1475866 , citeulike.org/user/ctacmo/article/582039 .

— StasK