İki numunenin ortalamalarını karşılaştırmak için bir bootstrap testi nasıl yapılır?


12

Ben iki ağır çarpık örnekleri var ve t-istatistik kullanarak araçlarını karşılaştırmak için bootstrapping kullanmaya çalışıyorum.

Bunu yapmak için doğru prosedür nedir?


Kullandığım süreç

Bunun normal olarak dağıtılmadığını bildiğimde, son adımda orijinal / gözlemlenen verilerin standart hatasını kullanmanın uygunluğu konusunda endişeliyim.

İşte adımlarım:

  • Bootstrap - yedekli rastgele örnek (N = 1000)
  • Bir t dağılımı oluşturmak için her önyükleme için t istatistiğini hesaplayın:
    T(b)=(X¯b1X¯b2)(X¯1X¯2)σxb12/n+σxb22/n
  • T dağılımının ve 1 - α / 2 yüzdelik değerlerini alarak t güven aralıklarını tahmin edinα/21α/2
  • Güven aralıklarını kullanarak:

    CIL=(X¯1X¯2)T_CIL.SEoriginal
    CIU=(X¯1X¯2)+T_CIU.SEoriginal
    SE=σX12/n+σX22/n
  • Ortalamalarda önemli bir fark olup olmadığını belirlemek için güven aralıklarının nereye düştüğüne bakın (örn. Sıfır olmayan)

Ben de Wilcoxon rütbe-toplamı baktım ama çok ağır çarpık dağılımı (örneğin 75th == 95th persentil) nedeniyle çok makul sonuçlar vermiyor. Bu nedenle bootstrapped t testini daha fazla araştırmak istiyorum.

Yani sorularım:

  1. Bu uygun bir metodoloji mi?
  2. Yoğun çarpık olduğunu bildiğimde gözlemlenen verilerin SE'sini kullanmak uygun mudur?

Olası kopya: Hangi yöntem tercih edilir, önyükleme testi veya parametrik olmayan sıra tabanlı test?


Numuneler ne kadar büyük?
Michael M

Michael Mayer Yaklaşık 800
CatsLoveJazz

Yanıtlar:


16

Sadece düzenli bir bootstrap testi yapardım:

  • verilerinizdeki t istatistiğini hesaplayın ve saklayın
  • verileri sıfır hipotezi doğru olacak şekilde değiştirin. Bu durumda, grup 1'deki ortalamayı grup 1 için çıkarın ve genel ortalamayı ekleyin ve grup 2 için de aynısını yapın, böylece her iki gruptaki ortalamalar genel ortalama olacaktır.
  • Bu veri kümesinden, muhtemelen 20.000 sırasıyla önyükleme örnekleri alın.
  • bu bootstrap örneklerinin her birinde t istatistiğini hesaplar. Bu t istatistiklerinin dağılımı, boş hipotez doğruysa, çarpık verilerinizdeki t istatistik istatistiği dağılımının önyükleme tahminidir.
  • p(+1)(+1)

Bununla ilgili daha fazla bilgiyi şu adreste bulabilirsiniz:

  • AC Davison ve DV Hinkley (1997) Bootstrap Yöntemleri ve Uygulamaları Bölüm 4 . Cambridge: Cambridge Üniversitesi Yayınları.

  • Bradley Efron ve Robert J. Tibshirani'nin Bölüm 1993'ü (1993) Bootstrap'a Giriş . Boca Raton: Chapman ve Salon / CRC.

  • Bootstrap hipotez testine Wikipedia girişi.


Bu aslında yaptığım şey ama orijinal / gözlemlenen t-istatistiğin> = önyüklemeli t-istatistiğin oranına bakıldığında. İlk etapta ağır çarpık veriler üzerinde bir t-testi yapmak tamam mı, bu neden artırmak istiyorum nedenlerinden biridir.
CatsLoveJazz

2
Teknik olarak, bootstrap testi için sadece bir test istatistiğine ihtiyacınız var, bu yüzden bir sorun değil. Önemli olarak, bir t-testi araçları karşılaştırır ve çarpık veri medyanları genellikle araçlardan daha anlamlıdır. Dolayısıyla, medyanları araç yerine karşılaştırmak bir test daha mantıklı olabilir. Bununla birlikte, bu sizin seçiminiz ve tek başına seçiminiz olan sıfır hipotezinize bağlıdır.
Maarten Buis

Tamam teşekkürler, diğer tüm çıktılarımız bu formda olduğu için test etmek istediğimiz ortalama.
CatsLoveJazz
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.