Ben iki ağır çarpık örnekleri var ve t-istatistik kullanarak araçlarını karşılaştırmak için bootstrapping kullanmaya çalışıyorum.
Bunu yapmak için doğru prosedür nedir?
Kullandığım süreç
Bunun normal olarak dağıtılmadığını bildiğimde, son adımda orijinal / gözlemlenen verilerin standart hatasını kullanmanın uygunluğu konusunda endişeliyim.
İşte adımlarım:
- Bootstrap - yedekli rastgele örnek (N = 1000)
- Bir t dağılımı oluşturmak için her önyükleme için t istatistiğini hesaplayın:
- T dağılımının ve 1 - α / 2 yüzdelik değerlerini alarak t güven aralıklarını tahmin edin
Güven aralıklarını kullanarak:
- Ortalamalarda önemli bir fark olup olmadığını belirlemek için güven aralıklarının nereye düştüğüne bakın (örn. Sıfır olmayan)
Ben de Wilcoxon rütbe-toplamı baktım ama çok ağır çarpık dağılımı (örneğin 75th == 95th persentil) nedeniyle çok makul sonuçlar vermiyor. Bu nedenle bootstrapped t testini daha fazla araştırmak istiyorum.
Yani sorularım:
- Bu uygun bir metodoloji mi?
- Yoğun çarpık olduğunu bildiğimde gözlemlenen verilerin SE'sini kullanmak uygun mudur?
Olası kopya: Hangi yöntem tercih edilir, önyükleme testi veya parametrik olmayan sıra tabanlı test?