Bir günlük dönüşümü, normal olmayan verilerin t testi için geçerli bir teknik midir?


19

Bir makalenin gözden geçirilmesinde yazarlar, "Normallik için önkoşul varsayımları karşılamak için t testleri yapılmadan önce, eğri dağılım gösteren sürekli sonuç değişkenleri doğal logaritmalar kullanılarak dönüştürülmüştür."

Bu normal olmayan verileri analiz etmenin kabul edilebilir bir yolu, özellikle de temeldeki dağıtım mutlaka lognormal değilse?

Bu oldukça nadir bir soru olabilir, ama daha önce yapıldığını görmedim ....


3
Peki, eğer ilk dağılım log-normal değilse, dönüştürülen veriler normallik için önkoşul varsayımlarını karşılamaz, bu yüzden dönüşümle ne kazanılıyor?
Makro

@Macro - yeterince doğru! (+1) - muhtemelen sadece dağılımları simetrik hale getirmek istediler, bu da t-testi için yapmak kötü bir şey değil, ancak kontrol etmedik ve yazmadıkları sürece, log'un dönüşüm konuları daha da kötüleştirmiş olabilir negatif bir çarpıklık indükledi ...
jbowman 0

2
Normalliği tatmin etmek için yapıldığı ve normallik ilk etapta kontrol edildiğinden, normallerin daha sonra kontrol edildiğinden bahsedebiliriz. Buradaki dilde güçlü bir şekilde örtük.
John

10
Logaritmalar için bir t-testi ne dönüştürülmemiş veriler için bir t-testi ne de parametrik olmayan bir test ile aynı değildir. Günlükler üzerindeki t-testi (normal) aritmetik ortalamaları değil, geometrik ortalamaları karşılaştırır . Bu, logaritmaların kullanılmasının kabul edilebilir olup olmadığına (uygulamaya bağlı olarak) karar vermede birkaç önemli hususdan biridir.
whuber

Yanıtlar:


9

Normal olmayan verilerle karşılaşıldığında normalliklere (örneğin, logaritmalar, kare kökler, ... kullanarak) bir tür dönüşüm uygulamaya çalışmak yaygındır. Logaritma, çarpık veriler için makul sıklıkta iyi sonuçlar verirken, bu özel durumda çalışacağının garantisi yoktur. Ayrıca, dönüştürülen verileri analiz ederken yukarıdaki @whubers yorumunu akılda tutmak gerekir: "Logaritmalar için bir t-testi, dönüştürülmemiş veriler için bir t-testi ya da parametrik olmayan bir test ile aynı değildir. (olağan) aritmetik ortalamalar değil. "

n-1Σben=1n(xben-x¯)3(n-1Σben=1n(xben-x¯)2)3/2 bu durumda uygun bir test istatistiğidir.

Çoğu zaman işe yaradığı için bir dönüşüm (logaritma gibi) seçmek yerine, verilen verileri kullanarak bir dönüşüm seçmek için Box-Cox prosedürünü kullanmayı tercih ederim . Ancak bununla ilgili bazı felsefi meseleler var; özellikle bunun t-testindeki serbestlik derecesini etkileyip etkilemeyeceği, çünkü hangi dönüşümü kullanacağınızı seçerken örnekten bazı bilgiler kullandık.

Son olarak, bir dönüşümden sonra t-testinin veya klasik parametrik olmayan bir testin kullanılmasına iyi bir alternatif, t-testinin bootstrap analoğunun kullanılmasıdır . Normallik varsayımı gerektirmez ve dönüştürülmemiş araçlar (ve başka bir şey hakkında değil) hakkında bir testtir.


1
+1 Sonunda iyi bir tavsiye ile iyi, düşünceli tartışma. T-testinin önyükleme / yeniden örnekleme / permütasyon versiyonu hakkında daha fazla bilgi için lütfen stats.stackexchange.com/q/24911 adresindeki son konu başlığına bakın .
whuber

0

Genel olarak, bir t-testi gerçekleştirmek için gereken varsayımların karşılanmaması durumunda, parametrik olmayan bir testin kullanılması daha uygun olacaktır.


5
Olabilir. Parametrik olmayan testler neredeyse her zaman medyanları (veya diğer persentilleri) araçlardan ziyade karşılaştırır ve bu nedenle gerçekten biraz farklı bir soruyu ele alır. Ancak, bu, özellikle (ve sadece) verilerin günlüklerini t-test etme hakkında soran mevcut soruya yardımcı bir cevap gibi görünmemektedir.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.