Bir homojenlik varyansı varsayımı varsayıldığında bir Welch düzeltmeli t-testi ve standart bir t-testi sonuçlarının yaklaşık olarak aynı olduğu görülüyor. Neden her zaman sadece Welch adj t ayarını kullanmıyorsunuz?
Bir homojenlik varyansı varsayımı varsayıldığında bir Welch düzeltmeli t-testi ve standart bir t-testi sonuçlarının yaklaşık olarak aynı olduğu görülüyor. Neden her zaman sadece Welch adj t ayarını kullanmıyorsunuz?
Yanıtlar:
Kubinger, Rasch ve Moder (2009) tarafından yayınlanan bir bildiri üzerine (Almanca) diğer iki cevaba itiraz etmek istiyorum .
Dağıtımların "kapsamlı" simülasyonlarına dayanarak, t-testinin getirdiği varsayımları yerine getirip getirmediğini (varyansın normalliği ve homojenliği) varsayımlar yerine getirildiğinde (yani, temel olarak aynı) eşit derecede iyi performans gösterdiğini iddia ederler. alfa ve beta hataları yapma olasılığı) ancak varsayımlar yerine getirilmezse, özellikle güç açısından t testinden daha iyi performans gösterir. Bu nedenle, örnek büyüklüğü 30'u geçerse, her zaman kaynak testini kullanmanızı önerirler.
Meta-yorum olarak: İstatistiklere ilgi duyan insanlar için (burada benim ve muhtemelen en çok diğerleri gibi) verilere dayalı bir tartışma (benimki olarak), en azından sadece teorik gerekçelere dayanan (burada diğerleri) olduğu kadar eşit olarak sayılmalıdır.
Güncelleme:
Bu konuyu tekrar düşündükten sonra, yenisinin benim açımdan desteklediği iki öneri daha buldum. Bu önerilere yol açan tartışmalar için orijinal makalelere (her ikisi de, en azından benim için serbestçe ulaşılabilir) bakın.
İlk öneri 2006'daki Graeme D. Ruxton'dan geliyor: “ İlişkisiz veri örneklerine dayanarak 2 popülasyonun merkezi eğilimini karşılaştırmak istiyorsanız, eşitsiz varyans t testi her zaman Öğrenci t-testi tercihinde kullanılmalıdır. veya Mann-Whitney U testi. "
In:
Ruxton, GD, 2006. Eşitsiz varyans t testi, Student t-testi ve Mann-Whitney U testi için kullanılmayan bir alternatiftir .
Behav. Ecol . 17, 688-690.
İkinci (daha eski) öneri, Coombs ve ark. (1996, sayfa 148). " Özetle, bağımsız t testi eşit kitle varyansı varsayımı ihlal bile, yeterince büyük bir eşit büyüklükte örnekleri vardır Tip hata oranlarını kontrol etmek açısından genellikle kabul edilebilir değildir. Eşit olmayan için Bununla birlikte, eşit büyüklükteki varyansları kabul etmeyen bir alternatif tercih edilir.Ağırlıklar kısa kuyruklu simetrik veya normal olduğunda James ikinci dereceden testini kullanın. Tip I hata oranlarının Welch testinden veya James testinden daha geniş kontrolü ve veriler uzun kuyruklu olduğunda daha fazla güce sahip. ” (vurgu eklendi)
In:
Coombs WT, Algina J, Oltman D. 1996. Nüfus değişkenleri mutlaka eşit olmadığında tip I hata oranlarını kontrol etmek için seçilen tek değişkenli ve çok değişkenli omnibus hipotez testleri . Rev Educ Res 66: 137–79.
Tabii ki, her iki testten birisini çıkarabilir ve eşitsiz ve eşitsiz varyansları açıklayabilen bir Bayesian t-testi (Savage-Dickey oran testi) kullanmaya başlayabilir ve hepsinden iyisi, bu durumun lehine bir kanıt miktarının belirlenmesini sağlar. sıfır hipotezi (yani, artık eski "reddetme başarısızlığı" konuşması anlamına gelir)
Bu testin uygulanması çok basit (ve hızlı) ve Bayesian istatistiklerine yabancı olan okuyuculara açık bir şekilde bir R betiği ile birlikte nasıl kullanılacağını açıklayan bir makale var. Temelde sadece veri eklemek için komutları R konsoluna gönderebilirsiniz:
Bunların yanı sıra örnek veriler içeren bir eğitim de var:
http://www.ruudwetzels.com/index.php?src=SDtest
Bunun sorulanın doğrudan bir cevabı olmadığını biliyorum, ama okuyucuların bu güzel alternatife sahip olmaktan zevk alabileceğini düşündüm.
şerefe
Çünkü kesin sonuçlar yaklaşımlara tercih edilir ve yaklaşımın kesin yöntemden farklı bir sonuca yol açabileceği garip kenar durumlarından kaçının.
Welch yöntemi, eski bir t testi yapmanın daha hızlı bir yolu değildir, aksi halde çok zor bir soruna izlenebilir bir yaklaşımdır: eşit olmayan varyanslar altında bir t testi nasıl yapılır. Eşit değişkenlik durumu iyi anlaşılmış, basit ve kesindir ve bu nedenle mümkün olduğunda daima kullanılmalıdır.
Düşünebilmemin iki nedeni:
Numune boyutları eşitse, normal Öğrenci T'si heterossedastisiteye oldukça dayanıklıdır.
Eğer kuvvetle düşünüyorsanız önsel veri homoskedastik olduğunu, o zaman hiçbir şey kaybeder ve yerine Welch'in T. Studen'ts T kullanarak güç az miktarda elde edebilecekleri
Ben ki bir nedeni değil vermek Öğrenci T kesin ve Welch'in T olmadığıdır. IMHO, Öğrenci T'sinin kesinliği akademikdir, çünkü yalnızca normal dağılıma ilişkin veriler için kesindir ve gerçek veriler tam olarak normal dağılıma sahip değildir. Dağıtımın makul bir şekilde tüm gerçek sayıları destekleyebileceği yerlerde, istatistiki olarak insanların gerçekten ölçtüğü ve analiz ettiği tek bir miktar düşünemiyorum. Mesela, evrende sadece çok fazla atom var ve bazı miktarlar negatif olamaz. Bu nedenle, gerçek veriler üzerinde herhangi bir T testi kullandığınızda, yine de bir yaklaşımda bulunursunuz.
Bazı varsayımlar kontrol edildiğinde daha karmaşık bir şeyin daha az karmaşık bir şeye indirgenmesi, daha basit olan yöntemi atmak için yeterli değildir.
Burada tam tersi bir manzara izlerdim. Standart eşleştirilmemiş student t testi size neredeyse aynı sonuçları verdiğinde neden Welch testi ile uğraşmıyorsunuz? Bir süre önce bu konuyu çalıştım ve t testini parçalama ve Welch testini destekleme girişiminde bir dizi senaryo araştırdım. Bunu yapmak için diğerine göre bir grup için 5 kat daha büyük örneklem büyüklükleri kullandım. Bir grup için diğerine göre 25 kat daha fazla varyans araştırdım. Ve, gerçekten herhangi bir maddi fark yaratmadı. Eşleştirilmemiş t testi, Welch testiyle neredeyse aynı olan bir dizi p değeri üretti.
Çalışmalarımı aşağıdaki linkte görebilir ve özellikle 5 ve 6 numaralı slaytlara odaklanabilirsiniz.
Welch düzeltilmiş testinin sık özelliklerinin, en azından hatalar için normal Öğrenci T'sinden daha iyi olduğu doğrudur. Welch testi için tek başına bunun oldukça iyi bir argüman olduğuna katılıyorum. Ancak, genellikle Welch düzeltmesini önermekte isteksizim çünkü kullanımı genellikle aldatıcı. Kuşkusuz ki, testin kendisinin bir eleştirisi değildir.
Welch düzeltmesini önermememin nedeni, sadece serbestlik derecelerini ve ardından p-değerinin çizildiği teorik dağılımı değiştirmemesidir. Testi parametrik yapmaz. Bir Welch düzeltmeli t-testi gerçekleştirmek için, bir varyans, eşit varyans kabul edilebileceği gibi varyansı bir araya getirir, ancak daha sonra eşit varyansın kabul edilemeyeceğini veya sadece örnek varyanslarını umursamanızı ima eden son test prosedürünü değiştirir. Bu, parametrik olmayan bir test yapar, çünkü havuzlanmış varyans popülasyonun temsili sayılmaz ve sadece gözlemlediğiniz değerleri test ettiğinize karar verdiniz.
Kendi içinde, bunda özellikle yanlış olan hiçbir şey yoktur. Bununla birlikte, aldatıcı buluyorum çünkü a) tipik olarak yeterince kesin olarak bildirilmemiş; ve b) onu kullanan insanlar, bir t-testi ile bunun yerine değişmeli olarak düşünme eğilimindedir. Yayınlanmış makalelerde yapıldığını bildiğim tek yol, t dağıtımı için garip bir DF gördüğüm zamandı. Bu aynı zamanda Rexton'un (Henrik cevabına referans verilmiş) incelemede anlattığı tek yoldu. Ne yazık ki, Welch düzeltilmiş testinin parametrik olmayan niteliği, serbestlik derecelerinin değişip değişmediği (örneğin, örnek varyansları eşit olsa bile) oluşur. Ancak bu raporlama konusu, Welch düzeltmesini kullanan çoğu kişinin testte bu değişikliği tanımadığı gerçeğinin belirtisidir.
Bu nedenle, bu nedenle, parametrik olmayan bir test önerecek olursanız, genellikle parametrik görünen ya da en azından ne yaptığınız konusunda net olamayacağınızı düşünmeyin. Testin resmi adı Parametrik Olmayan Welch Düzeltilmiş T testi olmalıdır. İnsanlar böyle bildirirse, Henrik'in tavsiyesi üzerine daha mutlu olurdum.