Giriş: Bugün bu sorunun dikkatini çeken “ ANOVA, ikili t-testlerinin hiçbiri olmadığında önemli olabilir mi? ”, Diye düşündüm. .
İstatistiksel anlamlılık basit bir ikilik olarak anlaşıldığında ve sadece veya bazında değerlendirildiğinde çeşitli uyumsuz sonuçlar ortaya çıkabilir (yüz değerinde) . @ Glen_b'in yukarıdaki soruya vereceği cevap, aşağıdaki durumlarda yararlı bir örnek sunmaktadır:
- Bir ANOVA testi, dört seviyeli bir bağımsız değişken (IV) için üretir , ancak
- IV'ün dört seviyesinin her bir çiftine karşılık gelen gözlemler arasında aynı bağımlı değişkente (DV) farklılıkları karşılaştıran tüm iki örnekli testleri için .
Benzer bir vaka, bu soru yoluyla hoc sonrası ikili karşılaştırmalar için Bonferroni düzeltmelerine rağmen ortaya çıktı: Anova tekrarlanan ölçümler önemlidir, ancak Bonferroni düzeltmesi ile yapılan tüm çoklu karşılaştırmalar önemli değil mi? Daha önce bahsedilen çoklu regresyonda biraz farklı bir teste sahip vakalar da vardır:
- Önemli F istatistiğini (p <.001) almak, ancak anlamlı olmayan regresör t-testlerini almak neden mümkün? :
- Bir regresyon nasıl önemli olabilir, ancak tüm öngörücüler anlamlı olmayabilir?
- @ Whuber'ın cevabında ,
Bu gibi durumlarda, karşılık gelen bir omnibus testi bir elde edebiliyorsa , bazı (ama hepsi değil) çift karşılaştırmalar '(veya regresyon katsayıları' önem testleri ') değerlerinin yakın olması gerektiğine bahse girerim . @ Glen_b'in ilk örneğinde durum böyle görüyorum, burada , ve en büyük çift farkı en küçük . Genel olarak böyle mi olmalı? Daha spesifik olarak :
Soru: Bir ANOVA testi, bir IV'ün sürekli bir DV üzerindeki etkisi için bir üretirse , en düşük değeri , IV düzeylerinin her bir çiftini karşılaştıran iki örnekli testi arasında ne kadar yüksek olabilir ? Minimum ikili önem kadar yüksek olabilir mi?
Sadece bu soruya cevap veren cevapları memnuniyetle karşılıyoruz . Bununla birlikte, bu soruyu daha fazla motive etmek için, potansiyel retorik bazı soruları ayrıntılı olarak açıklayacağım. Bu endişeleri de ele almaktan hoşlanıyorsanız ve hatta özellikle belirli bir soru kesin bir cevap alırsa, belirli bir soruyu görmezden gelmekten çekinmeyin.
Önem: İstatistiksel önem, sıfır hipotezine karşı kanıtın gücü açısından sürekli olarak değerlendirilirse, ve arasındaki farkın ne kadar az önemli olacağını düşünün (Ron Fisher yaklaşımı, sanırım?), null toptan satışın reddedilip reddedilmeyeceğini seçme konusunda kabul edilebilir hata olasılığı için bir eşiğinin üstünde veya altında olduğu gibi ikiye ayrılır . " hackleme ", kötü şöhretini kısmen yorumlanmasıyla ortaya çıkan gereksiz bir güvenlik açığına borçlu olduğu bilinen bir sorundur."yeterince iyi" ve "yeterince iyi değil" eşdeğerlerine karşı ikiye ayrılma yaygın uygulamasına göre değerler. Eğer kişi bu uygulamayı elden çıkaracak ve bunun yerine değerlerini sürekli bir aralıkta null'a karşı kanıt gücü olarak yorumlamaya odaklanacaksa , çok çiftli karşılaştırmaları gerçekten önemsediğinde omnibus testi biraz daha az önemli olabilir mi? Değil gereksiz zorunlu İstatistiksel doğruluğu herhangi bir makul etkin bir düzelme, örneğin, düşük çiftler halinde bir karşılaştırması en eğer ... Tabii ki tercih edilir, ancak değeri olan zorunlu olan ANOVA (veya başka bir çok maddeli testi)değer, bu omnibus testini, özellikle birden fazla testte kontrol etmek istemiyorsa, daha önemsiz, daha az zorunlu ve daha da yanıltıcı (önceden var olan yanlış anlamalar ile birlikte) yapmaz mı?
Tersine, eğer bir omnibus , ancak tüm çift veriler mevcutsa , bu uygulama ve pedagoji boyunca omnibus ve kontrast testini daha da motive etmemelidir ? Bana öyle geliyor ki, bu konu, bir ikilik ve sürekliliğe göre istatistiksel önemi değerlendirmenin göreceli değerlerini, farklılıklar "marjinal olarak önemli" olduğunda küçük ayarlara karşı daha duyarlı olması gerektiğinden, her iki sistemde de bu fark / ayarlama çok büyükse (örn., bir omnibus testi yapılmaması veya çoklu karşılaştırmalar için ayarlama yapılmaması durumunda güvenlidir .
Göz önünde bulundurulması veya görmezden gelmesi gereken diğer isteğe bağlı karmaşıklıklar — yanıtlamayı daha kolay ve daha değerli kılan :
- Ne kadar ler için ler olabilir, eğer için , yerine (örneğin, )t F p < .05 p = .01 , .001 , …
- Polytomous IV'teki seviye sayısına duyarlılık IV
- Çiftli farklılıkların önemindeki eşitsizliklere duyarlılık (tüm iken )
- whuber'ın cevabı , küçük farklılıklar dahil etmenin büyük farklılıkları maskeleyebileceğini gösterir.
- Birden fazla karşılaştırma için çeşitli omnibus testlerinin düzeltmeleri arasındaki farklar
- Ayrıca bakınız: Bir öznede / tekrarlanan ölçümlerde çoklu karşılaştırmalar için düzeltme ANOVA; aşırı muhafazakar mı?
- Birden fazla IV ile, çoklu doğrusallık bu sorunu daha da kötüleştirebilir .
- Verilerin klasik parametrik testlerin tüm varsayımlarını en iyi şekilde karşıladığı kısıtlı durumlar
- Bu kısıtlama, bu sorunun biraz tartışılmasını önlemek için önemli olabilir.