Varyans analizinde (ANOVA) neden tek kuyruklu bir F testi kullanıyoruz?


13

Varyans testi analizinde tek kuyruklu bir test kullanma nedenini verebilir misiniz?

ANOVA'da neden tek kuyruklu bir test - F testi - kullanıyoruz?


2
Düşüncelerinizi yönlendirecek bazı sorular ... Çok olumsuz bir istatistik ne anlama geliyor? Negatif bir F istatistiği mümkün müdür? Çok düşük bir F istatistiği ne demektir? Yüksek bir F istatistiği ne demektir?
russellpierce

Neden tek kuyruklu bir testin F-Testi olması gerektiği izlenimi altındasınız? Sorunuzu cevaplamak için: F-Testi, birden fazla doğrusal parametre kombinasyonu ile bir hipotezi test etmenizi sağlar.
IMA

1
İki kuyruklu test yerine neden tek kuyruklu bir test kullanılacağını bilmek ister misiniz?
Jens Kouros

@ ağaç amaçlarınız için güvenilir veya resmi bir kaynak nedir?
Glen_b

1
@Tree, Cynderella'nın buradaki sorusunun bir varyans testi değil , özellikle de araçların eşitliği için bir test olan ANOVA'nın bir F testi ile ilgili olduğunu unutmayın . Varyansların eşitliği testleriyle ilgileniyorsanız, bu sitedeki diğer birçok soruda tartışılmıştır. (Varyans testi için, evet, bu bölümün son cümlesinde, ' Özellikler'in hemen üstünde açık bir şekilde açıklandığı gibi, her iki
kuyruğa da önem veriyorsunuz

Yanıtlar:


17

F testleri en yaygın olarak iki amaç için kullanılır:

  1. ANOVA'da araçların eşitliğini (ve çeşitli benzer analizleri) test etmek için; ve

  2. varyansların eşitliğini test etmede

Her birini sırayla düşünelim:

1) ANOVA'daki F testleri (ve benzer şekilde, sayım verileri için olağan ki-kare testleri çeşitleri), veriler alternatif hipotezle ne kadar tutarlı olursa, test istatistiği o kadar büyük olur, örnek düzenlemeleri null ile en tutarlı görünen veriler, test istatistiğinin en küçük değerlerine karşılık gelir.

Üç numuneyi (eşit örnek varyanslı 10 beden) düşünün ve eşit örnek araçlara sahip olacak şekilde düzenleyin ve ardından araçlarını farklı desenlerde hareket ettirin. Numune araçlarındaki değişim sıfırdan arttıkça F istatistiği büyür:

3 numunenin düzenlenmesi ve karşılık gelen F istatistiği

Siyah çizgiler ( ) veri değerleridir. Ağır kırmızı çizgiler ( ) grup anlamına gelir.|||

Eğer sıfır hipotezi (nüfus araçlarının eşitliği) doğruysa, örnek araçlarda bir miktar değişiklik beklersiniz ve tipik olarak F oranlarını kabaca 1 civarında görmeyi beklersiniz. bekliyoruz ... bu yüzden sonuç anlamına gelmeyecek nüfus farklı anlamına gelir.

Yani alışılmışın dışında büyük F-değerleri alınca ANOVA için, sen araçlarının eşitlik hipotezi reddetmek edeceğiz olduğunu ve normalden daha küçük değerler (Bu gösterebilir gidince araçlarının eşitlik hipotezi reddetmek olmaz bir şey değil, nüfusun farklı olduğu anlamına gelir).

Aşağıda, yalnızca F üst kuyruğundayken reddetmek istediğimizi görmenize yardımcı olabilecek bir örnek verilmiştir:

ANOVA için F'nin tanımı, F-istatistiği üst kuyruktayken reddetme

2) Varyans eşitliği * için F testleri (varyans oranlarına dayalı). Burada, pay numune varyansının paydadaki varyanstan çok daha büyük olması durumunda iki örnek varyans tahmininin oranı büyük olacak ve payda örnek varyansının paydaki varyanstan çok daha büyük olması durumunda oran küçük olacaktır.

Yani, nüfus varyanslarının oranının 1'den farklı olup olmadığını test etmek için, hem büyük hem de küçük F değerleri için null değerini reddetmek isteyeceksiniz.

* (Bu testin dağıtım varsayımına yüksek hassasiyet konusunu bir kenara bırakmak (daha iyi alternatifler vardır) ve ayrıca ANOVA eşit varyans varsayımlarının uygunluğu ile ilgileniyorsanız, en iyi stratejinizin muhtemelen bir resmi test.)


2
@TaylerJones Levene'nin testi biraz daha sağlam. Browne-Forsythe daha sağlamdır (ancak normalin yakınında biraz güç kaybeder). Fligner-Killeen yine böyle. Birkaç on yıl içinde, Levene veya Browne-Forsy'yi kullandım. (Tekrar ortaya çıkarsa, muhtemelen Browne-Forsy gibi bir şey bana yakışırdı, ancak genellikle birkaç grup varyansını eşitlik için test
etmenin

2
Ben özür dilerim. ANOVA'da neden tek kuyruk kullandığımızı hala anlamadım . Daha spesifik olarak, tartışmanızdan, sıfır hipotezi altında herhangi bir tedavi etkisinin olmayacağını anladım ve sonuç olarak yakın olacak , alternatif hipotez doğruysa -Ratio daha büyük olacaktır. Ancak "ANOVA'da tek kuyruklu testin kullanılmasının nedeni budur?" 1FF=MSTREATMENTMSERROR1F
Zaman

2
@ hipotez testi hakkında daha genel bir şey anlamadığınız anlaşılıyor, ancak tam olarak nerede olduğundan emin olmak zor. Büyük bir F alırsanız reddetmek istediğinizi ve küçük bir F alırsanız reddetmek istemediğinizi anlarsınız. F'nin büyük değerleri üst kuyruktaki değerlerdir, küçük F değerleri ise alt kuyruktaki değerlerdir. Sadece değerler büyük olduğunda reddetmek istersiniz ... yani üst kuyrukta, ancak alt kuyrukta değil. Bunun kuyruklu olduğunu nasıl göremiyorsun? Yardımcı olabilecek başka bir konu ekleyeceğim.
Glen_b -Manica Monica

1
@jeramy Yorumlarım, varyans oranlarına dayanan testlere atıfta bulunuyor (özellikle, " Burada iki örnek varyans tahmininin oranı ..." ifadesini kullanacağım ). Belirttiğiniz testler, yayılmadaki farklılıkları tespit etmek için bazı konum ölçülerinden mutlak artıklarda konum farklılıkları olup olmadığına bakın; doğal olarak konum farklılıkları için testler üzerinde çalışırlar. Ben zaman dava göstermeye çalıştığını yana olacağını F alt kuyruk bakmak, Brown-Forsythe (& diğer bazı testler anlaması yayılmış farklılıklara sapma bir ölçüde yer farklılıklara bakmak o) hiçbir yardım olurdu
Glen_b -Monica'yı

1
@jeramy Daha açık hale getirmek için birkaç kelime ekledim. Brown-Forsythe, Levene ve benzeri F-tabloları kullanılmasına rağmen , test istatistiklerinin dağılımının testin varsayımları altında bile aslında F-dağıtılmadığını not etmek isteyebilirsiniz .
Glen_b-Monica Monica'ya

2

ANOVA'nın amacının, numuneler arasındaki varyasyonlarla karşılaştırıldığında, numuneler arasındaki büyük varyasyonlarla (ve böylece varyasyonlardan hesaplandığı gibi anlamına gelir) ilgili olduğumuzu ima eden araçların eşitsizliği olup olmadığını kontrol etmek olduğu anlaşılmalıdır. (yine münferit numune ortalamasından hesaplanmıştır). Örnekler arasındaki varyasyonlar küçük olduğunda (F değerinin sol tarafta olmasıyla sonuçlanır) bu farkın önemsiz olması önemli değildir. Örnekler arasındaki varyasyonlar, içerideki varyasyonlardan önemli ölçüde yüksekse ve bu durumda F değeri 1'den fazla ve dolayısıyla sağ kuyrukta olursa önemlidir.

Geriye kalan tek soru, neden tüm önem düzeyini sağ kuyruğa koyduğudur ve cevap yine benzerdir. Reddetme yalnızca F oranı sağ tarafta olduğunda ve asla F oranı sol tarafta olmadığında gerçekleşir. Anlamlılık düzeyi, istatistiksel sınırlamalardan kaynaklanan hata ölçüsüdür. Reddetme sadece sağda gerçekleştiğinden, tüm önem düzeyi (yanlış yanılma riski) sağda tutulur. '


0

Tedaviler içindeki Ortalama Kare (MS) için beklenen değer popülasyon varyansı iken, tedaviler arasındaki MS için beklenen değer tedavi varyansı PLUS popülasyon varyansıdır. Bu nedenle, F = MSbween / MS oranı ile her zaman 1'den büyük ve asla 1'den az değildir.

1 kuyruklu bir testin hassasiyeti 2 kuyruklu bir testten daha iyi olduğu için 1 kuyruklu testi kullanmayı tercih ediyoruz.


İlk paragrafınızın son cümlesindeki iddianın doğru olduğuna inanmıyorum ... E (pay)> E (payda) bu pay> payda anlamına gelmez.
Glen_b

Glen_b'in yanı sıra, "1-kuyruklu bir testin hassasiyeti 2-kuyruklu bir testten daha iyi olduğu için, 1-kuyruklu testi kullanmayı tercih ettiğimizden" emin değilim. Bununla ne demek istediğini açıklayabilir misin? Hassasiyetten bahsetmek bana noktayı kaçırmak gibi geliyor.
Silverfish

Hassasiyet yarı güven aralığıyla aynıdır. Aynı F-stat için, 1 kuyruk testi, sıfır hipotezini daha küçük bir p değeriyle (aslında yarısı) reddedecektir. Diğer bir yol, 1 kuyruk testi, sıfır hipotezini daha düşük F-stat değerleri ile reddedebilir. Bu, 1 kuyruk testinin daha az örnekle veya örnekte daha yaygın neden varyansıyla bir tedavi etkisini tespit edebileceğini ima eder. Bu, eğer bir etki arıyorsa, 1 kuyruk testini daha cazip hale getirir.
Jeff Cotter

Evet, hesaplanan bir F istatistiği 1,0'dan az olabilir. Ancak, sonuç "tedavi etkisi yok" un sıfır hipotezini reddetmekte başarısız olur. Bu nedenle, alt kuyrukta kritik bir bölge yoktur. Bu nedenle, F testi üst tek kuyruklu bir testtir. ANOVA'da, mantıksal bağımsız değişken MS_treat ve MS_error için beklenen değerlere dayanır. "Tedavi etkisi yok" hipotezi altında H0: E (MS_treat) = E (MS_error) = popülasyon varyansı. Herhangi bir önemli tedavi etkisi HA: E (MS_treat)> E (MS_error) ile sonuçlanır. (ANOVA'yı kapsayan herhangi bir Montgomery metnini kaynaklayın). Böylece HA tek kuyruklu bir test gerektirir.
Jeff Cotter
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.