Aynı temel istatistiksel yöntemin bütün versiyonları nasıl?
Aynı temel istatistiksel yöntemin bütün versiyonları nasıl?
Yanıtlar:
Hepsinin bir regresyon denklemi olarak yazılabileceğini düşünün (belki de geleneksel formlarından biraz farklı yorumlarla).
Regresyon:
t-testi:
ANOVA:
Prototipik regresyon, ile sürekli bir değişken olarak kavramsallaştırılmıştır . Bununla birlikte, aslında hakkında yapılan tek varsayım , bilinen sabitlerin bir vektörü olduğudur. Bu sürekli bir değişken olabilir, ama aynı zamanda bir sahte kod olabilir (diğer bir deyişle, bir vektör 's & bir gözlem belirtilen bir grubun bir üyesi olup olmadığını belirtir' s - örneğin bir tedavi grubu). Böylece, ikinci denklemde, böyle bir sahte kod olabilir ve p-değeri, daha geleneksel haliyle bir t-testinden aynı olacaktır. X 0 1 X
Ancak betaların anlamı burada farklı olabilir. Bu durumda, (kukla değişken girişler yapacak olan kontrol grubunun ortalama olacaktır 'ler) ve tedavi grubunun ortalama ve kontrol ortalamaları arasındaki fark olacaktır grubudur. 0 β 1
Şimdi, bir ANOVA'nın sadece iki gruba sahip olmasının / çalıştırılmasının (bir t-testi daha yaygın olmasına rağmen) mükemmel olduğunu ve her üçünün de birbirine bağlı olduğunu unutmayın. Eğer 3 gruba sahip bir ANOVA'nız varsa, nasıl olacağını görmek isterseniz; şöyle olacaktır: sahip olduğunda dikkat grupları, sahip onları temsil etmek taklit kodlar. Referans grubu (tipik olarak kontrol grubu) herkes için 'a sahip olarak gösterilir.g g - 1 0 β 0 β 1 β 2
: Bu @ whuber en açıklamalar ışığında, bu da matris denklemleri ile temsil edilebilir
, temsil bu şekilde ve uzunluğu vektörlerdir ve , uzunluğunda bir vektördür . şimdi satırlı ve sütunlu bir matristir . Bir prototipik regresyonda sürekli değişkenine ve kesişimine sahipsiniz . Böylece, matrisiniz, her için bir tane olmak üzere, yan yana bir dizi sütun vektöründen oluşur.
Eğer bir ANOVA temsil ediyorlarsa bu şekilde gruplar, sahip olacaktır unutmayın olan bir gözlem ile gösterilen bir referans grubu ile grupları gösteren kukla değişkenler her yapay değişkendeki 's. Yukarıdaki gibi, yine de bir engeliniz olurdu. Böylece, .
Hepsi genel doğrusal modelin özel durumları olarak yazılabilir.
T-testi iki örneklemeli bir ANOVA örneğidir. T-testi istatistiklerini karelerseniz, ANOVA'ya karşılık gelen alırsınız .
Bir ANOVA modeli temelde faktör seviyelerinin kukla (veya gösterge ) değişkenleri ile temsil edildiği bir regresyon modelidir .
Bu nedenle, bir t testi için model ANOVA modelinin bir alt kümesiyse ve ANOVA çoklu regresyon modelinin bir alt kümesiyse, regresyonun kendisi (ve regresyonun dışındaki diğer şeyler), regresyonun genel bir gerilemeye uzanan genel doğrusal modelinin bir alt kümesidir. Hata teriminin genel regresyon durumundan ('bağımsız' ve 'eşit sapma' olan) ve çok değişkenli daha genel özellikleri .
Burada, sıradan (eşit varyans) denkliğini iki sample- gösteren bir örnek R yapılan analizi ve bir regresyon modelinde bir hipotez testi, (gerçek veri eşleştirilmesi için bakır, bu gerçekten uygun bir analiz değildir) :
> t.test(extra ~ group, var.equal=TRUE, data = sleep)
Two Sample t-test
data: extra by group
t = -1.8608, df = 18, p-value = 0.07919
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.363874 0.203874
sample estimates:
mean in group 1 mean in group 2
0.75 2.33
Yukarıdaki 0,079 değerine dikkat edin. İşte tek yönlü anova:
> summary(aov(extra~group,sleep))
Df Sum Sq Mean Sq F value Pr(>F)
group 1 12.48 12.482 3.463 0.0792
Residuals 18 64.89 3.605
Şimdi regresyon için:
> summary(lm(extra ~ group, data = sleep))
(bazı çıktılar kaldırıldı)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.7500 0.6004 1.249 0.2276
group2 1.5800 0.8491 1.861 0.0792 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.899 on 18 degrees of freedom
Multiple R-squared: 0.1613, Adjusted R-squared: 0.1147
F-statistic: 3.463 on 1 and 18 DF, p-value: 0.07919
'Group2' satırındaki p değerini ve son satırdaki F testi için p değerini karşılaştırın. İki kuyruklu bir test için bunlar aynıdır ve her ikisi de t testi sonucuyla eşleşir.
Ayrıca, 'grup2' katsayısı, iki grup için ortalama farkı temsil eder.
Daha önce gönderdiğim bu cevap biraz alakalı, ancak bu soru biraz farklı.
Aşağıdaki doğrusal modeller arasındaki farkları ve benzerlikleri düşünmek isteyebilirsiniz:
Anova, tedaviler arasında bilinmeyen ancak eşit varyans varsayımı altında araçların eşitliği için bir t testine benzer. Bunun nedeni ANOVA'da MSE'nin t-testinde kullanılan havuzlanmış varyans ile aynı olmasıdır. Eşit olmayan varyanslar için bir tane ve çift yönlü t-testi gibi başka t-test versiyonları da vardır. Bu açıdan, t-testi daha esnek olabilir.