R: Anova ve Doğrusal Regresyon


9

İstatistiklerde yeniyim ve ANOVA ile doğrusal regresyon arasındaki farkı anlamaya çalışıyorum. Bunu keşfetmek için R kullanıyorum. ANOVA ve regresyonun neden farklı ama yine de aynı olduğu ve nasıl görselleştirilebileceği vb. İle ilgili çeşitli makaleler okudum. Bence güzelim ama bir parça hala eksik.

ANOVA'nın test edilen gruplardan herhangi biri arasında fark olup olmadığını belirlemek için gruplar içindeki varyansı gruplar arasındaki varyansla karşılaştırdığını anlıyorum. ( https://controls.engin.umich.edu/wiki/index.php/Factor_analysis_and_ANOVA )

Doğrusal regresyon için, bu forumda b (eğim) = 0 olup olmadığını test ettiğimizde aynı şeyin test edilebileceğini söyleyen bir yazı buldum. ( ANOVA neden doğrusal regresyona kıyasla farklı bir araştırma metodolojisi gibi öğretiliyor / kullanılıyor? )

İkiden fazla grup için şunları belirten bir web sitesi buldum:

Boş hipotez: H0:µ1=µ2=µ3

Doğrusal regresyon modeli: y=b0+b1X1+b2X2+e

Bununla birlikte, doğrusal regresyonun çıktısı, bir grup için kesişme ve diğer iki grup için bu kesişme farkıdır. ( http://www.real-statistics.com/multiple-regression/anova-using-regression/ )

Benim için, bu aslında kesişmelerin değil kesişmelerin karşılaştırıldığı gibi mi görünüyor?

Eğimler yerine kesişimleri karşılaştırdıkları başka bir örnek burada bulunabilir: ( http://www.theanalysisfactor.com/why-anova-and-linear-regression-are-the-same-analysis/ )

Şimdi lineer regresyonda gerçekte nelerin karşılaştırıldığını anlamak için uğraşıyorum? yamaçlar, kesişmeler veya her ikisi mi?


Yanıtlar:


16

Bu aslında kesişmelerin değil kesişmelerin karşılaştırıldığı gibi mi görünüyor?

Oradaki karışıklığınız, hangi kesişim ve eğimler (neyin kesişim? Neyin eğimi?) Demek istediğiniz konusunda net olmanız için çok dikkatli olmanız gerektiği gerçeğiyle ilgilidir.

Bir regresyonunda bir 0-1 kukla bir katsayı rolü bir yamaç olarak hem de düşünülebilir ve kesicilerimizden bir fark olarak.

İki örnekli bir durumu düşünerek işleri mümkün olduğunca basitleştirelim.

İki örnekle yine de tek yönlü ANOVA yapabiliriz, ancak aslında iki kuyruklu iki örnek t-testi (eşit varyans durumu) ile aynı olduğu ortaya çıkıyor.

İşte nüfus durumunun bir diyagramı:

regresyon, nüfus durumu olarak iki grup anlamına gelir

Eğer ardından modelin doğrusal nüfusuδ=μ2μ1

y=μ1+δx+e

böylece olduğunda (grup durum budur ), ortalaması ve olduğunda (grup ) , ortalama olan .x=0yμ1+δ×0=μ1x=1yμ1+δ×1=μ1+μ2μ1=μ2

Bu, eğimin katsayısıdır ( bu durumda ) ve araçlardaki fark (ve bu araçları müdahale olarak düşünebilirsiniz) aynı miktardır.δ

Somutluğa yardımcı olmak için iki örnek:

Group1:  9.5  9.8 11.8
Group2: 11.0 13.4 12.5 13.9

Nasıl görünuyorlar?

örnek arsa

Ortalamalardaki fark testi neye benziyor?

Bir t-testi olarak:

    Two Sample t-test

data:  values by group
t = -5.0375, df = 5, p-value = 0.003976
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -4.530882 -1.469118
sample estimates:
mean in group g1 mean in group g2 
             9.9             12.9 

Bir regresyon olarak:

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   9.9000     0.4502  21.991 3.61e-06 ***
groupg2       3.0000     0.5955   5.037  0.00398 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 0.7797 on 5 degrees of freedom
Multiple R-squared:  0.8354,    Adjusted R-squared:  0.8025 
F-statistic: 25.38 on 1 and 5 DF,  p-value: 0.003976

Regresyonda, kesişim teriminin grup 1 ortalaması ve grupg2 katsayısı ('eğim' katsayısı) grup ortalamalarındaki fark olduğunu görebiliriz. Bu arada regresyon için p değeri, t testi için p değeri ile aynıdır (0.003976)


Bu son derece yararlı örnek için çok teşekkür ederim. Sadece açık bir soru olduğunu fark ettim. Eğimin neden μ2 − μ1 olarak gösterildiğini anlamıyorum? Eğim m = delta Y / delta X olarak tanımlanmamış mı?
Paul

2
Öyle; ancak ve ve benzeri . Kısacası, 0/1 olarak kodladığınızda, eğim farktır. Δx=10=1Δy=(μ1+δ×1)(μ1+δ×0)=δ=μ2μ1Δy/Δx=(μ2μ1)/1=μ2μ1
Glen_b

+ 1 eğimin neden farklılığa eşit olduğuna dair grafik illüstrasyon bana çok yardımcı oldu!
Haitao Du
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.