Regresyon ve ANOVA tutarsızlığı (aov - R'de lm)


21

Her zaman regresyonun ANOVA'nın daha genel bir formu olduğu ve sonuçların aynı olacağı izlenimindeydim. Ancak son zamanlarda, aynı veriler üzerinde hem regresyon hem de ANOVA kullandım ve sonuçlar önemli ölçüde farklılık gösteriyor. Yani, regresyon modelinde hem ana etkiler hem de etkileşim önemlidir, ANOVA'da ise bir ana etki anlamlı değildir. Bunun etkileşimle bir ilgisi olmasını bekliyorum, ancak aynı soruyu modellemenin bu iki yolunda neyin farklı olduğu benim için net değil. Önemliyse, bir tahmin cihazı kategorik, diğeri ise aşağıdaki benzetimde belirtildiği gibi süreklidir.

Verilerimin neye benzediğini ve hangi analizleri yaptığımı gösteren bir örnek, ancak sonuçlarda aynı p-değerleri veya etkileri önemli değil (gerçek sonuçlarım yukarıda özetlenmiştir):

group<-c(1,1,1,0,0,0)
moderator<-c(1,2,3,4,5,6)
score<-c(6,3,8,5,7,4)

summary(lm(score~group*moderator))
summary(aov(score~group*moderator))

özeti (lm ()) burada belirtim yokluğunda tedavi zıtlıkları olan, belirttiğiniz karşıtlıklar için katsayıları veriyor. Özet olarak (aov ()) size anova masası veriyor. Lm modeli için anova istiyorsanız, anova'ya ihtiyacınız var (lm ())
Matt Albrecht

groupSayısal bir vektördür, bilerek mi? Normalde, gruplandırma faktörleri sınıfa sahip olmalıdır factor, öyle ki kontrastlara dönüşüm gibi fonksiyonlar tarafından otomatik olarak idare edilebilir lm(). İkiden fazla grubunuz olduğunda veya groupdeğişkeniniz için 0 / 1'den farklı bir kodlama kullandığınızda, bu daha belirgin hale gelecektir .
caracal

Yanıtlar:


17

summaryİşlev nesnesinin sınıfına bağlı olarak farklı yöntemler çağırır. Fark, aovrakiplerde lmdeğil, modeller hakkında sunulan bilgilerdedir. Örneğin, kullandıysanız anova(mod1)ve anova(mod2)bunun yerine, aynı sonuçları almalısınız.

@Glen'in dediği gibi, temel olarak rapor edilen testlerin Tip 1 veya Tip 3 toplam karelere göre olup olmadığıdır. Açıklayıcı değişkenleriniz arasındaki korelasyon tam olarak 0 olmadığında bunlar farklı olacaktır. Korelasyon yapıldığında, bazı SS'ler bir tahminciye ve bazıları diğerine özgüdür, ancak bazı SS'ler ikisine veya ikisine atfedilebilir. ( MasterCard sembolünü hayal ederek bunu görselleştirebilirsiniz.- merkezde küçük bir üst üste binme bölgesi var.) Bu durumda benzersiz bir cevap yok ve ne yazık ki, bu deneysel olmayan veriler için norm. Bir yaklaşım analistin yargılarını kullanması ve örtüşen SS'yi değişkenlerden birine devretmesidir. Bu değişken ilk önce modele girer. Diğer değişken ikinci modele girer ve bir ısırıktan çıkmış bir kurabiye gibi görünen SS'yi alır. Etkisi bazen adı verilen şey ile test edilebilir.R,2değiştir veya F değiştir. Bu yaklaşım Tip 1 SS kullanır. Alternatif olarak, bunu ilk önce her girişte iki kez yapabilir ve her iki tahminci için F değişim testini rapor edebilirsiniz. Bu şekilde, hiçbir değişken örtüşme nedeniyle SS'yi alamaz. Bu yaklaşım Tip 3 SS kullanır. (Ayrıca, ikinci yaklaşımın önemsenmediğini söyleyeyim)

Aşağıdaki yorumda @ BrettMagill'in önerisini takiben, bunu biraz daha netleştirmeye çalışabilirim. (Benim örneğimde, sadece 2 öngörücü kullanıyorum ve etkileşime girmediğimi unutmayın, ancak bu fikir ne istersen içerecek şekilde ölçeklendirilebilir.)

Tip 1: SS (A) ve SS (B | A)

Tip 3: SS (A | B) ve SS (B | A)


1
Bu, sorunun güzel bir açıklaması. Metni bununla biraz netleştirebilirsiniz: Tip I: SS_A = SS (A) SS_B = SS (B | A) ve SS_AB = SS (AB | B, A) Tip III: SS_A = SS (A | B, AB ) ve SS_B = SS (B | A, AB) ve SS_AB = SS (AB | A, B)
Brett

1
Yardımın için çok teşekkür ederim. Şimdi bu modellerin nasıl farklı olduğu ile ilgili neler olduğunu anlıyorum, ancak ne zaman bir anova veya regresyon modeli kullanmanın uygun olacağı konusunda hala net değilim. Danışmanım anova'ya danışmanlık yapıyor, ancak her zaman regresyon kullanmam öğretildi ve sonuçlar farklı olduğunda hangisinin daha uygun olacağından emin değilim. Ne zaman uygun olacağı konusunda tavsiyede bulunacak bir örneğiniz veya kaynağınız var mı? Yardımın için tekrar teşekkürler.
Rebecca,

1
Üzgünüm, tam olarak takip etmiyorum. Demek istediğim, modellerin aslında farklı olmadığı . Bir ANOVA tüm kalitatif yordayıcılara sahip bir regresyondur. Sürekli ve kalitatif yordayıcılara sahip bir regresyon modeliniz varsa ve önce sürekli yordayıcıya girerseniz, o zaman niteliksel yordayıcılar (ancak etkileşim terimi olmadan) ANCOVA'dır. Her iki yaklaşım da iyidir, çünkü 'perde arkasında' aynıdır. Genelde bunu bir regresyon olarak kodlarım, ancak bu bir stil meselesidir. OTOH, danışmanınız ANOVA tarzında çalışmasını istiyorsa, o zaman bir rota farkı yoktur.
dediklerinin - Eski Monica

2
Birkaç şey: (3 yukarı) bir etkileşim, bağımsız değişkenlerinizin korele olduğu anlamına gelmez, bunlar sadece farklı şeylerdir; (2 yukarı) eğer model 3 model 2'den önemli ölçüde daha iyiyse, evet, bu etkileşimin anlamlı olduğunu gösterir (çünkü etkileşim aralarında farklı olan tek şeydir); (1 yukarı) Çalışmanızı daha sonraki doğrulayıcı bir çalışmayı planlamak için kullanacağınız bir pilot olarak düşünmüyorsanız, önemli etkiler için sadece balık tutmaktan kaçınmak istiyorsunuz; Bu çalışmayı üçüne de bakmak için koştum, bu nedenle model 3 ile devam edin.
gung - Reinstate Monica

2
Ek olarak, bir etkileşim temel etkileri yorumlamamanız gerektiği anlamına gelir, bu nedenle sadece model 1'i sunmak tehlikeli yanıltıcı olabilir. SS türleri hakkında daha fazla bilgi istiyorsanız, buraya oldukça kapsamlı bir cevap yazdım: stats.stackexchange.com/questions/20452/… Ayrıca, cevapların birini, bir noktada, yanındaki onay işaretini tıklayarak kabul etmelisiniz. onlardan biri.
gung - Monica

10

Aov çıktısından elde edilen sonuçlar size Tip 1 toplam karelere göre olasılıklar veriyor. Bu nedenle etkileşim sonucu aynıdır ve ana etkiler farklılık gösterir.

Tip 3 karelerinin toplamını temel alarak olasılık kullanırsanız, bunlar doğrusal regresyon sonuçlarıyla eşleşecektir.

library(car)
Anova(aov(score~group*moderator),type=3)

5
Modeller aynı hipotezleri test ederken ve faktörlerin parametrelendirilmesinin eşdeğer olduğu durumlarda doğrusal modeller ve ANOVA eşdeğer olacaktır. "Tip I" ve "Tip III" toplamları karelerdir, farklı temel hipotezlerin testleridir (sıralı kareler karelerinin marjinal kareler toplamına karşı etkisi). ANOVA, bu kararların birçoğunu birçok pakette uygulandığı gibi gizleme eğilimindedir - bu aslında GLM'deki faktör parametreleştirmesi ve model karşılaştırması yoluyla ilgi hipotezlerini oluşturmanın ve test etmenin daha iyi bir yaklaşım olduğuna inanıyor.
Brett

+1, sanırım bir yazım hatası var. lm Type 1 SS kullanıyor ve aov Type 3 SS kullanıyor.
dediklerinin - Eski Monica

2
Tip III (Marjinal) Kareler Toplamı lm olarak varsayılan olarak kullanılır. AOV varsayılan olarak Tip I (Sıralı) kullanır. LM sonuçları sıralamaya göre değişmezken, aov sonuçları faktörlerin sırasına bağlıdır.
Brett

Hem lm hem de aov'un varsayılan olarak tip I kullandığını, dolayısıyla tip II ve III için büyük harf A Anova () kullanıldığını düşündüm.
Matt Albrecht

6
Genel olarak, Anova(..., type=3)edecek değil aynı zamanda sırasız faktörleri kodlayan etki (tedavi tezat gelen (R varsayılan) geçiş sürece, düzgün tip III SS vermek options(contrasts=c("contr.sum", "contr.poly"))) ya da başka bir toplamı sıfıra kontrast kodları (örneğin, helmert). Bu, dengesiz hücre boyutlarına ve ikiden fazla gruba sahip olduğunuzda ortaya çıkacak ve yardım sayfasında da belirtilecektir Anova().
caracal

-2

Doğrusal regresyon ve ANOVA arasındaki temel fark, ANOVA'da yordayıcı değişkenleri ayrıktır (farklı seviyelere sahiptirler). Doğrusal regresyonda, yordayıcı değişkenleri süreklidir.


3
Bu genel olarak doğru değildir.
Michael R. Chernick

İnternette bir yerde okudum. Anahtar farkı açıklar mısınız? Ben bir acemiyim.
vivek
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.