Birincil sorum, bir Tip I (sıralı) ANOVA yürütürken çıktının (katsayılar, F, P) nasıl yorumlanacağıdır?
Özel araştırma problemim biraz daha karmaşık, bu yüzden örneğimi parçalara ayıracağım. Öncelikle, örümcek yoğunluğunun (X1) bitki büyümesi (Y1) üzerindeki etkisiyle ilgileniyorsam ve fideleri muhafazalara yerleştirdim ve örümcek yoğunluğunu değiştirdim, sonra verileri basit bir ANOVA veya lineer regresyon ile analiz edebilirim. O zaman ANOVA'm için Tip I, II veya III Kareler Toplamı (SS) kullanmamın bir önemi olmazdı. Benim durumumda, 5 yoğunluk seviyesinin 4 kopyası var, bu yüzden yoğunluğu bir faktör olarak ya da sürekli bir değişken olarak kullanabilirim. Bu durumda, onu sürekli bağımsız (yordayıcı) bir değişken olarak yorumlamayı tercih ederim. RI'de aşağıdakileri çalıştırabilir:
lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)
Anova işlevini çalıştırmak, daha sonra umarım karşılaştırma yapmak için anlamlı olacaktır, bu yüzden lütfen burada garipliğini göz ardı edin. Çıktı:
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4279 0.08058 .
Residuals 18 2.53920 0.14107
Şimdi, toprakta kontrol edemediğim inorganik azotun başlangıç seviyesinin bitki büyümesini de önemli ölçüde etkilemiş olabileceğinden şüpheliyim diyelim. Bu etkiyle özellikle ilgilenmiyorum ama neden olabileceği çeşitliliği potansiyel olarak hesaba katmak istiyorum. Gerçekten, birincil ilgi alanım örümcek yoğunluğunun etkilerine (hipotez: artan örümcek yoğunluğunun artması bitkilerin büyümesine neden oluyor - muhtemelen otçul böceklerin azaltılmasıyla ama sadece etkiyi denemiyorum). İnorganik N'nin etkisini analizime ekleyebilirim.
Sorumum uğruna, inorganicN etkileşim yoğunluğunu * test ettiğimi ve önemsiz olduğunu iddia edelim, analizden çıkardım ve aşağıdaki ana etkileri yürüttüm:
> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4113 0.08223 .
inorganicN 1 0.12936 0.12936 0.9126 0.35282
Residuals 17 2.40983 0.14175
Şimdi, Tip I veya Tip II SS kullanıp kullanmamam fark yaratıyor (bazılarının Tip I ve II vb. Terimlerine itiraz ettiğini biliyorum, ancak SAS'ın popülaritesi göz önüne alındığında kolay anlaşılır). Anova {stats}, varsayılan olarak Tip I kullanır. Ana etkilerin sırasını tersine çevirerek yoğunluk için II SS, F ve P tipini hesaplayabilir veya Dr. John Fox'un "araba" paketini (uygulamalı regresyona eşlik eden) kullanabilirim. İkinci yöntemi tercih ederim çünkü daha karmaşık problemler için daha kolay.
library(car)
Anova(lm2)
Sum Sq Df F value Pr(>F)
density 0.58425 1 4.1216 0.05829 .
inorganicN 0.12936 1 0.9126 0.35282
Residuals 2.40983 17
Benim anlayışım, tip II hipotezlerinin "x1'in (sabit tutma? X2) 'nin etkisi göz önüne alındığında y1 üzerinde doğrusal bir etkisi olmadığı" ve x1'de verilen x2 için aynı olacağıdır. Sanırım burası kafamın karıştığı yer. ANOVA tarafından yukarıdaki tip I (sıralı) yöntem kullanılarak tip II yöntem kullanılarak yapılan hipoteze kıyasla test edilen hipotez nedir?
Gerçekte, verilerim biraz daha karmaşık, çünkü çok sayıda bitki gelişimi ölçüsünü, besin dinamiklerini ve çöp ayrışmasını ölçtüm. Gerçek analizim şöyle bir şey:
Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
density 1 0.34397 1 5 12 0.34269
nitrate 1 0.99994 40337 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)
Df Pillai approx F num Df den Df Pr(>F)
density 1 0.99950 4762 5 12 < 2e-16 ***
nitrate 1 0.99995 46248 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
Residuals 16