Bu soru açıkça R'de aov()
fonksiyon ile analiz edilen dengesiz iki yönlü bir tasarıma sahip bir çalışmadan geldi ; bu sayfada bu sorunun daha yeni ve ayrıntılı bir örneği verilmektedir.
Bu sorunun genel yanıtı, pek çok kişi için: "Ona bağlı." Burada tasarımın dengeli olup olmamasına ve değilse ANOVA'nın hangi lezzetinin seçildiğine bağlıdır.
İlk olarak, tasarımın dengeli olup olmamasına bağlıdır. Faktöriyel tasarımın tüm hücrelerinde eşit sayıda vaka ile mümkün olan tüm dünyaların en iyilerinde, ANOVA'nın nasıl yapıldığına bakılmaksızın faktörlerin modele girilme sırası nedeniyle hiçbir fark olmayacaktır. Açıkçası retrospektif bir klinik kohorttan, böyle bir dengenin bulunmadığı gerçek bir dünyadan gibi görünüyor. Yani düzen önemli olabilir .
İkincisi, ANOVA'nın nasıl yapıldığına bağlıdır, bu biraz tartışmalı bir konudur. Dengesiz tasarımlar için ANOVA türleri ana etkileri ve etkileşimleri değerlendirme sırasına göre farklılık gösterir. Etkileşimleri değerlendirmek iki yönlü ve yüksek dereceli ANOVA için esastır, bu nedenle en iyi yol hakkında anlaşmazlıklar vardır. Bir açıklama ve tartışma için bu Çapraz Doğrulanmış sayfaya bakın . Farklı bir görünüm için paketin kılavuzundakiAnova()
(büyük "A" ile) işlevinin Ayrıntılar ve Uyarısına bakın .car
Faktörlerin sırası yapar varsayılan altında dengesiz tasarımlarda madde aov()
denilen şeyin kullandığı tip-ı testleri R,. Bunlar, mevcut sorunun öngördüğü gibi, modele giriş sırasındaki faktörlere ardışık varyanslardır. Sıralama , R'deki paketteki Anova()
fonksiyon tarafından sağlanan tip-II veya tip-III testleri ile önemli değildir.car
Bununla birlikte, bu alternatiflerin yukarıdaki bağlantılarda belirtilen kendi potansiyel dezavantajları vardır.
Son olarak, lm()
etkileşim terimlerini eklerseniz esasen aynı model olan R'deki gibi çoklu doğrusal regresyon ile olan ilişkisini düşünün . Değişkenlerin giriş sırası, k düzeyinde bir kategorik faktörün (k-1) ikili kukla değişkenler olarak kodlandığı ve her bir kukla için bir regresyon katsayısının rapor edildiği lm()
regresyon katsayıları ve p -değerleri açısından önemli değildir. summary(lm())
.
Bununla birlikte, lm()
çıktıyı klasik ANOVA'da beklendiği gibi ( anova()
R stats
paketinden küçük harf "a," ile sarmak veya Anova()
her bir faktörün tüm seviyeleri üzerindeki etkisini özetlemek mümkündür. Sonra faktörlerin sıralaması olduğu anova()
gibi aov()
önemli olacak ve önemli olmayacaktır Anova()
. Benzer şekilde, hangi ANOVA türünün kullanılacağı konusundaki anlaşmazlıklar geri dönecektir. Bu nedenle, lm()
modellerin tüm aşağı yönlü kullanımlarında faktör girişinin sipariş bağımsızlığını varsaymak güvenli değildir .
* Tüm hücrelerde eşit sayıda gözlem olması yeterlidir, ancak anladığım kadarıyla, faktörlerin sırasının alakasız olması için gerekli değildir. Daha az talep edilen denge türleri siparişten bağımsızlığa izin verebilir.