ANOVA'daki değişkenlerin sırası önemlidir, değil mi?


20

Çok faktörlü bir ANOVA'da değişkenlerin hangi sırayla belirtildiğinin bir fark yarattığını ancak çoklu doğrusal regresyon yaparken sıralamanın önemli olmadığını anlamak doğru muyum?

Böylece ölçülen kan kaybı y ve iki kategorik değişken gibi bir sonuç varsayarsak

  1. adenoidektomi yöntemi a ,
  2. tonsillektomi yöntemi b .

Model y~a+b, modelden farklıdır y~b+a(veya R'deki uygulamamın gösterdiği görülmektedir).

Buradaki terimin ANOVA'nın hiyerarşik bir model olduğunu anlamak için doğru muyum, çünkü ikinci faktöre artık varyansı atfetmeye çalışmadan önce ilk faktöre olabildiğince çok varyans atfediyor mu?

Yukarıdaki örnekte hiyerarşi mantıklıdır çünkü tonsillektomi yapmadan önce her zaman ilk olarak adenoidektomiyi yapıyorum, ancak içsel sırada olmayan iki değişken olsaydı ne olurdu?


12
ANOVA'larda, dengesiz tasarımlarla, yani eşit olmayan hücre boyutları olduğunda düzen önemlidir. Bu konu genellikle "karelerin toplamı türleri" başlığı altında ele alınır. Bkz epm.sagepub.com/content/38/3/621.full.pdf+html ve CHL cevabı stats.stackexchange.com/questions/11209/...
caracal


Konuyla ilgili başka bir ışık tutacağını ümit ederek daha eski bir tartışmamı genişlettim. Elbette hala çalışmaya ihtiyaç duyuyor ve muhtemelen birisinin düzenlemeye yardımcı olacak sinirleri var. Şimdiye kadar sahip olduğum şey : go.helms-net.de/stat/div/%28SSE%29%20ANovaRegression_SPSS_R.htm Muhtemelen burada bu sorunun açıklayıcı bir cevabına çıkma potansiyeli ile ilginç bir şey var.
Gottfried Helms

Yanıtlar:


17

Bu soru açıkça R'de aov()fonksiyon ile analiz edilen dengesiz iki yönlü bir tasarıma sahip bir çalışmadan geldi ; bu sayfada bu sorunun daha yeni ve ayrıntılı bir örneği verilmektedir.

Bu sorunun genel yanıtı, pek çok kişi için: "Ona bağlı." Burada tasarımın dengeli olup olmamasına ve değilse ANOVA'nın hangi lezzetinin seçildiğine bağlıdır.

İlk olarak, tasarımın dengeli olup olmamasına bağlıdır. Faktöriyel tasarımın tüm hücrelerinde eşit sayıda vaka ile mümkün olan tüm dünyaların en iyilerinde, ANOVA'nın nasıl yapıldığına bakılmaksızın faktörlerin modele girilme sırası nedeniyle hiçbir fark olmayacaktır. Açıkçası retrospektif bir klinik kohorttan, böyle bir dengenin bulunmadığı gerçek bir dünyadan gibi görünüyor. Yani düzen önemli olabilir .

İkincisi, ANOVA'nın nasıl yapıldığına bağlıdır, bu biraz tartışmalı bir konudur. Dengesiz tasarımlar için ANOVA türleri ana etkileri ve etkileşimleri değerlendirme sırasına göre farklılık gösterir. Etkileşimleri değerlendirmek iki yönlü ve yüksek dereceli ANOVA için esastır, bu nedenle en iyi yol hakkında anlaşmazlıklar vardır. Bir açıklama ve tartışma için bu Çapraz Doğrulanmış sayfaya bakın . Farklı bir görünüm için paketin kılavuzundakiAnova() (büyük "A" ile) işlevinin Ayrıntılar ve Uyarısına bakın .car

Faktörlerin sırası yapar varsayılan altında dengesiz tasarımlarda madde aov()denilen şeyin kullandığı tip-ı testleri R,. Bunlar, mevcut sorunun öngördüğü gibi, modele giriş sırasındaki faktörlere ardışık varyanslardır. Sıralama , R'deki paketteki Anova()fonksiyon tarafından sağlanan tip-II veya tip-III testleri ile önemli değildir.car Bununla birlikte, bu alternatiflerin yukarıdaki bağlantılarda belirtilen kendi potansiyel dezavantajları vardır.

Son olarak, lm()etkileşim terimlerini eklerseniz esasen aynı model olan R'deki gibi çoklu doğrusal regresyon ile olan ilişkisini düşünün . Değişkenlerin giriş sırası, k düzeyinde bir kategorik faktörün (k-1) ikili kukla değişkenler olarak kodlandığı ve her bir kukla için bir regresyon katsayısının rapor edildiği lm()regresyon katsayıları ve p -değerleri açısından önemli değildir. summary(lm()).

Bununla birlikte, lm()çıktıyı klasik ANOVA'da beklendiği gibi ( anova()R statspaketinden küçük harf "a," ile sarmak veya Anova()her bir faktörün tüm seviyeleri üzerindeki etkisini özetlemek mümkündür. Sonra faktörlerin sıralaması olduğu anova()gibi aov()önemli olacak ve önemli olmayacaktır Anova(). Benzer şekilde, hangi ANOVA türünün kullanılacağı konusundaki anlaşmazlıklar geri dönecektir. Bu nedenle, lm()modellerin tüm aşağı yönlü kullanımlarında faktör girişinin sipariş bağımsızlığını varsaymak güvenli değildir .


* Tüm hücrelerde eşit sayıda gözlem olması yeterlidir, ancak anladığım kadarıyla, faktörlerin sırasının alakasız olması için gerekli değildir. Daha az talep edilen denge türleri siparişten bağımsızlığa izin verebilir.


Gerçekten de, gözlemsel veriler dengesizdi, çok dengesizdi.
Farrel

Umarım bu yorum hala bir cevap alır: Dengeli bir çalışma tasarımı altında, SS tahmininin, seçilen anova testi türüne (tip I, II, III) bakılmaksızın asla sıraya bağlı olmayacağını söylüyorsunuz. Bunu anladığımdan emin değilim. Dengeli verilere dayanarak doğrusal bir model üzerinde R'de 'anova' işlevini kullanarak (tip I testleri kullanır), kesinlikle özellik sırası önemlidir, değil mi?
PejoPhylo

1
@PejoPhylo veri dengelendiğinde dikey tasarım denen şeye sahip olabilirsiniz. Ortogonal bir tasarımla, karelerin toplamlarını tedaviler ve bunların etkileşimleri arasında bölmenin benzersiz bir yolu vardır, bu nedenle tedavilerin giriş sırası, etki tahminleri ve p-değerleri açısından önemli olmayacaktır. Bu sayfa matematiksel bir açıklama sağlar. Bu hemen belli değil; az önce bağlandığım soru bu sitenin en yüksek itibara sahip bir üyesi tarafından soruldu. Dengesiz veriler dikeyliği bozabilir.
EdM

Cevabınız için çok teşekkürler @EdM
PejoPhylo

0

Hiyerarşik model terimi, faktörler arasındaki yapıya karşılık gelir. Örneğin, çok merkezli bir çalışma hiyerarşiktir: Hastaları tedavi eden hastanelerin içine yerleştirmiş olursunuz. Her hastane plasebo ve verumu olan hastaları tedavi eder, ancak her birini A veya B hastanesinde almak, hastanenin tüm hastalarını yöneten bazı ortak etkileri nedeniyle biraz farklıdır (hatta deneysel ajan ile etkileşim etkisi olabilir). Buna hiyerarşik etki denir.

Şimdi ektomi yöntemleriniz hiyerarşik olabilir: Daha önce kullanılan adenoidektomi yöntemine bağlı olarak belirli bir tonsillektomi yönteminin biraz daha farklı olması (kendi içinde henüz etki altında değil, çünkü bu tahmin edeceğiniz ve test edeceğiniz şey) mantıklı mı? hasta? Evet ise, modelinizde belirtmeniz gerekir.

Y ~ a + b'nin y ~ b + a'dan farklı olabileceği gözleminiz yanlış bir şey olduğunu gösterir. Katkı efektleri işe gidip gelir, bu yüzden bir fark olmamalıdır (küçük sayısal farklılıklar dışında). Ameliyat yöntemlerinin etkisinin, daha sonra istatistikçinin etkileri belirleme sırasına bağlı olması ne mantıklıdır, ne de arzu edilmektedir. Yani muhtemelen Rverilerle beslemek için yanlış bir yaklaşım seçtiniz .


1
Son paragrafı takip ettiğimden emin değilim. Dengesiz faktöriyel ANOVA'da, Tip I (sıralı) kareler toplamı ile hesaplanan her bir faktör için p-değerleri kesinlikle faktörlerin sırasına bağlı olacaktır. Sorunun bütün mesele bu olduğuna inanıyorum.
amip, Reinstate Monica'nın

@Farrel'in Tip I SS'ye sahip olup olmadığından emin değilim. Bir keresinde SAS'ın veri seti ve model ifadesindeki bazı farklı sıralamalardan dolayı farklı Tip III SS çıkışını gözlemlediğini hatırlıyorum. Belki bu R ile de olabilir mi?
Horst Grünbusch

2
Bir gerçeği bilemiyorum ve Q'nun beş yıl önce sorulduğu göz önüne alındığında kendini hatırlamayabilir. Ama bu olduğunu düşünüyorum arayla "modeli y ~ a + b Model y farklıdır ~ b + (R benim uygulaması belirtmek görünüyor veya çok) bir" özellikle verilen bir gerçektir sözlerinin en cimri yorumlanması aovR'deki bu komut varsayılan olarak Tip I SS kullanır. Ödül teklif ettiğimde, dengesiz anova tasarımının arkasındaki sorunları, Tip I / II / III SS arasındaki farkları ve doğrusal regresyonun aynı sorunlara sahip olup olmadığını gösteren bazı cevaplar almayı bekledim.
amip, Reinstate Monica'nın

1
Hayır. SS I / II / III arasında bir fark olmadığında, tasarım matrisi dengelenmiş olsa bile anova'da tekildir. SS I / II / III sadece dengesiz durumda farklıdır, çünkü faktörler dikleşmez hale gelir (dengeli durumun aksine). Anladığım kadarıyla, bu çok yaygın bir durum olan ilişkili öngörücülerle doğrusal bir regresyona karşılık gelir. Benim cevabım, aynı sorunun regresyonda da ortaya çıkmasıdır, sadece diğer tüm öngörücülerin etkilerini hesapladıktan sonra bir öngörücünün p-değerini hesaplamak standarttır; bu anova'daki Tip III SS'ye karşılık gelir.
amip, Reinstate Monica'nın

1
ANOVA değişken sipariş hakkında tür sorular gibi gelmesini sağlayacak bu bir dün yığın taşması göç. Bu 5 yaşındaki sorunun benzer şekilde aovdeğil lmde dayanabileceğini varsaymanın güvenli olduğunu düşünüyorum ve 12 Mayıs 14:31 tarihli yorumda @amoeba'nın belirttiği türde bu soruya cevap vermek yararlı olacaktır. .
EdM
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.