ANOVA ile ilk kez 1978'de Oxford'da yüksek lisans öğrencisiyken karşılaştım. Modern yaklaşımlar, çoklu regresyon modelinde sürekli ve kategorik değişkenleri birlikte öğreterek, genç istatistikçilerin neler olup bittiğini anlamasını zorlaştırıyor. Böylece daha basit zamanlara geri dönmek faydalı olabilir.
Orijinal formunda, ANOVA aritmetik bir alıştırmadır, böylece toplam kareler toplamı, tedaviler, bloklar, etkileşimler vb. İle ilişkili parçalara ayırırsınız. Dengeli bir ortamda, sezgisel anlamı olan karelerin toplamları (SSB ve SST gibi), ayarlanan toplam karelerin toplamına eklenir. Bütün bunlar Cochran Teoremi sayesinde işe yarar . Cochran'ı kullanarak, bu terimlerin beklenen değerlerini her zamanki boş hipotezler altında hesaplayabilir ve F istatistikleri oradan akabilir.
Bonus olarak, Cochran ve karelerin toplamlarını düşünmeye başladığınızda, dik kontrastları kullanarak tedavi toplam karelerinizi dilimlemeye ve küp küp doğramaya devam etmek mantıklıdır. ANOVA tablosundaki her girişin istatistikçilere yönelik bir yorumu olmalı ve test edilebilir bir hipotez vermelidir.
Geçenlerde MOM ve ML yöntemleri arasındaki farkın ortaya çıktığı bir cevap yazdım . Soru rastgele etki modellerinin tahmin edilmesine neden oldu. Bu noktada, geleneksel ANOVA yaklaşımı, şirketi maksimum olasılık tahmini ile tamamen parçalamaktadır ve etki tahminleri artık aynı değildir. Tasarım dengesiz olduğunda, aynı F istatistiklerini de almazsınız.
σ2pσ2σ2+nσ2pnσ2b^. ANOVA, rastgele etki varyansı için bir moment tahmincisi yöntemi verir. Şimdi, karışık efekt modelleri ile bu tür problemleri çözme eğilimindeyiz ve varyans bileşenleri maksimum olasılık tahmini veya REML ile elde edilmektedir.
Bu şekilde ANOVA, bir moment prosedürü yöntemi değildir. Karelerin toplamını (veya daha genel olarak, yanıtın ikinci dereceden bir biçimini) anlamlı hipotezler veren bileşenlere ayırmaya başlar. Karelerin toplamının F testlerinin çalışması için ki kare dağılımlarına sahip olmasını istediğimizden, bu normalliğe bağlıdır.
Maksimum olabilirlik çerçevesi daha geneldir ve karelerin toplamının geçerli olmadığı genelleştirilmiş doğrusal modeller gibi durumlar için geçerlidir. Bazı yazılımlar (R gibi), asovatotik ki-kare dağılımları ile olasılık oran testlerine anova yöntemleri belirterek karışıklığı davet eder. Biri, "anova" teriminin kullanımını haklı çıkarabilir, ancak kesinlikle, arkasındaki teori farklıdır.