ANOVA öğrenmek istiyorum. Algoritmanın nasıl çalıştığını (hangi hesaplamaların yapılması gerektiğini) ve neden işe yaradığını öğrenmeye başlamadan önce, öncelikle ANOVA ile hangi sorunu gerçekten çözdüğümüzü veya hangi cevabı cevaplamaya çalışacağımızı bilmek istiyorum. Başka bir deyişle: Girdi nedir ve algoritmanın çıktısı nedir?
Girdi olarak ne kullandığımızı anlıyorum. Bir dizi rakamımız var. Her sayı, bir veya daha fazla kategorik değişkenin ("faktörler" olarak da bilinir) değerleriyle birlikte gelir. Örneğin:
+------------+------------+-------+
| factor 1 | factor 2 | value |
+------------+------------+-------+
| "A" | "a" | 1.0 |
| "A" | "a" | 2.4 |
| "A" | "b" | 0.3 |
| "A" | "b" | 7.4 |
| "B" | "a" | 1.2 |
| "B" | "a" | 8.4 |
| "B" | "b" | 0.4 |
| "B" | "b" | 7.2 |
+------------+------------+-------+
ANOVA'nın faktörlerin değerlerin ortalaması üzerinde hiçbir etkisi olmadığını belirten sıfır hipotezinin p değerini hesapladığını söylemek doğru mu? Başka bir deyişle, yukarıda verilen verileri algoritmaya veriyoruz ve sonuç olarak sıfır hipotezinin p-değerini alıyoruz?
Durum buysa, p değerini hesaplamak için gerçekte hangi önlemi kullanırız? Örneğin, sıfır hipotezi M göz önüne alındığında, vakaların% 1'inde, tesadüfen (hatta daha da yüksek) şans kadar yüksek olabilir diyebiliriz. M nedir?
ANOVA'daki faktörleri ayrıca araştırmıyor muyuz? ANOVA, faktör_1'nin bir etkisi olduğunu ancak faktör_2'nin olmadığını söyleyebilir mi? ANOVA, "A", "B" ve "C" değerine karşılık gelen belirli bir faktör değeri için istatistiksel olarak ayırt edilemez (örneğin aynı ortama sahip) ancak "D" değerinin bir etkisi olduğunu söyleyebilir mi?