Ben hesaplıyor iddia iddia bir excel sayfası bakıyorum , ama bunu yapmanın bu şekilde tanımıyorum ve bir şey eksik olup olmadığını merak ediyordum.
İşte analiz ettiği veriler:
+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
| 2000 | 42 | 32.5 |
| 2000 | 42 | 32.5 |
| 2000 | 25 | 32.5 |
| 2000 | 21 | 32.5 |
+------------------+----------+----------+
Ki kare hesaplamak için her grup için yaptığı toplamlar:
P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B
Yani her grup için :
2.822793
2.822793
1.759359
4.136448
Ve toplam Ki Kare geçerli: 11.54139
.
Ancak, hesaplarken gördüğüm her örnek bundan tamamen farklıdır. Her grup için yapardım:
chiSq = (Observed-Expected)^2 / Expected
Ve bu nedenle yukarıdaki örnek için toplam ki kare değeri alacağım 11.3538
.
Benim sorum - excel sayfasında neden bu şekilde hesaplıyorlar ? Bu tanınmış bir yaklaşım mı?
GÜNCELLEME
Bunu bilmek istememin sebebi, bu sonuçları R dilinde tekrarlamaya çalışıyorum. Ben chisq.test işlevini kullanıyorum ve Excel sayfası ile aynı sayı ile çıkmıyor. Herkes R bu yaklaşımın nasıl yapılacağını biliyorsa çok yararlı olacaktır!
GÜNCELLEME 2
Herkes ilgilenen varsa, ben nasıl R hesapladı:
res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)
x=c(42,42,25,21);chisq.test(cbind(x,2000-x))