Her biri binom dağılımlı üç veri grubum var (yani, her bir grupta başarılı veya başarısız olan öğeler var). Öngörülen bir başarı olasılığım yok, ancak bunun yerine her birinin başarı oranına gerçek başarı oranı için bir yaklaşım olarak dayanabilir. Bu soruyu sadece buldum , bu çok yakın ancak bu senaryo ile tam olarak ilgilenmiyor gibi görünüyor.
Testi basitleştirmek için 2 grubum olduğunu varsayalım (bu temel durumdan 3 tanesi uzatılabilir).
- Grup 1 denemeleri: = 2455
- Grup 2 denemeleri: = 2730
- Grup 1 başarısı: = 1556
- 2. Grup başarısı: = 1671
Beklenen bir başarı olasılığım yok, sadece örneklerden bildiğim kadarıyla. Yani iki grup için ima ettiğim başarı oranı:
- Grup 1 başarı oranı: = 1556/2455 =% 63,4
- Grup 2 başarı oranı: = 1671/2730 =% 61,2
Numunelerin her birinin başarı oranı oldukça yakın. Ancak örneklem büyüklüğüm de oldukça büyük. Eğer ilkinden ne kadar farklı olduğunu görmek için binom dağılımının CDF'sini kontrol edersem (ilkini null testi olarak kabul ediyorum) ikincinin elde edilebileceği konusunda çok küçük bir olasılık elde ederim.
Excel'de:
1-BINOM.DIST (1556,2455,61.2,% TRUE) = 0,012
Ancak, bu ilk sonucun herhangi bir varyansını dikkate almaz, sadece ilk sonucun test olasılığı olduğunu varsayar.
Bu iki veri örneğinin aslında istatistiki olarak birbirinden farklı olup olmadığını test etmenin daha iyi bir yolu var mı?
prop.test
: prop.test(c(1556, 1671), c(2455, 2730))
.