A. Agresti (2007), Kategorik Veri Analizine Giriş , 2. okuyorum . ve bu paragrafı (s.106, 4.2.1) doğru bir şekilde anladığımdan emin değilim (kolay olsa da):
Önceki bölümde horlama ve kalp hastalığı ile ilgili Tablo 3.1'de, her gece 30'u kalp hastalığı olan 254 kişi horlama bildirmiştir. Veri dosyası ikili verileri gruplandırdıysa, veri dosyasındaki bir satır, bu verileri 254 örnek boyutundan 30 kalp hastalığı vakası olarak raporlar. Veri dosyasında gruplanmamış ikili veriler varsa, veri dosyasındaki her satır bir Bu nedenle 30 satır, kalp hastalığı için bir 1 ve 224 satır, kalp hastalığı için 0 içerir. ML tahminleri ve SE değerleri her iki veri dosyası türü için aynıdır.
Bir grup çözülmemiş veriyi (1 bağımlı, 1 bağımsız) dönüştürmek, tüm bilgileri içermek için "bir satırdan" daha fazlasını gerektirir !?
Aşağıdaki örnekte (gerçekçi olmayan!) Basit bir veri kümesi oluşturulur ve lojistik regresyon modeli oluşturulur.
Gruplanmış veriler gerçekte nasıl görünürdü (değişken sekme?)? Aynı model gruplandırılmış veriler kullanılarak nasıl oluşturulabilir?
> dat = data.frame(y=c(0,1,0,1,0), x=c(1,1,0,0,0))
> dat
y x
1 0 1
2 1 1
3 0 0
4 1 0
5 0 0
> tab=table(dat)
> tab
x
y 0 1
0 2 1
1 1 1
> mod1=glm(y~x, data=dat, family=binomial())