Kruschke's Doing Bayesian Veri Analizi , özellikle de Poisson üstel ANOVA örnekleri üzerinden çalışıyorum . 22, ki bu sıklık tabloları için sık sık ki-kare bağımsızlık testlerine bir alternatif olarak sunmaktadır.
Değişkenler bağımsız olsaydı (HDI sıfırı hariç tuttuğunda) beklenenden daha fazla veya daha az gerçekleşen etkileşimler hakkında nasıl bilgi aldığımızı görebilirim.
Benim sorum, bu çerçevede bir etki büyüklüğünü nasıl hesaplayabilir veya yorumlayabilirim ? Örneğin, Kruschke "mavi renklerin siyah saçlı birleşimi, göz rengi ve saç rengi bağımsız olsaydı beklenenden daha az gerçekleşir" yazıyor, ancak bu ilişkinin gücünü nasıl tanımlayabiliriz? Hangi etkileşimlerin diğerlerinden daha aşırı olduğunu nasıl anlayabilirim? Bu verilerin ki-kare testini yapsaydık, Cramér'in V'sini genel etki büyüklüğünün bir ölçüsü olarak hesaplayabiliriz. Bu Bayes bağlamında efekt boyutunu nasıl ifade edebilirim?
İşte kitabın kendine yeten örneği (kodlanmış R
), tam da cevabın benden gizlenmiş olması durumunda ...
df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15,
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond",
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))
df
Blue Brown Green Hazel
Black 20 68 5 15
Blond 94 7 16 10
Brunette 84 119 29 54
Red 17 26 14 14
Efekt boyutu ölçülerine sahip (kitapta değil) sıkça verilen çıktı:
vcd::assocstats(df)
X^2 df P(> X^2)
Likelihood Ratio 146.44 9 0
Pearson 138.29 9 0
Phi-Coefficient : 0.483
Contingency Coeff.: 0.435
Cramer's V : 0.279
İşte HDI'ler ve hücre olasılıkları olan Bayesian çıktısı (doğrudan kitaptan):
# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R",
"http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")
# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))
# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))
Ve burada verilere uygulanan Poisson üstel modelinin posteriorunun grafikleri:
Ve tahmini hücre olasılıkları üzerindeki posterior dağılımın grafikleri: