Acil tabloların Bayes analizi: Etki büyüklüğü nasıl tanımlanır?


9

Kruschke's Doing Bayesian Veri Analizi , özellikle de Poisson üstel ANOVA örnekleri üzerinden çalışıyorum . 22, ki bu sıklık tabloları için sık sık ki-kare bağımsızlık testlerine bir alternatif olarak sunmaktadır.

Değişkenler bağımsız olsaydı (HDI sıfırı hariç tuttuğunda) beklenenden daha fazla veya daha az gerçekleşen etkileşimler hakkında nasıl bilgi aldığımızı görebilirim.

Benim sorum, bu çerçevede bir etki büyüklüğünü nasıl hesaplayabilir veya yorumlayabilirim ? Örneğin, Kruschke "mavi renklerin siyah saçlı birleşimi, göz rengi ve saç rengi bağımsız olsaydı beklenenden daha az gerçekleşir" yazıyor, ancak bu ilişkinin gücünü nasıl tanımlayabiliriz? Hangi etkileşimlerin diğerlerinden daha aşırı olduğunu nasıl anlayabilirim? Bu verilerin ki-kare testini yapsaydık, Cramér'in V'sini genel etki büyüklüğünün bir ölçüsü olarak hesaplayabiliriz. Bu Bayes bağlamında efekt boyutunu nasıl ifade edebilirim?

İşte kitabın kendine yeten örneği (kodlanmış R), tam da cevabın benden gizlenmiş olması durumunda ...

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

Efekt boyutu ölçülerine sahip (kitapta değil) sıkça verilen çıktı:

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

İşte HDI'ler ve hücre olasılıkları olan Bayesian çıktısı (doğrudan kitaptan):

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

Ve burada verilere uygulanan Poisson üstel modelinin posteriorunun grafikleri:

resim açıklamasını buraya girin

Ve tahmini hücre olasılıkları üzerindeki posterior dağılımın grafikleri:

resim açıklamasını buraya girin

Yanıtlar:


1

Endeks başına, Kruschke sadece etki büyüklüğünden iki kez bahsetmektedir ve her iki zaman da bir metrik öngörülen değişken bağlamındadır. Ama p üzerinde bu bit var. 601:

Araştırmacı bağımsızlık ihlallerine ilgi duyuyorsa, ilgi büyüklüğündedir . Model özellikle bu amaç için uygundur, çünkü bağımsızlığın nerede ortaya çıktığını belirlemek için keyfi etkileşim zıtlıkları araştırılabilir.βrc

Yani, yorumlanacak parametre olduğunu düşünüyorum. Let hariç tüm katsayı ürünleri ve bunların karşılık gelen X elemanlarının toplamına eşit ve . Yana ve . Tüm = 1 ise, bir faktör ile büyür veya küçülür , bir?β1,2Sβ1,2x1,2yiPois(λi)λi=eβ1,2x1,2+S=eβ1,2x1,2eSx1,2λieβ1,2


1

ANOVA modelinde etki büyüklüğünü incelemenin bir yolu "süper popülasyon" ve "sonlu popülasyon" standart sapmalarına bakmaktır. İki yönlü tablonuz var, bu yüzden bu 3 varyans bileşenidir (2 ana efekt ve 1 etkileşim). Bu mcmc analizine dayanmaktadır. Her mcmc örneği için her efekt için standart sapmayı hesaplarsınız.

sk=1dk1j=1dk(βk,jβ¯k)2

Burada ANOVA tablosunun "satırını" indeksler. vs mcmc örneklerinin basit kutu grafikleri efekt boyutları konusunda oldukça öğreticidir.kskk

Andrew Gelman bu yaklaşımı savundu. 2005 tarihli "varyans analizi: neden her zamankinden daha önemli" makalesine bakın.


Bu makale burada mevcut .
Sean Easter

Bu cevapların her ikisi de çok umut verici görünüyor, teşekkürler. Her ikiniz de Rnasıl programlanabileceğini gösterecek kadar aşina mısınız ?
Ben

@seaneaster - bağlantıyı eklediğiniz için teşekkürler. @ben, bu hesaplamalar R'de basittir. Ancak örneklerinizin hangi formda olduğunu bilmiyorum. sd ()"Uygula" işlevlerinden biriyle birlikte kullanabilmeniz gerekir . Kutu grafiklerine gelince, bunlar basit olanları almak için basittir boxplot ().
olasılık

Teşekkürler, sorumdaki örnek veri ve kodu kullanarak gösterebilir misiniz?
Ben

Kısacası, hayır, çünkü gönderdiğin kodu anlamıyorum - verinin nasıl düzenlendiğini göremiyorum. Dediğim gibi, bu kendiniz için zor bir analiz değil. Bu yaklaşım basit bir ölçüyü hesaplamaktadır (standart sapma). Ek olarak, R kodlaması sorunuzun bir parçası değildir - beklenmedik durum tablosu analizini nasıl özetleyeceğinizi sordunuz.
olasılık
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.