2 X 3 masasında çoklu post-hoc ki-kare testleri nasıl yapılır?


9

Veri setim, toplam organizma ölümünü veya bir organizmanın kıyı, orta kanal ve açık deniz olmak üzere üç yer tipinde hayatta kalmasını içeriyor. Aşağıdaki tablodaki sayılar site sayısını temsil eder.

              100% Mortality            100% Survival
Inshore             30                       31 
Midchannel          10                       20 
Offshore             1                       10

% 100 mortalitenin meydana geldiği site sayısının site türüne göre önemli olup olmadığını bilmek istiyorum. 2 x 3 ki-kare çalıştırırsam önemli bir sonuç elde ederim. Çalıştırabileceğim bir post-hoc ikili karşılaştırma var mı yoksa binom dağılımı ile lojistik bir ANOVA veya regresyon mu kullanmalıyım? Teşekkürler!

Yanıtlar:


7

Bir beklenmedik durum tablosu, her iki eksende de birbirini dışlayan tüm kategorileri içermelidir. Kıyı / Midchannel / Offshore iyi görünüyor, ancak "% 100'den az ölüm oranı" bu biyolojik ortamda "% 100 hayatta kalma" anlamına gelmedikçe, gözlemlenen tüm durumları açıklayan tablolar oluşturmanız veya analizinizi neden aşırı sınırlandırdığınızı açıklamanız gerekebilir. numunenin uçları.

% 100 sağkalım% 0 mortalite anlamına geldiğinden,% 100 = mortalite /% 100> mortalite>% 0 / mortalite =% 0 sütunlu bir tablonuz olabilir. Bu durumda, artık yüzdeleri karşılaştırmazsınız, ancak üç site türü kategorisindeki sıra ölüm oranlarını karşılaştırırsınız. (Kategoriler yerine orijinal yüzde değerlerini kullanmaya ne dersiniz?) Burada, bağları uygun şekilde dikkate alan bir Kruskal-Wallis testi sürümü uygun olabilir (belki bir permütasyon testi).

Kruskal-Wallis testi için yerleşik post hoc testler vardır: 1 , 2, 3 . (Yeniden örnekleme yaklaşımı bağlarla mücadelede yardımcı olabilir.)

Lojistik regresyon ve binom regresyon, sadece p değerleri vermekle kalmaz, aynı zamanda etki boyutlarının yararlı tahminleri ve güven aralıkları da daha iyi olabilir. Ancak bu modelleri oluşturmak için% 100> ölüm oranı>% 0 alanlarıyla ilgili daha fazla ayrıntıya ihtiyaç duyulacaktır.


4

"% 100 hayatta kalma" nın, sitelerinizin yalnızca tek bir organizma içerdiği anlamına geldiğini varsayacağım. 30 demek 30 organizmanın öldüğü, 31 demek 31 organizmanın olmadığı anlamına gelir. Buna dayanarak ki-kare iyi olmalıdır, ancak sadece hangi hipotezin veriler tarafından desteklenmediğini söyleyecektir - iki makul hipotezin daha iyi olup olmadığını söylemeyecektir. Bu bilgiyi ayıklayan bir olasılık analizi sunuyorum - ki-kare testi ile aynıdır, ancak ki-kare testinden daha fazla bilgi verir ve sonuçları sunmanın daha iyi bir yoludur.

Model "ölüm" göstergesi için bir bernouli modelidir, YijBin(1,θij) (i anlamına gelir. 2×3 tablo ve j "hücre içindeki tekil birimi belirtir").

Ki-kare testinin altında yatan iki küresel varsayım vardır:

  1. tablonun belirli bir hücresi içinde, θij hepsi eşit, yani θij=θik=θi
  2. Yij istatistiksel olarak bağımsız, verilen θi. Bu, olasılık parametrelerinin sizeYij - biliyorsanız diğer tüm bilgiler önemsizdir θi

Göstermek Xi toplamı olarak Yij, (yani X1=30,X2=10,X3=1) ve izin ver Ni grup büyüklüğü olun (yani N1=61,N2=30,N3=11). Şimdi test etmek için bir hipotezimiz var:

HA:θ1=θ2,θ1=θ3,θ2=θ3

Peki alternatifleri nelerdir? Eşit veya eşit olmayan diğer olası kombinasyonları söyleyebilirim.

HB1:θ1θ2,θ1θ3,θ2=θ3
HB2:θ1θ2,θ1=θ3,θ2θ3
HB3:θ1=θ2,θ1θ3,θ2θ3
HC:θ1θ2,θ1θ3,θ2θ3

Yukarıdaki "küresel" varsayımlar düşünüldüğünde, bu hipotezlerden birinin doğru olması gerekir. Ancak, bunların hiçbirinin oranlar için belirli değerler belirtmediğine dikkat edin - bu nedenle bunların entegre edilmesi gerekir. Şimdi verilenHA doğrudur, tek bir parametremiz vardır (çünkü hepsi eşittir) ve önceki tekdüze muhafazakar bir seçimdir, bunu ve küresel varsayımları I0. Böylece sahibiz:

P(X1,X2,X3|N1,N2,N3,HA,I0)=01P(X1,X2,X3,θ|N1,N2,N3,HA,I0)dθ
=(N1X1)(N2X2)(N3X3)01θX1+X2+X3(1θ)N1+N2+N3X1X2X3dθ
=(N1X1)(N2X2)(N3X3)(N1+N2+N3+1)(N1+N2+N3X1+X2+X3)

Hangi bir sabit ile bölünmüş bir hipergeometrik dağılımdır. Benzer şekilde için de sahip olacağız: HB1

P(X1,X2,X3|N1,N2,N3,HB1,I0)=01P(X1,X2,X3,θ1θ2|N1,N2,N3,HB1,I0)dθ1dθ2
=(N2X2)(N3X3)(N1+1)(N2+N3+1)(N2+N3X2+X3)

Diğerleri için deseni görebilirsiniz. Yukarıdaki iki ifadeyi bölerek için olasılıkları hesaplayabiliriz . Cevap yaklaşık , yani veri üzerinden yaklaşık kat - eşit oranlar lehine oldukça zayıf kanıt. Diğer olasılıklar aşağıda verilmiştir.HAvsHB14HAHB14

Hypothesisprobability(HA|D)0.018982265(HB1|D)0.004790669(HB2|D)0.051620022(HB3|D)0.484155874(HC|D)0.440451171

Bu, eşit oranlara karşı güçlü kanıtlar gösteriyor, ancak kesin bir alternatifin güçlü kanıt lehine değil. "Açık deniz" oranının diğer iki orandan farklı olduğuna dair güçlü kanıtlar var gibi görünüyor, ancak "kıyı" ve "orta kanal" oranlarının farklılık gösterip göstermediğine dair net olmayan kanıtlar var. Ki-kare testi size söylemeyecektir - sadece hipotezinin "saçma" olduğunu söyler , ancak yerine hangi alternatifi koyacağını söylerA


1

İşte ki kare testleri yapmak ve çeşitli test istatistikleri oluşturmak için kod. Ancak, tablo kenar boşluklarının istatistiksel testleri burada işe yaramaz; cevap açıktır. Kimse yazın kışın sıcak olup olmadığını görmek için istatistiksel bir test yapmaz.

Chompy<-matrix(c(30,10,1,31,20,10), 3, 2)
Chompy
chisq.test(Chompy)
chisq.test(Chompy, simulate.p.value = TRUE, B = 10000)
chompy2<-data.frame(matrix(c(30,10,1,31,20,10,1,2,1,2,1,2,1,2,3,1,2,3), 6,3))
chompy2
chompy2$X2<-factor(chompy2$X2) 
chompy2$X3<-factor(chompy2$X3)
summary(fit1<-glm(X1~X2+X3, data=chompy2, family=poisson))
summary(fit2<-glm(X1~X2*X3, data=chompy2, family=poisson)) #oversaturated
summary(fit3<-glm(X1~1, data=chompy2, family=poisson)) #null
anova(fit3,fit1)
library(lmtest)
waldtest(fit1)
waldtest(fit2) #oversaturated
kruskal.test(X1~X2+X3, data=chompy2)
kruskal.test(X1~X2*X3, data=chompy2)

3
Verdiğiniz farklı R sözdizimi (ve altta yatan testler) ve özellikle bir Kruskal-Wallis testinin bir log-lineer modelle nasıl karşılaştırıldığı hakkında bilgi verebilirseniz okuyucu (ve OP) için ilginç olurdu.
chl

Kodu R konsoluna kopyalayıp yapıştırarak bunu görebilirsiniz.
Patrick McCann

1
Elbette. Yanıtlar elbette kodu çalıştırarak kendilerinden gelir.
chl

0

Birden fazla karşılaştırma yapmak için "eşzamanlı güven aralıklarını" kullanabileceğinize inanıyorum. Referans Agresti ve ark. 2008 Binom parametrelerini karşılaştırmak için eş zamanlı güven aralıkları. Biyometri 64 1270-1275.

İlgili R kodunu http://www.stat.ufl.edu/~aa/cda/software.html adresinde bulabilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.