3 seviyeli acil durum tablosu ile başa çıkmak için uygun yol


12

Birkaç tür için sayım verileri, toplandıkları ev sahibi bitki ve bu koleksiyonun yağmurlu bir günde olup olmadığını içeren üç seviyeli bir beklenmedik durum tablosu var (bu gerçekten önemli!). R'yi kullanarak sahte veriler şu şekilde olabilir:

count    <- rpois(8, 10)
species  <- rep(c("a", "b"), 4)
host     <- rep(c("c","c", "d", "d"), 2)
rain     <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)


, , rain = 0

    species
host  a  b
   c 12 15
   d 10 13

, , rain = 1

    species
host  a  b
   c 11 12
   d 12  7

Şimdi, iki şeyi bilmek istiyorum: Türler konukçu bitkilerle ilişkili mi? "Yağmur ya da değil" bu ilişkiyi etkiler mi? Ben kullanılan loglm()den MASSbunun için:

 # Are species independent to host plants, given the effect of rain?
loglm(~species + host + rain + species*rain + host*rain, data=my.table)

 # Given any relationship between host plants and species, does rain change it?
loglm(~species + host + rain + species*host)

Bu, konfor seviyemin biraz dışında ve modelleri doğru ayarladığımı ve bu sorulara yaklaşmanın en iyi yolu olduğunu kontrol etmek istedim.

Yanıtlar:


10

İlk sorunuzu yorumlamanın iki yolu vardır; bunlar, sormanızın iki yoluna yansır: “Türler, ev sahibi bitkilerle ilişkili mi?” ve “Yağmurun etkisiyle türler ev sahibi bitkilerden bağımsız mıdır?”

İlk yorum , türlerin ve konakçıların bağımlı olduğunu, ancak yağmur yağıp yağmadığından ortak olarak bağımsız olduğunu belirten bir ortak bağımsızlık modeline karşılık gelir :

pshr=pshpr

burada , bir gözlemin hücresine düşme olasılığıdır; burada , türleri, konak tipini ve yağmur değerini endeksler ; , yağmur değişkeninin üzerine hücre ve yağmurun marjinal olasılığıdır.pshr(s,h,r)shrpsh(s,h,)pr

İkinci yorum , yağmur yağdığında, türlerin ve konakçıların bağımsız olduğunu belirten bir koşullu bağımsızlık modeline karşılık gelir :

psh|r=ps|rph|r veyapshr=psrphr/pr

burada koşullu olasılığı bir değeri, belirli bir hücre, . ( s , h , r ) rpsh|r(s,h,r)r

Bu modelleri R'de test edebilirsiniz ( loglinçok iyi çalışır, ancak daha tanıdıkyım glm):

count <- c(12,15,10,13,11,12,12,7)
species <- rep(c("a", "b"), 4)
host <- rep(c("c","c", "d", "d"), 2)
rain <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)
my.data <- as.data.frame.table(my.table)
mod0 <- glm(Freq ~ species + host + rain, data=my.data, family=poisson())
mod1 <- glm(Freq ~ species * host + rain, data=my.data, family=poisson())
mod2 <- glm(Freq ~ (species + host) * rain, data=my.data, family=poisson())
anova(mod0, mod1, test="Chi") #Test of joint independence
anova(mod0, mod2, test="Chi") #Test of conditional independence

Yukarıda, mod1ortak bağımsızlığa mod2karşılık gelir ve koşullu bağımsızlığa mod0karşılık gelirken, karşılıklı bağımsızlık modeline . Parametre tahminlerini vb. Kullanarak görebilirsiniz . Her zamanki gibi model varsayımlarının karşılanıp karşılanmadığını kontrol etmelisiniz. Verdiğiniz verilerde null model aslında tam olarak uyuyor.pshr=psphprsummary(mod2)

İlk sorunuza yaklaşmanın farklı bir yolu Fischer'ın 2-katmanlı 2x2 tabloları fisher.test(xtabs(count ~ host + species))için daraltılmış 2x2 tablosunda (ilk yorumlama) veya Mantel-Haenszel testinde ( mantelhaen.test(xtabs(count ~ host + species + rain))) tam test ( ) yapmak veya tabakalaşmaya saygılı bir permütasyon testi yazmak olacaktır. (ikinci yorum).

İkinci sorunuzu yorumlamak için, türler ve ev sahibi arasındaki ilişki yağmur yağıp yağmadığına bağlı mı?

mod3 <- glm(Freq ~ species*host*rain - species:host:rain, data=my.data, family=poisson())
mod4 <- glm(Freq ~ species*host*rain, data=my.data, family=poisson())
anova(mod3, mod4, test=”Chi”)
pchisq(deviance(mod3), df.residual(mod3), lower=F)

Tam model mod4doygun, ancak mod3yukarıda yaptığım gibi sapmaya bakarak söz konusu efekti test edebilirsiniz .


Teşekkürler Lockedoff, özellikle koşullu ve ortak bağımsızlık modeli arasındaki farkı düşünerek kendi düşüncelerimi çözmeme yardım ettiğiniz için
david w

1

Lojistik regresyon probleminize uygun görünüyor. Tahmin etmeye çalıştığınız değişken, bir gözlemin (A türü veya B türü) A türü olma olasılığıdır. Değişkenler , ve isteğe bağlı olarak .r a i n h o s t r a i nhostrainhostrain

R komutu şöyle olur:

glm (formül = türler ~ ana bilgisayar + yağmur, aile = binom (logit), ağırlıklar = sayımlar)

ve yamaçların -değerleri ile ilgileneceksiniz . Yine de birden fazla hipotezi test ettiğinizi unutmayın.p


1
Lojistik regresyon iyi görünüyor, ancak satır ve sütun toplamının sabitlenmesi için ek kısıtlama var. Poisson verileri için durum böyle olmayabilir. Cevapların çok farklı olmayacağına inanıyorum.
suncoolsu

1

Başlangıçta veganpaketten kısıtlamalı koordinasyon tekniklerinden birini denemenizi önerdim , ancak ikinci bir durumda, aslında 2 olasılık tablosuna sahip olduğunuz için bunun yararlı olacağından şüphelendim. Umarım bu örneğin ikinci kısmı [PDF: R Gösteri - Kategorik Analiz] faydalı olacaktır.


Bağlantının kopuk olduğunu düşünün, burada kategorik olanı mı kastettiniz ? Bu yardımcı oldu, teşekkürler!
david w

Evet, URL'deki alan onu kırıyor gibi görünüyor.
Ils
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.