Ki-kare için güven aralığı


10

İki "uygunluk ki-kare" testi karşılaştırmak için bir çözüm bulmaya çalışıyorum. Daha doğrusu, iki bağımsız deneyden elde edilen sonuçları karşılaştırmak istiyorum. Bu deneylerde yazarlar, rastgele tahminleri (beklenen frekanslar) gözlemlenen frekanslarla karşılaştırmak için uyum iyiliği ki-kare kullandılar. İki deney aynı sayıda katılımcı aldı ve deney prosedürleri aynı, sadece uyaranlar değişti. İki deney sonucu anlamlı bir ki-kare gösterdi (exp. 1: X² (18) = 45; p <.0005 ve exp 2: X² (18) = 79; p <.0001).

Şimdi, bu iki sonuç arasında bir fark olup olmadığını test etmek istiyorum. Bir çözümün güven aralıklarının kullanımı olabileceğini düşünüyorum ama bu güven aralıklarının nasıl ancak bu sonuçlarla nasıl hesaplanacağını bilmiyorum. Veya etki büyüklüğünü karşılaştırmak için bir test (Cohen'in w)?

Birinin çözümü olan var mı?

Çok teşekkürler!

FD


1
Merhaba Florian. Chi kareleri arasındaki fark üzerinde neden bir permütasyon testi kullanmıyorsunuz?
Tal Galili

Merhaba ve cevabınız için teşekkürler! Sadece permütasyon testlerini bilmediğim için. Sadece iki ki-kare değerle permütasyon yapmak mümkün mü (ham verilerim yok, sadece sonuçlar)? Tekrar teşekkürler :)
Florian

Yanıtlar:


8

Sahip olduğunuz çok sınırlı bilgi kesinlikle ciddi bir kısıtlamadır! Ancak işler tamamen umutsuz değil.

Aynı ismin uyum iyiliği testinin test istatistiği için asimptotik dağılımına yol açan aynı varsayımlar altında, alternatif hipotez altındaki test istatistiği, asemptotik olarak, merkezi olmayan bir dağılımına sahiptir. İki uyaranın a) anlamlı olduğunu ve b) aynı etkiye sahip olduğunu varsayarsak, ilişkili test istatistikleri aynı asimtotik noncentral dağılımına sahip olacaktır. Bunu bir test oluşturmak için kullanabiliriz - temel olarak, merkez dışılık parametresi lambda'yı tahmin ederek ve test istatistiklerinin merkez dışı dağılımının kuyruklarında olup olmadığını görerek kullanabiliriz . (Bu testin çok fazla güce sahip olacağı anlamına gelmez.)χ 2 χ 2 λ χ 2 ( 18 , λ )χ2χ2χ2λχ2(18,λ^)

İki test istatistiği verilen ortalamasızlık parametresini ortalamasını alarak ve serbestlik derecelerini (moment tahmincisi yöntemi) çıkararak, 44 tahmini vererek veya maksimum olasılıkla tahmin edebiliriz:

x <- c(45, 79)
n <- 18

ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619

İki tahminimiz arasında iyi bir anlaşma, iki veri noktası ve 18 serbestlik derecesi göz önüne alındığında aslında şaşırtıcı değil. Şimdi bir p değeri hesaplamak için:

> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421

Bu yüzden p-değerimiz 0.12, iki uyaranın aynı olduğuna dair sıfır hipotezini reddetmek için yeterli değil.

Bu test, merkez dışılık parametreleri aynı olduğunda (kabaca)% 5 ret oranına sahip mi? Herhangi bir gücü var mı? Bu soruları aşağıdaki gibi bir güç eğrisi oluşturarak cevaplamaya çalışacağız. İlk olarak, ortalama lambda'yı tahmini 43,68 değerine sabitleriz. İki test istatistiği için alternatif dağılımlar için 18 serbestlik derecesi ve merkezsizlik parametreleri ile merkezi olmayan olacaktır . Her bir için bu iki dağıtımdan 10000 çekilişi simüle edeceğiz ve testimizin% 90 ve% 95 güven düzeyinde ne sıklıkta reddettiğini göreceğiz.χ 2 ( λ - δ , λ + δ ) δ = 1 , 2 , , 15 δλχ2(λδ,λ+δ)δ=1,2,,15δ

nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
  for (i in 1:10000)
  {
    x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
    lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
    pval <- pchisq(min(x), n, lhat)
    nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
    nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
  }
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000

plot(preject05~delta, type='l', lty=1, lwd=2,
     ylim = c(0, 0.4),
     xlab = "1/2 difference between NCPs",
     ylab = "Simulated rejection rates",
     main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
                          expression(paste(alpha, " = 0.10"))),
       lty=c(1,2), lwd=2)

ki aşağıdakileri verir:

resim açıklamasını buraya girin

Gerçek null hipotez noktalarına (x ekseni değeri = 0) baktığımızda, testin tutucu olduğunu görüyoruz, çünkü seviyenin gösterdiği sıklıkta reddetmediği, ancak ezici bir şekilde değil. Beklediğimiz gibi, çok fazla gücü yok, ama hiçbir şeyden daha iyi. Mümkün olan çok sınırlı miktarda bilgi göz önüne alındığında, orada daha iyi testler olup olmadığını merak ediyorum.


Ben bu konuda acemi değilim, jbowman cevabından senaryoyu (senaryo ise) nasıl çalıştıracağınızı sorabilir miyim. Benim durumumda, OR'yi% 90 CI'den almaya çalışın. İçinizden biri bana açıklayabilirse gerçekten minnettarım ve PASW17 kullanıyorum

Merhaba ash6. Aslında P yazılımı için sözdizimi değil, R yazılımı için bir betiktir (daha fazla bilgi için: r-project.org ). Böylece bu komut dosyası doğrudan R konsolunda çalıştırılabilir. Bu komut dosyası güven aralıklarını hesaplamaz, ancak 2 deneme arasındaki farkın testine karşılık gelen p değerini (burada tam olarak> pchisq (x, n, foo $ maximum ==> [1] p-değeri = 0.1190264) verir. (burada iki uyaran arasında, alternatif hipotez durumunda) ve burada iki deneyin aynı sonuçları verdiği sıfır hipotezini reddedemeyiz.
Florian

3

Bir korelasyon olarak yorumlanabilen Cramer'ın V'sini bir Balıkçının Z'sine dönüştürebilir ve daha sonra güven aralığı basittir (SE = 1 / sqrt (n-3): Z ± se * 1.96). CI'nin uçlarını aldıktan sonra bunları r'ye dönüştürebilirsiniz.

Tüm sayımlarınızı başka bir deneme boyutuyla bir beklenmedik durum tablosuna koymayı düşündünüz mü?


Ben bir chi-square Pearson iyilik bir Pearson ile bir Phi kullanmak mümkün olmadığını düşündüm (1 değişken). Bu yüzden Cohen'in w'sinden bahsettim ama formüller gerçekten benzer (phi = X² / n ve w = sqrt (X² / n))! Ancak bu testle phi'yi hesaplamak ve r'den z'ye dönüşümü uygulamak mümkünse, bize alıntı yapmak için bir referans vermeyi kabul eder misiniz? Bu testi bir makalede kullanmak istiyoruz ve az sayıda yorumcu istatistiklerle çok pickies olabilir. Bizim için çok büyük bir yardım olurdu! Sorunuz hakkında: Yayınlanmış bir makaleden yalnızca X², df ve p değerlerine sahip ham verilerimiz yok. Yardımın için çok teşekkürler!
Florian

Üzgünüm ... Phi yerine Cramer'in V'sini düşürmek demekti. Cramer's V, phi gibi kullanılabilir.
John

Ve hayır, bir alıntım yok. Büyük bir etkiniz varsa, bu önlemde küçük bir önyargı olup olmadığı önemli değildir. Büyük bir etkiniz yoksa, herhangi bir testin "öneminden" büyük kemikler çıkarmamaya dikkat edin.
John
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.