R'deki bir Kolmogorov-Smirnov testinin gücünü hesaplayabilir misiniz?


10

R'de 2 taraflı Kolmogorov Smirnov testi için güç analizi yapmak mümkün müdür?

İki ampirik dağılımın ks.test () kullanarak farklılık gösterip göstermediğini test ediyorum ve bir güç analizi eklemek istiyorum.

R'deki KS testleri için yerleşik güç analizleri bulamadım. Herhangi bir öneriniz var mı?

Düzenleme : Bunlar rasgele oluşturulan dağıtım verilerimi yakından (gerçek örnek boyutları ve üstel dağılımlar için tahmini bozulma oranları ile)

set.seed(100)
x <- rexp(64, rate=0.34)
y <- rexp(54,rate=0.37)

#K-S test: Do x and y come from same distribution?
ks.test(x,y)

Bu veriler iki farklı grupta vücut büyüklüğünün ölçüleridir. İki grubun aslında aynı dağılıma sahip olduğunu göstermek istiyorum, ancak bir ortak çalışan tarafından bunu örnek boyutlarına göre söyleme gücüm olup olmadığını sordum. Burada rasgele bir üstel dağılımdan rastgele çizdim, ancak bunlar gerçek verilere yakın.

Şimdiye kadar, bu dağılımlarda iki taraflı KS testine göre önemli bir fark olmadığını söyledim. İki dağılımı da çizdim. X ve y için örnek boyutları ve bozulma oranları göz önüne alındığında, böyle bir ifade verme gücüm olduğunu nasıl gösterebilirim?


4
Güç birçok şeye bağlı olacaktır, bu yüzden iki örnek testi için yerleşik olmazdı. Belirli durumlar için simüle edebilirsiniz. Peki: Güç, durumla ilgili hangi varsayımları verdi? Hangi alternatif veya alternatif dizilere karşı? Örneğin, bir dizi ölçek kaydırma alternatifine karşı üstel dağıtılmış veriler için bir güç eğrisi hesaplayabilirsiniz (simüle edebilirsiniz). Veya konum kaymasına karşı normal bir güç hesaplayabilirsiniz. Veya şekil parametresini değiştirdiğinizde gücü bir Weibull içinde hesaplayabilirsiniz. Ek ayrıntılarınız var mı?
Glen_b

Aslında gücü hesaplamak için örnek boyutlarına da ihtiyacınız olacak. Belirli bir alternatife karşı belirtilen güç verilen örnek boyutunu belirlemeye çalışıyorsanız, bu kök bulma yoluyla yapılabilir, ancak genellikle basit yaklaşımlarla noktayı bulabilirsiniz (birkaç örnek boyutunu denemek genellikle çok yakın olmak için yeterlidir ).
Glen_b

Hangi değişken ölçülüyor? Bu zamanlar mı?
Glen_b -Monica

@Glen_b Bunlar zaman değil. İki farklı grupta vücut büyüklüğünün ölçüleridir. İki grubun aslında aynı dağılıma sahip olduğunu göstermek istiyorum, ancak bunu örnek boyutlarına göre söyleme gücüm olup olmadığını sordum.
Sarah

1
Ah! Bu, sorunuzda bulunmanıza yardımcı olabilecek iki yararlı bağlam parçasıdır. Buradaki fikir, bazı mütevazı farklılıkları belirleme gücünün makul olduğunu gösterirseniz, farkın küçük olduğuna dair bir gösterge olarak reddetmek başarısız olabilir. Evet, önceki bir güç analizi bu argümanın yapılmasına yardımcı olabilir. Gerçekte, muhtemelen, farkın aslında küçük boyutta olduğunu ve iki örnek cdfs'nin bir çiziminin bir göstergesi olarak ölçek değişikliğinin tahmini (ve belki de güven aralığı) gibi bir şeye odaklanacağım.
Glen_b

Yanıtlar:


16

Üstel ölçek kaydırma alternatiflerine karşı güç bulmak oldukça kolaydır.

Ancak, ben hesaplanan değerleri kullanarak gerektiğini bilmiyorum gelen güç olmuş olabileceğini çözmek sizin veri. Bu tür post post hoc güç hesaplaması, sezgisel (ve belki de yanıltıcı) sonuçlara yol açma eğilimindedir.

Güç, önem seviyesi gibi, gerçeklerden önce uğraştığınız bir olgudur; dikkate alınacak makul bir alternatifler dizisine ve arzu edilen bir etki büyüklüğüne karar vermek için a priori anlayış (teori, muhakeme veya daha önce yapılmış herhangi bir çalışma dahil)

Ayrıca diğer çeşitli alternatifleri de düşünebilirsiniz (örneğin, bir gama ailesinin içine katlanarak katlanarak daha fazla veya daha az çarpıklık vakasının etkisini göz önünde bulundurabilirsiniz).

Bir güç analiziyle cevaplamaya çalışabileceğiniz genel sorular şunlardır:

1) Belirli bir örnek boyutu için, bazı efekt boyutlarında veya efekt boyutları setinde * güç nedir?

2) bir örnek boyutu ve gücü verildiğinde, ne kadar büyük bir etki tespit edilebilir?

3) Belirli bir etki büyüklüğü için istenen bir güç verildiğinde, hangi örnek büyüklüğü gerekir?

* (burada 'etki büyüklüğü' genel olarak amaçlanmıştır ve örneğin, zorunlu olarak standartlaştırılmamış belirli bir ortalama oranı veya ortalama farkı olabilir).

Açıkçası zaten bir örnek büyüklüğünüz var, bu yüzden durumda değilsiniz (3). Davayı (2) veya davayı (1) makul olarak düşünebilirsiniz.

Vaka (1) 'i öneririm (bu da vaka (2) ile başa çıkmanın bir yolunu verir).

Dava (1) 'e bir yaklaşımı göstermek ve dava (2) ile nasıl ilişkili olduğunu görmek için, aşağıdakilerle birlikte belirli bir örneği ele alalım:

  • ölçek kaydırma alternatifleri

  • üstel popülasyonlar

  • 64 ve 54'ün iki örneğindeki örnek boyutları

Örnek boyutları farklı olduğu için, numunelerden birindeki göreceli yayılmanın hem daha küçük hem de 1'den büyük olduğu durumu dikkate almalıyız (eğer aynı boyuttalarsa, simetri düşünceleri sadece bir tarafı düşünmeyi mümkün kılar). Ancak, aynı boyuta oldukça yakın olduklarından, etki çok küçüktür. Her durumda, örneklerden biri için parametreyi sabitleyin ve diğerini değiştirin.

Yani birinin yaptığı:

Önceden:

choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1

Hesaplamaları yapmak için:

for each possible scale multiplier, kappa 
  repeat nsim times
    generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
    perform the test
  compute the rejection rate across nsim tests at this kappa

R'de bunu yaptım:

alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s)        #  also below and at 1
rr = array(NA,length(s))   # to hold rejection rates

for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
                                    ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
                                 )

plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last 
abline(h=alpha,col=8,lty=2) # draw in alpha

Bu da aşağıdaki güç "eğrisini" verir

resim açıklamasını buraya girin

X ekseni bir günlük ölçeğinde, y ekseni reddetme oranıdır.

Burada söylemek zor, ancak siyah noktalar solda sağdan biraz daha yüksek (yani, daha büyük örnek daha küçük ölçeğe sahip olduğunda fraksiyonel olarak daha fazla güç var).

Reddetme oranının bir dönüşümü olarak ters normal cdf'yi kullanarak, dönüştürülen reddetme oranı ile log kappa (kappa sgrafikte, ancak x ekseni log ölçeğinde) arasındaki ilişkiyi neredeyse doğrusal hale getirebiliriz (0'a yakın hariç) ), ve simülasyon sayısı gürültünün çok düşük olacağı kadar yüksekti - mevcut amaçlar için hemen hemen görmezden gelebiliriz.

Böylece lineer enterpolasyonu kullanabiliriz. Aşağıda örnek boyutlarınızda% 50 ve% 80 güç için yaklaşık efekt boyutları gösterilmektedir:

resim açıklamasını buraya girin

Diğer taraftaki etki boyutları (daha büyük grup daha küçük ölçeğe sahiptir) bundan birazcık kaydırılır (kesirli olarak daha küçük bir etki boyutu alabilir), ancak çok az fark yaratır, bu yüzden noktayı yormayacağım.

Böylece test önemli bir fark alacaktır (1'lik bir orandan), ancak küçük bir fark yaratmayacaktır.


Şimdi bazı yorumlar için: Hipotez testlerinin özellikle altta yatan ilgi konusu ile ilgili olduğunu düşünmüyorum ( oldukça benzerler mi? ) Ve sonuç olarak bu güç hesaplamaları bize bu soru ile doğrudan ilgili hiçbir şey söylemiyor.

Bence bu daha faydalı soruyu, "esasen aynı" olduğunu düşündüğünüzü, aslında, operasyonel olarak önceden ifade ederek ele aldığınızı düşünüyorum. Bu , rasyonel olarak istatistiksel bir faaliyete yönelmek suretiyle - verilerin anlamlı analizine yol açmalıdır.


Çok teşekkür ederim! Bu gerçekten yararlı, çok takdir etmek.
Sarah

0

Kolmogorov-Smirnov parametrik olmadığı için tanım gereği uygulanabilir bir güç analizi yapılamaz. Bir tür tahmin için, bir arka plan modeli varsaymanız (ve böylece parametrik olmayan dünyadan sapmanız ...) ve aşağıdakilerden birini hesaplamak için kullanmanız gerekir: örnek boyutu, MDE veya güç (yani, iki tanesini düzeltin / seçin ve üçüncüyü hesaplayın).

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.