Kolmogorov-Smirnov Testinin çoklu örnek versiyonu veya alternatifi var mı?


12

Bir arsanın tedavi diğerini kontrol aldığı altı çift parseldeki ağaçların boyut dağılımını karşılaştırıyorum. Her parsel çifti üzerinde Kolmogorov-Smirnov testi kullanarak ila arasında olduğunu görüyorum . KS testinin çoklu örnek uzantısı gibi tüm replikatlarla birlikte başa çıkmak için uygun yöntemler var mı veya uygun bir takip testi var mı? Ya da sadece " 2 çift parselde boyut dağılımı ) ve bir çift parselde marjinal olarak ( ) farklı bir sonuç çıkarmalıyım .p0.00037070.75(p<0.05p=0.59


2
Bu dağılımlar ile karşılaştırmak, merkezi eğilimde veya şekil olarak farklılık göstermek istedikleriniz nelerdir? KS'yi bir dağılımın şekli / doğası hakkında daha fazla düşünme eğilimindeyim, ancak Friedman testi gibi bir şey , numunelerin merkezi eğilimde farklı olduğunu belirleyebilir.
gung - Monica'yı eski durumuna döndürün

Yanıtlar:


13

Aslında bazı çoklu KS örnekleri vardır. Örneğin, ile bir r-örnek Kolmogorov-Smirnov-Testi , inanıyorum ki, iyi bir güce sahip. Bu güzel kağıdın bir ön baskısı burada mevcuttur . Ayrıca Kolmogorov-Smirnov ve Cramer-V'nin K-Sample Analoglarını da biliyorum . Mises Tests (ancak bildiğim kadarıyla daha az güce sahipler).r2


5
Böhm ve Hornik'in bu "güzel" makalesinin dezavantajı, anlayabildiğim kadarıyla kamuya açık bir uygulamanın bulunmamasıdır. Matematik, kendiniz uygulamak istemeyeceğiniz kadar karmaşıktır. Yazarları postaladım ve sordum ama cevap vermediler. Hornik'in R Core Developers grubunun bir üyesi olduğunu unutmayın ... Birisi bir uygulamayı biliyorsa, lütfen buraya bir bağlantı gönderin!
Laryx Decidua

8

Diğer şeylerin yanı sıra parametrik olmayan bir k-örneği Anderson-Darling testi veren bir R paketi kSamples vardır. Sıfır hipotezi, tüm k numunelerinin, belirtilmesi gerekmeyen aynı dağılımdan gelmesidir. Belki bunu kullanabilirsiniz.

Aynı ortalamaya ve varyansa sahip olacak şekilde ölçeklendirilmiş Normal ve Gamma dağıtılmış örnekleri karşılaştırmaya ilişkin küçük bir örnek:

library("kSamples")
set.seed(142)
samp.num <- 100
alpha <- 2.0; theta <- 3.0  # Gamma parameters shape and scale, using Wikipedia notation
gam.mean <- alpha * theta # mean of the Gamma
gam.sd <- sqrt(alpha) * theta # S.D. of the Gamma
norm.data <- rnorm(samp.num, mean=gam.mean, sd=gam.sd)  # Normal with the same mean and SD as the Gamma
gamma.data <- rgamma(samp.num, shape=alpha, scale=theta)
norm.data2 <- rnorm(samp.num, mean=gam.mean, sd=gam.sd)
norm.data3 <- rnorm(samp.num, mean=gam.mean, sd=gam.sd)
ad.same <- ad.test(norm.data,norm.data2,norm.data3) # "not significant, p ~ 0.459"
ad.diff <- ad.test(gamma.data,norm.data2,norm.data3) # "significant, p ~ 0.00066"

4

Birkaç yaklaşım:

İkili p değerlerini kullanın, ancak Bon Feroni veya Yanlış Keşif Oranı ayarlamaları (birincisi muhtemelen biraz fazla muhafazakar olacaktır) kullanarak çoklu karşılaştırmalar için ayarlayın. O zaman hala önemli ölçüde farklı olanların muhtemelen çoklu testlerden kaynaklanmadığından emin olabilirsiniz.

Dağılımlardan herhangi biri arasındaki en büyük mesafeyi bularak KS lezzetinde genel bir test oluşturabilir, yani tüm ampirik cdf'leri çizebilir ve en alt çizgiden en üst çizgiye veya belki de ortalama mesafeye veya başka anlamlı bir mesafeye ulaşabilirsiniz. ölçün. Daha sonra bir permütasyon testi yaparak bunun önemli olup olmadığını bulabilirsiniz: tüm verileri 1 büyük kutuya gruplayın, ardından rastgele orijinal gruplarınızla aynı örnek boyutlarına sahip gruplara bölün, izin verilen verilerdeki statüyü yeniden hesaplayın ve işlemi tekrarlayın birçok kez (999 veya daha fazla). Ardından orijinal verilerinizin izin verilen veri kümeleriyle nasıl karşılaştırıldığını görün. Orijinal veri istatistiği izin verilenlerin ortasına düşerse, önemli bir fark bulunmaz, ancak kenarda ise, ya da izin verilenlerin ötesinde önemli bir şey oluyor (ama bu size hangisinin farklı olduğunu söylemiyor). Muhtemelen, ilginç olanı bulmak için bu testin gücünü kontrol etmek için ilginç olacak kadar büyük bir fark olduğunu bildiğiniz simüle verilerle denemelisiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.