Referans verilen sayfadaki açıklama
Sıfır hipotezi altında, hem verilerdeki rastgele hem de simülasyondaki rastgele dikkate alındığında olasılığı tam olarak olur.Pr(P≤k/nsim)k/nsim
Bunu anlamak için, anahtar satırlarının (oldukça kısaltılmış) koduna bakmalıyız.
fred <- function(x) {ks.test(...)$statistic} # Apply a statistical test to an array
d.hat <- fred(x) # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
2, fred) # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value
Dikkat çeken sorun, kodun tırnakla eşleşmemesidir. Onları nasıl uzlaştırabiliriz? Bir deneme, teklifin son yarısı ile başlar. Prosedürü aşağıdaki adımları içeren şekilde yorumlayabiliriz:
Bazı olasılık yasası göre bağımsız ve aynı şekilde dağıtılmış verilerini toplayın . sayısını üretmek için bir test prosedürü (kodda uygulandı .X1,X2,…,XnGtfred
T0=t(X1,…,Xn)
Oluşturmak yoluyla bilgisayar karşılaştırılabilir veri setlerinin, büyüklüğü, her biri olasılık yasası ile boş bir hipoteze göre, . sayıları üretmek için bu tür veri uygulayın .N=nsimnFtNT1,T2,…,TN
hesaplayın
P=(∑i=1NI(Ti>T0)+1)/(N+1).
( " " vektör değerli kıyasla uygulanan gösterge işlevi olan bir kodda olabilir.), Sağ taraftaki sayesinde rastlantısal olduğu anlaşılmaktadır eşzamanlı rastgele (gerçek test istatistik) ve rastgele ( simüle test istatistikleri). Id.star > d.hat
T0Ti
Verilerin sıfır hipotezine uygun olduğunu söylemek, olduğunu iddia etmektir . Bir test boyutu , . Her iki tarafı çarpımı ve çıkarma şans o gösterir herhangi bir sayıda için fazla olasılığı olan arasında aşan . Bu sadece tüm test istatistiklerinin sıralı kümesinin üst içinde olduğunu söylüyor . Beri (yapım aşamasında)F=Gα0<α<1N+11P≤αα(N+1)α−1TiT0T0(N+1)αN+1T0tüm bağımsızdır, sürekli bir dağılım olduğunda , bu şans tamsayı kısmı tarafından temsil edilen toplamın ; yani, ve sağlanan tam olarak eşit olacaktır bir tam sayı ; yani, .TiF⌊(N+1)α⌋
Pr(P≤α)=⌊(N+1)α⌋N+1≈α
(N+1)αkα=k/(N+1)
Bu kesinlikle "p-değeri" olarak adlandırılmayı hak eden herhangi bir miktar için doğru olmak istediğimiz şeylerden biridir: üzerinde eşit dağılım göstermelidir . oldukça büyük olması şartıyla , herhangi bir biçiminin bir kısmına yakın olması için , bu üniform bir yakınlığı olacaktır dağılımı. (Bir p-değeri için gerekli ek koşullar hakkında bilgi edinmek için lütfen p-değerleri konusunda gönderdiğim iletişim kutusunu okuyun . )[0,1]N+1αk/(N+1)=k/(nsim+1)P
Anlaşılan tırnak "kullanmalıdır yerine" nin " " Göründüğü her yerde.nsim+1nsim