Buraya 1 ekleyerek bu hile nedir?


11

Ben baktığım bu sayfayı Lillefors testin Monte Carlo uygulanmasına ilişkin. Bu cümleyi anlamıyorum:

Bu hesaplamada simülasyondan rastgele bir hata var. Bununla birlikte, P-değerini hesaplarken pay ve paydaya 1 ekleme hilesi nedeniyle, rasgeleliğe bakılmaksızın doğrudan kullanılabilir.

Pay ve paydaya 1 ekleme hilesi ne anlama geliyor?

İlgili kod parçası burada:

n <- length(x)
nsim <- 4999
d.star <- double(nsim)
for (i in 1:nsim) {
    x.star <- rnorm(n)
    d.star[i] <- fred(x.star)
}
hist(d.star)
abline(v = d.hat, lty = 2)
## simulation-derived P-value
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)

İlgili içeriği buraya ekleyebilir misiniz?
gung - Monica'yı eski

4
Olasılıkları Monte Carlo tahmincisi için Laplace yumuşatma benziyor , bu da onu 1/2'ye çekiyor; ana etki, @Tim'in belirttiği gibi, 0'ın p değerini elde etmekten kaçınmaktır (ancak 0 simülasyon yapmazsanız söylediği gibi 0'a bölme riski yoktur). Bunun neden "rasgelelikten bağımsız olarak" kullanmanıza izin verdiğini gerçekten anlamıyorum.
Dougal

2
Cümlenin ne anlama geldiğini sormak için doğrudan Geyer yazdınız mı?
Alexis

@Alexis, hayır, ama bu iyi bir fikir.
Aksakal

@Dougal, evet, Laplace yumuşatma gibi görünüyor. Neden burada uyguladığı belli değil.
Aksakal

Yanıtlar:


6

Referans verilen sayfadaki açıklama

Sıfır hipotezi altında, hem verilerdeki rastgele hem de simülasyondaki rastgele dikkate alındığında olasılığı tam olarak olur.Pr(Pk/nsim)k/nsim

Bunu anlamak için, anahtar satırlarının (oldukça kısaltılmış) koduna bakmalıyız.

fred <- function(x) {ks.test(...)$statistic}  # Apply a statistical test to an array
d.hat <- fred(x)                              # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
                2, fred)                      # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value

Dikkat çeken sorun, kodun tırnakla eşleşmemesidir. Onları nasıl uzlaştırabiliriz? Bir deneme, teklifin son yarısı ile başlar. Prosedürü aşağıdaki adımları içeren şekilde yorumlayabiliriz:

  1. Bazı olasılık yasası göre bağımsız ve aynı şekilde dağıtılmış verilerini toplayın . sayısını üretmek için bir test prosedürü (kodda uygulandı .X1,X2,,XnGtfredT0=t(X1,,Xn)

  2. Oluşturmak yoluyla bilgisayar karşılaştırılabilir veri setlerinin, büyüklüğü, her biri olasılık yasası ile boş bir hipoteze göre, . sayıları üretmek için bu tür veri uygulayın .N=nsimnFtNT1,T2,,TN

  3. hesaplayın

    P=(i=1NI(Ti>T0)+1)/(N+1).

    ( " " vektör değerli kıyasla uygulanan gösterge işlevi olan bir kodda olabilir.), Sağ taraftaki sayesinde rastlantısal olduğu anlaşılmaktadır eşzamanlı rastgele (gerçek test istatistik) ve rastgele ( simüle test istatistikleri). Id.star > d.hatT0Ti

Verilerin sıfır hipotezine uygun olduğunu söylemek, olduğunu iddia etmektir . Bir test boyutu , . Her iki tarafı çarpımı ve çıkarma şans o gösterir herhangi bir sayıda için fazla olasılığı olan arasında aşan . Bu sadece tüm test istatistiklerinin sıralı kümesinin üst içinde olduğunu söylüyor . Beri (yapım aşamasında)F=Gα0<α<1N+11Pαα(N+1)α1TiT0T0(N+1)αN+1T0tüm bağımsızdır, sürekli bir dağılım olduğunda , bu şans tamsayı kısmı tarafından temsil edilen toplamın ; yani, ve sağlanan tam olarak eşit olacaktır bir tam sayı ; yani, .TiF(N+1)α

Pr(Pα)=(N+1)αN+1α
(N+1)αkα=k/(N+1)

Bu kesinlikle "p-değeri" olarak adlandırılmayı hak eden herhangi bir miktar için doğru olmak istediğimiz şeylerden biridir: üzerinde eşit dağılım göstermelidir . oldukça büyük olması şartıyla , herhangi bir biçiminin bir kısmına yakın olması için , bu üniform bir yakınlığı olacaktır dağılımı. (Bir p-değeri için gerekli ek koşullar hakkında bilgi edinmek için lütfen p-değerleri konusunda gönderdiğim iletişim kutusunu okuyun . )[0,1]N+1αk/(N+1)=k/(nsim+1)P

Anlaşılan tırnak "kullanmalıdır yerine" nin " " Göründüğü her yerde.nsim+1nsim


5

Burada, ikisinin de eklendiğine inanıyorum çünkü gözlemlenen istatistik referans dağılımına dahil edilmiştir; bu durumda, p-değeri tanımının "en azından büyük" kısmı yüzünden olur.

Emin değilim çünkü metin farklı bir şey söylüyor gibi görünüyor, ama bu yüzden yapardım.


1
@whuber Nasıl anlaşabileceğimi göremiyorum. Bütün testler olasılık oranı testi değildir; LRT olmadıklarında, bunu olasılık oranları açısından yorumlamanın ne önemi olabilir?
Glen_b

1
@whuber Kesinlikle yapabilir. Ancak, örneğin, bir Wilcoxon-Mann-Whitney'i (veya gerçekten de permütasyon testlerini daha geniş olarak) düşünün. Geniş kullanımda ne Lilliefors testi ne de olabilirlik oranı testi olmayan çok sayıda makul test vardır. Gücün istenmesine karşı açık bir alternatif olduğunda, test istatistiği tarafından verilen örnek alandaki siparişin mükemmel mantıklı olduğu ve çok çeşitli alternatiflerde makul özelliklere sahip olduğu anlamlı bir test istatistiği oluşturmak genellikle mümkündür.
Glen_b

1
Kesinlikle bir kişinin ilgilendiği türden (daha büyük, daha küçük ya da her ikisi de olsun, daha aşırı değerler almak anlamında), "- ancak bir kişi kabul edilemez olsa bile (gerçekten işe yaramaz bir test olsa bile), gözlemlenen örneği simüle sonuçlara dahil etme konusundaki cevabımda belirttiğim prensip hala geçerli olacaktır. Bir sipariş verdikten sonra, en iyisi olmasa bile, p-değerlerini hesaplarken, gözlemlenen durum yine de sayıya aittir.
Glen_b

2
@whuber şimdi o kadar da uzak olmayabiliriz. Makul bir test istatistiği seçerken kesinlikle bir şeye itiraz etmek isteriz . Ancak bir kez test istatistiğimiz olduğunda (sıfırın altında simüle ettiğimiz zamana kadar olması gerektiği gibi), bunu zaten yaptık. Ve bir kere sahip olduktan sonra, gözlemlenen durumu p-değeri hesaplamamıza dahil etmemizin nedeni, p-değerinin ne olduğudur.
Glen_b

1
Hiç farkımız olmadığını düşünüyorum. (Kendi cevabımın, gözlemlenen numunenin sayıya dahil edilmesinin uygun olduğunu açıkça belirttiğini unutmayın.) Yorumum, (hemfikir olduğum ve onayladığım) soruya verdiğiniz cevaba değil, yalnızca en azından sorunlu ifadeye yönlendirildi. büyük gibi." Bu ifadenin bu sitede (ve başka yerlerde) pek çok yerde yanlış yorumlandığını görüyorum, okuyucuların dikkatini gerçekten ne anlama geldiğine çekmek istedim .
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.