Önyükleme CI'lerini ve p değerlerini hesaplamanın çok sayıda yolu vardır. Asıl mesele bootstrap'ın boş bir hipotez altında veri üretmesinin imkansız olmasıdır. Permütasyon testi, buna dayanarak uygulanabilir bir örneklemedir. Uygun bir önyükleme kullanmak için, test istatistiklerinin örnekleme dağılımı hakkında bazı varsayımlarda bulunmalısınız.
Testin değişmezliğinin eksikliği ile ilgili bir yorum: tamamen boş olanlar için% 95 CI bulmak mümkün ancak tam tersi ap> 0.05 veya tam tersi. Daha iyi bir anlaşmaya varmak için, boştaki altındaki önyükleme örneklerinin hesaplanması aşağıdaki gibi yapılmalıdır .β*0= β^- β^* ziyade β*0= β^*- β^. Diğer bir deyişle, yoğunluk bootstrap örneğinde sağa eğik ise, yoğunluğun boşta bırakılmış olması gerekir. Bunun gibi analitik olmayan (örn. Yeniden örnekleme) solüsyonlarla CI'lerin testlerini tersine çevirmek gerçekten mümkün değildir.
normal önyükleme
Bir yaklaşım normal bir önyüklemedir Eğer, önyükleme dağılımın ortalama ve standart sapma almak orijinal önyükleme numunede tahmin noktasında sıfır dağılımı normal yüzdelik dağılımı değişen ve kullanılarak boş altında örnekleme dağılımını hesaplar . Bu, önyükleme dağılımı normal olduğunda makul bir yaklaşımdır, görsel muayene burada genellikle yeterlidir. Bu yaklaşımı kullanan sonuçlar genellikle, heteroseksensellik ve / veya sonlu örnek varyans varsayımlarına karşı dayanıklı olan sağlam veya sandviç esaslı hata tahminine çok yakındır. Normal bir test istatistiğinin varsayımı, tartışacağım bir sonraki bootstrap testindeki varsayımların daha güçlü bir durumudur.
yüzdelik önyükleme
Diğer bir yaklaşım, yüzde önyüklemesinden bahsettiğimizde çoğumuzun düşündüğümüzü düşündüğü yüzdelik önyüklemedir. Burada, parametrenin bootstrapped dağılımı, alternatif hipotez altında numunenin ampirik bir dağılımını tahmin eder. Bu dağılım normal olmayabilir. % 95 CI, ampirik miktarları alarak kolayca hesaplanır. Ancak önemli bir varsayım, böyle bir dağılımın çok önemli olduğudur . Bunun anlamı, eğer temel parametre değişirse, dağılımın şekli sadece bir sabit tarafından kaydırılır ve ölçeğin mutlaka değişmesi gerekmez. Bu güçlü bir varsayım! Eğer böyle olursa, "boş hipotez altında istatistiğin dağılımı" nı (DSNH veyaF*0) bootstrap dağılımını tahminlerden çıkararak, ardından DSNH’nin yüzde kaçının tahmininizden daha "aşırı" olduğunu hesaplayarak 2 × dak ( F*0( β^) , 1 - F*0( β^) )
Studentized önyükleme
Hesaplamak için en kolay önyükleme çözümü pdeğerleri bir öğrenci bootstrap kullanmaktır. Her önyükleme yinelemesinde, istatistiği ve standart hatasını hesaplayın ve öğrencinin istatistiğini döndürün. Bu, cis ve p değerlerini çok kolay hesaplamak için kullanılabilecek hipotez için önyüklenmiş bir öğrenci dağılımı sağlar. Bu aynı zamanda önyargılı düzeltmeli hızlandırılmış önyüklemenin arkasındaki sezginin de altını çiziyor. T-dağılımı sıfırın altında daha kolay kayar, çünkü dıştaki sonuçlar karşılık gelen yüksek değişkenlikleriyle düşük ağırlıklı olur.
Programlama örneği
Örnek olarak, city
verileri bootstrap paketinde kullanacağım . Önyükleme güven aralıkları bu kodla hesaplanır:
ratio <- function(d, w) sum(d$x * w)/sum(d$u * w)
city.boot <- boot(city, ratio, R = 999, stype = "w", sim = "ordinary")
boot.ci(city.boot, conf = c(0.90, 0.95),
type = c("norm", "basic", "perc", "bca"))
ve bu çıktıyı üretmek:
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 999 bootstrap replicates
CALL :
boot.ci(boot.out = city.boot, conf = c(0.9, 0.95), type = c("norm",
"basic", "perc", "bca"))
Intervals :
Level Normal Basic
90% ( 1.111, 1.837 ) ( 1.030, 1.750 )
95% ( 1.042, 1.906 ) ( 0.895, 1.790 )
Level Percentile BCa
90% ( 1.291, 2.011 ) ( 1.292, 2.023 )
95% ( 1.251, 2.146 ) ( 1.255, 2.155 )
Calculations and Intervals on Original Scale
Normal önyükleme için% 95 CI hesaplanarak elde edilir:
with(city.boot, 2*t0 - mean(t) + qnorm(c(0.025, 0.975)) %o% sqrt(var(t)[1,1]))
Böylece p değeri elde edilir:
> with(city.boot, pnorm(abs((2*t0 - mean(t) - 1) / sqrt(var(t)[1,1])), lower.tail=F)*2)
[1] 0.0315
Hangi% 95 normal CI'nin 1 değerinin boş değer içermediğini kabul eder.
Yüzde CI elde edilir (bağlanma metotlarına bağlı olarak bazı farklılıklarla):
quantile(city.boot$t, c(0.025, 0.975))
Ve yüzdelik önyükleme için p değeri:
cvs <- quantile(city.boot$t0 - city.boot$t + 1, c(0.025, 0.975))
mean(city.boot$t > cvs[1] & city.boot$t < cvs[2])
Gives a p of 0.035 which also agrees with the confidence interval in terms of the exclusion of 1 from the value. We cannot in general observe that, while the width of the percentile CI is nearly as wide as the normal CI and that the percentile CI is further from the null that the percentile CI should provide lower p-values. This is because the shape of the sampling distribution underlying the CI for the percentile method is non-normal.