Önyükleme, örneğin ortaya çıktığı altta yatan ana dağılımın şekli hakkında herhangi bir bilgi kabul etmez. Geleneksel klasik istatistiksel parametre tahminleri normallik varsayımına dayanmaktadır. Bootstrap normallik ile ilgilenir ve pratikte klasik yöntemlerden daha doğrudur.
Bootstrapping, titiz teorik analizler için bilgisayarların ham bilgi işlem gücünün yerine geçer. Bir veri kümesi hata teriminin örnekleme dağılımı için bir tahmindir. Önyükleme şunları içerir: veri kümesinin belirtilen sayıda yeniden örneklenmesi, her örnekten ortalama hesaplanması ve ortalamanın standart hatasını bulma.
Aşağıdaki “R” kodu konsepti göstermektedir:
Bu pratik örnek, önyüklemenin kullanışlılığını gösterir ve standart hatayı tahmin eder. Güven aralığını hesaplamak için standart hata gerekir.
Eğri bir veri kümesi "a" olduğunu varsayalım:
a<-rexp(395, rate=0.1) # Create skewed data
çarpık veri kümesinin görselleştirilmesi
plot(a,type="l") # Scatter plot of the skewed data
boxplot(a,type="l") # Box plot of the skewed data
hist(a) # Histogram plot of the skewed data
Önyükleme prosedürünü uygulayın:
n <- length(a) # the number of bootstrap samples should equal the original data set
xbarstar <- c() # Declare the empty set “xbarstar” variable which will be holding the mean of every bootstrap iteration
for (i in 1:1000) { # Perform 1000 bootstrap iteration
boot.samp <- sample(a, n, replace=TRUE) #”Sample” generates the same number of elements as the original data set
xbarstar[i] <- mean(boot.samp)} # “xbarstar” variable collects 1000 averages of the original data set
##
plot(xbarstar) # Scatter plot of the bootstrapped data
boxplot(xbarstar) # Box plot of the bootstrapped data
hist(xbarstar) # Histogram plot of the bootstrapped data
meanOfMeans <- mean(xbarstar)
standardError <- sd(xbarstar) # the standard error is the standard deviation of the mean of means
confidenceIntervalAboveTheMean <- meanOfMeans + 1.96 * standardError # for 2 standard deviation above the mean
confidenceIntervalBelowTheMean <- meanOfMeans - 1.96 * standardError # for 2 standard deviation above the mean
confidenceInterval <- confidenceIntervalAboveTheMean + confidenceIntervalBelowTheMean
confidenceInterval