Genellikle bir dağıtımın işlevselliği olan ilgi miktarı makul derecede pürüzsüzse ve verileriniz tanımlanmışsa, genellikle oldukça güvenli bir bölgedesiniz demektir. Tabii ki, bootstrap'in işe yarayacağı başka durumlar da var.
Önyüklemenin "başarısız olması" ne demek
Genel olarak konuşursak, önyüklemenin amacı, ilgilenilen istatistik için yaklaşık bir örnekleme dağılımı oluşturmaktır. Parametrenin gerçek tahmini ile ilgili değil. Dolayısıyla, ilgilenilen istatistik (bazı ölçeklendirme ve merkezleme altında) ve ise, dağıtımımızın dağılımını istiyoruz. dağılımına yakınsama . Eğer buna sahip değilsek, o zaman yapılan çıkarımlara güvenemeyiz. X n→X∞X∞X^nX^n→X∞X∞
Bir önyüklemenin ne zaman başarısız olabileceğine ilişkin kanonik örnek, hatta bir iid çerçevesinde bile aşırı sıra istatistiklerinin örnekleme dağılımına yaklaşmaya çalışırken. Aşağıda kısa bir tartışma.
Bir dağılımından rastgele bir örneğin maksimum sipariş istatistiğiU[0,θ]
'da dot'ların iid düzgün rastgele değişkenler dizisi olmasına izin verin . Let . Dağılımı olan
(Çok basit bir argümanla, bunun aslında olasılık içinde olduğunu ve rastgele değişkenlerin hepsinin aynı alanda tanımlanmış olması durumunda neredeyse kesin olduğunu gösterir.)X1,X2,…[0,θ]X(n)=max1≤k≤nXkX(n)
P(X(n)≤x)=(x/θ)n.
X(n)→θ
Temel bir hesaplama
veya başka bir deyişle, dağılımda ortalama ile üstel bir rasgele değişkeni birleştirir .
P(n(θ−X(n))≤x)=1−(1−xθn)n→1−e−x/θ,
n(θ−X(n))θ
Şimdi, bir (naif) oluşturan önyükleme dağılımının tahmin yeniden örnekleyerek almak için değiştirme ile ve dağılım kullanılarak arasında şartına .n(θ−X(n))X1,…,XnX⋆1,…,X⋆nn(X(n)−X⋆(n))X1,…,Xn
Ancak, olasılıklı olduğunu ve bu nedenle önyükleme dağılımının asimptotik olmasına rağmen sıfırda bir nokta kütlesine sahip olduğunu gözlemleyin. Gerçek sınırlayıcı dağılımın sürekli olduğu gerçeği.X⋆(n)=X(n)1−(1−1/n)n→1−e−1
Gerçek sınırlayıcı dağıtım ortalama ile üstel olsa Daha açık , sınırlayıcı önyükleme dağılımı, bir yerleştirir noktası kütle büyüklüğü sıfırdan gerçek değerinden bağımsız . yeterince büyük alarak , herhangi bir sabit aralık için herhangi bir sabit aralık için keyfi sınırlama olasılığını küçük yapabiliriz , ancak önyükleme ( hala !) Bu aralıkta en az 0,632 ihtimal olduğunu bildirir! Bundan, bootstrap'ın bu ortamda keyfi olarak kötü davranabileceği açık olmalıdır .θ1−e−1≈0.632 θθ[0,ε)
Özetle, bu durumda önyükleme başarısız olur (sefil bir şekilde). Parametre boşluğunun kenarındaki parametrelerle uğraşırken işler ters gitmeye meyillidir.
Normal rastgele değişkenler örneğinden bir örnek
Önyüklemenin şaşırtıcı şekilde basit koşullarda başarısızlığa uğramasına benzer başka örnekler de var.
den bir örnek örneğini göz önünde bulundurun burada için parametre alanı ile sınırlandırılır . Bu durumda MLE, . Yine, önyükleme tahmini tahminini kullanırız . Yine, (gözlenen numuneye bağlı) dağılımının aynı sınırlayıcı dağılıma yakınlaşmadığı gösterilmiştir. .X1,X2,…N(μ,1)μ[0,∞)X^n=max(X¯,0)X^⋆n=max(X¯⋆,0)n−−√(X^⋆n−X^n)n−−√(X^n−μ)
Değiştirilebilir diziler
Belki de en çarpıcı örneklerden biri değiştirilebilir bir dizi içindir. Let rastgele değişkenlerin bir dizi olarak bu için, bu her permütasyon çiftinin matrisleri ve , dizileri ve dizileri aynı eklem dağılımına sahiptir. Yani, satırlarına ve sütunlarına izin vermek dağıtımı değişmez tutar. (Örnek çok daha genel olmasına rağmen, hücre başına bir gözlemle iki yönlü rastgele etkiler modelini düşünebilirsiniz.)Y=(Yij)PQYPYQY
Diyelim ki, ortalaması için bir güven aralığı tahmin etmek istediğimizi varsayalım . hücreler aynı olmalıdır).μ=E(Yij)=E(Y11)
McCullagh (2000), böyle bir diziyi önyüklemenin iki farklı doğal (yani saf) yolunu düşünmüştür. Bunlardan hiçbiri, örnek ortalamasının asimptotik varyansını doğru alamaz. Ayrıca tek yönlü değiştirilebilir bir dizi ve doğrusal regresyonun bazı örneklerini göz önünde bulunduruyor.
Referanslar
Ne yazık ki, konu önemsiz olduğu için bunların hiçbiri özellikle kolay okunamıyor.
P. Bickel ve D. Freedman, Önyükleme için bazı asimptotik teori . Ann. Stat. , vol. 9, hayır. 6 (1981), 1196-1217.
DWK Andrews, Parametre alanı sınırında bir parametre olduğunda bootstrap tutarsızlığı , Econometrica , vol. 68, hayır. 2 (2000), 399-405.
P. McCullagh, Yeniden örnekleme ve değiştirilebilir diziler , Bernoulli , vol. 6, hayır. 2 (2000), 285-301.
EL Lehmann ve JP Romano, İstatistiksel Hipotezlerin Test Edilmesi , 3.. ed., Springer (2005). [Bölüm 15: Genel Büyük Örnek Yöntemler]