Bu soru, bu lisans düzeyinde istatistik ders kitabında okuduğum ve bu sunum sırasında (bağımsız olarak) istatistiksel bir seminerde duyduğum bir şeyle tetiklendi. Her iki durumda da, ifade "satırlarının boyutu oldukça küçük olduğu için, bu parametrik yöntemi yerine (veya bununla birlikte) önyükleme yoluyla tahmin yapmaya karar verdik .
Ayrıntılara girmediler, ama muhtemelen akıl yürütme aşağıdaki gibiydi: yöntem , verilerin belirli bir parametrik dağılım takip ettiğini varsayar . Gerçekte dağılım tam olarak değildir , ancak örneklem büyüklüğü yeterince büyük olduğu sürece sorun olmaz. Bu durumda, örneklem büyüklüğü çok küçük olduğu için, herhangi bir dağıtım varsayımı yapmayan (parametrik olmayan) önyüklemeye geçelim. Sorun çözüldü!D D
Benim düşünceme göre, önyükleme bunun için değil. İşte nasıl görüyorum: bootstrap yeteri kadar veri olmadığı veya daha az belirgin olduğu durumlarda tek bir avantaj sağlayabilir, ancak standart hatalar, p değerleri ve benzer istatistikler elde etmek için kapalı bir form çözümü yok. Klasik bir örnek, iki değişkenli normal dağılımdan bir örnek verilen korelasyon katsayısı için bir CI elde ediyor: kapalı form çözümü var, ancak önyükleme işleminin daha kolay olduğu anlaşıldı. Bununla birlikte, hiçbir şey önyüklemenin bir şekilde küçük bir örneklem boyutundan kurtulmasına yardımcı olacağı anlamına gelmez.
Benim algım doğru mu?
Bu soruyu ilginç bulursanız, benden başka, daha spesifik bir önyükleme sorusu var:
Önyükleme: Aşırı yükleme sorunu
PS “Önyükleme yaklaşımı” nın korkunç örneklerini paylaşmaya yardım edemiyorum. Yazarın adını açıklamıyorum, ancak 2004'te Kantitatif Finans üzerine bir kitap yazan eski nesil “terimlerden” biri. Bu örnek oradan alınmıştır.
Şu problemi göz önünde bulundurun: her biri için 4 aktif ve 120 aylık iade gözleminiz olduğunu varsayalım. Amaç, yıllık getiri olan 4 boyutlu eklem CDF'sini oluşturmaktır. Tek bir varlık için bile, görev sadece 10 yıllık gözlemlerle elde edilemeyecek gibi gözüküyor, 4 boyutlu cdf tahminini bırak. Ancak endişelenmeyin, “önyükleme” size yardımcı olacaktır: mevcut 4 boyutlu gözlemlerin hepsini alın, yerine 12 örnek koyun ve bunları tek bir "önyükleme" 4 boyutlu yıllık geri dönüşlü tek vektör oluşturmak için birleştirin. Bunu 1000 kez tekrarlayın ve bakalım, kendinize 1000 yıllık iadelerden oluşan bir “önyükleme örneği” aldınız. Bunu cdf kestirimi amacıyla veya 1000 yıllık bir tarihe göre çizilebilecek başka herhangi bir çıkarım için 1000 boyutunda bir örnek olarak kullanın.