Orijinal örnekten daha küçük önyükleme örnekleri kullanabilir miyiz?


12

N = 250 firma ve T = 50 aylık bir panel veri kümesinden tahmini parametreler için güven aralıklarını tahmin etmek için önyükleme kullanmak istiyorum. Kalman filtrelemesi ve karmaşık doğrusal olmayan tahmin kullanımı nedeniyle parametrelerin tahmini hesaplama açısından pahalıdır (birkaç günlük hesaplama). Bu nedenle, orijinal numuneden B = (yüzlerce veya daha fazla) M = N = 250 firmanın örneklerini çizmek ve B kez parametrelerini tahmin etmek, bu önyükleme için temel yöntem olmasına rağmen hesaplanabilir.

Bu nedenle, orijinal firmaların değiştirilmesi ile rastgele çizilen bootstrap örnekleri için (tam boyut N = 250 yerine) daha küçük M (örneğin 10) kullanmayı ve daha sonra ile model parametrelerinin bootstrap tahmini kovaryans matrisini ölçeklemeyi düşünüyorum. (örneğin yukarıdaki 1/25 ile) tam örnekte tahmin edilen model parametreleri için kovaryans matrisini hesaplamak için.1NM

İstenen güven aralıkları daha sonra normallik varsayımına veya benzer bir prosedür kullanılarak ölçeklendirilmiş daha küçük örneklemler için ampirik olanlara yakınlaştırılabilir (örn. .1NM

Bu geçici çözüm mantıklı mı? Bunu haklı çıkarmak için teorik sonuçlar var mı? Bu sorunu çözmek için herhangi bir alternatif var mı?

Yanıtlar:


4

Bu soru uzun zaman önce soruldu, ancak gelecekte kimse keşfederse bir cevap gönderiyorum. Kısacası, cevap evettir: bunu birçok ayarda yapabilirsiniz ve örnek boyutundaki değişikliği düzeltmede haklısınız . Bu yaklaşım genellikle denir dışına boostrap ve çoğu ayarlarında çalışır `` geleneksel '' önyükleme yaptığı yanı bazı ayarlar hangi onun yaptığı gibi değil.MNMN

Bunun nedeni, birçok bootstrap tutarlılık bağımsız değişkeninin formunun tahmincilerini kullanmasıdır ; burada rastgele değişkenlerdir ve , temel dağıtım. Örneğin, örnek ortalaması için ve .1N(TNμ)X1,,XNμTN=1Ni=1NXiμ=E(X1)

Birçok bootstrap tutarlılık kanıtı, , bazı sınırlı örnek ve ilişkili nokta tahmini , nerede gerçek altta yatan dağılımından çekilir ve dan değiştirilmesi ile çizilir .N{x1,,xN}μ K = T N ( X 1 , ... , x N ) μ^N=TN(x1,,xN)

(1)N(TN(X1,,XN)μ^N)DN(TN(X1,,XN)μ)
XiXi{x1,,xN}

Bununla birlikte, uzunluktaki daha kısa örnekleri de kullanabilir ve Bu şekilde, çıkıyor , tahmin ( ) sahip olan çoğu ortamda burada (yukarıdaki ile aynı sınırlama dağıtım s ) tutar ve bazı yerlerde değil. Bu durumda, ( ) ve ( ) aynı sınırlama dağılımına sahiptir, örneğin örnek standart sapmada düzeltme faktörünü motive eder .M<N

(2)M(TM(X1,,XM)μ^N).
M,N1122112MN

Bu argümanların hepsi asimtotiktir ve sadece sınırında tutulur . Bunun çalışması için çok küçük seçmemek önemlidir . En iyi teorik sonuçları elde etmek için bir fonksiyonu olarak optimal nasıl seçileceğine dair bazı teoriler vardır (örneğin aşağıdaki Bickel ve Sakov) , ancak sizin durumunuzda hesaplama kaynakları karar verici faktör olabilir.M,NM M NMN

Bazı sezgiler için: birçok durumda, olarak , böylece bir gibi biraz düşünülebilir üzerinden ile ön-yükleyici ve (I önlemek gösterimde karışıklığa küçük harf kullanıyorum ). Bu şekilde, (dağılımını taklit bir kullanılarak) üzerinden ile ön-yükleyici (geleneksel daha yapmak için bir '' Daha `` doğru bir şeydir üzerindenμ^NDμN

(3)N(TN(X1,,XN)μ),
mnm=Nn=MNM<NNN3MNM<NNN) tür. Durumunuzdaki bir avantaj da, değerlendirmenin daha az hesaplama maliyeti olmasıdır.

Bahsettiğiniz gibi Politis ve Romano ana makaledir. Bickel ve ark. (1997), out of bootstrap hakkında da güzel bir genel bakış aşağıda bulabilirsiniz .MN

Kaynaklar :

PJ Bickel, F Goetze, WR van Zwet. 1997 yeniden örnekleme az gözlemler: kayıplar için karları, zararları ve çareler. Statistica Sinica.n

PJ Bickel, A Sakov. Seçim günü 2008. de arasında ouf exremum için önyükleme ve güven sınırları. Statistica Sinica.mmn


3

Konu hakkında daha fazla okuduktan sonra, "alt örnekleme" altında bu tür bir güven aralığı tahmini yapılmasına izin veren yerleşik bir teori var gibi görünüyor. Temel referans "Politis, DN; Romano, JP (1994). Minimum varsayımlar altında alt örneklere dayanan büyük örnek güven bölgeleri. İstatistik Yıllıkları, 22, 2031-2050."

Buradaki fikir, N başlangıç ​​veri noktalarından (benim durumumdaki seri) her numune için "değiştirilmeden" M <N boyutunda örnekler (ancak B boyutunun farklı örneklerinde değiştirilmesiyle) çizmek ve güven aralığını tahmin etmektir. bu örnekleri ve ortak önyükleme yöntemini kullanarak ilgi parametresini. Daha sonra güven aralığını, parametrenin M'deki değişikliklerle altta yatan dağılım varyansındaki değişim oranına göre ölçeklendirin. Bu oran birçok ortak ayarda 1 / M'dir, ancak prosedürü birkaç farklı M ile tekrarlarsak ampirik olarak tahmin edilebilir. ve yüzdelik dilim aralıkları boyutundaki değişikliklere bakın.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.