Kısa cevaplar:
1. Basitleştirir. (Açıkçası soruyu alamadım). 2. Hayır, hiçbir zaman göz ardı edemezsiniz, çünkü iid eksikliğinin tahmin ettiğiniz şeylerin varyansları üzerinde doğrudan sonuçları vardır.
Orta cevap: Önyükleme ile ilgili temel sorun, 'Önerilen prosedür verilerin özelliklerini yeniden oluşturuyor mu?' . Iid varsayımının ihlali büyük bir şeydir: verileriniz bağımlıdır, büyük olasılıkla verilerinizde aynı boyuttaki bir iid örneğinde olduğundan daha az bilgiye sahipsiniz ve saf bir bootstrap çalıştırıyorsanız (bireyi yeniden örnekleyin) gözlemler), ondan aldığınız standart hatalar çok küçük olacaktır. Önerilen prosedür, model yapısı ve parametrelerindeki bağımlılığı yakalayarak (veya en azından yakalamaya çalışarak) bağımsızlık eksikliğini ortadan kaldırır. Başarılı olursa, her bir önyükleme örneği verilerin özelliklerini gerektiği gibi yeniden üretir.
Uzun cevap:Önyükleme ile ilgili birden fazla varsayım katmanı vardır ve mümkün olan en basit durumda bile (iid verileri, ortalamanın tahmini), en az üç varsayım yapmanız gerekir: (1) ilgili istatistik, verilerin düzgün bir işlevidir (ortalama durumunda doğrudur, persentiller söz konusu olduğunda bile o kadar doğru değildir, en yakın komşu eşleşen tahmin edicilerle tamamen kapalıdır); (2) önyükleme yaptığınız dağıtım, nüfus dağılımına "yakın" olur (iid verileri durumunda tamam çalışır; yalnızca tek bir yörüngeye sahip olduğunuz bağımlı veriler durumunda düzgün çalışmayabilir = zaman serileri durumunda ve bu tek gözlemi yarı popülasyona yaymak için durağanlık ve karıştırma gibi ek varsayımları çağırmanız gerekir); (3) Monte Carlo bootstrap örneklemeniz, olası tüm alt örneklerle komple bootstrap için yeterince iyi bir yaklaşımdır (Monte Carlo'ya karşı tam bootstrap kullanımındaki yanlışlık, yakalamaya çalıştığınız belirsizlikten çok daha azdır). Parametrik bootstrap durumunda, (4) modelinizin verilerin tüm özelliklerini mükemmel bir şekilde açıkladığını varsayarsınız.
y= x β+ ϵ[ ϵ ] = exp[ x γ]σ¯2( X'X)- 1σ¯21 / n ∑bentecrübe[ xbenγ]( X'X)- 1∑ exp[ xbenγ] xbenx'ben( X'X)- 1). Bu nedenle, tamamen parametrik bir bootstrap çözümüne sahip olmak istiyorsanız, ortalama için modelle birlikte heteroskedastisite için modele uymanız gerekir. Seri veya başka bir korelasyondan şüpheleniyorsanız, bunun için de modele uymanız gerekir. (Bkz. Verilerin sesini modelinizin sentezlenmiş sesiyle değiştirdiğiniz için, bootstrap'in parametrik olmayan dağıtımdan bağımsız lezzeti şimdilik ortadan kalktı.)
Açıkladığınız yöntem tamamen yeni bir örnek oluşturarak iid varsayımı etrafında çalışır. Bağımlı veri önyükleme ile ilgili en büyük sorun, orijinal verilerdekilere yeterince yakın olan bağımlılık kalıplarına sahip olan örnek oluşturmaktır. Zaman serilerinde blok önyükleme komutlarını kullanabilirsiniz; kümelenmiş verilerle tüm kümeleri önyüklersiniz; heteroskedastik regresyon ile, vahşi bootstraps ile (bir heteroskedasticty modeli takmış olsanız bile, artıkların bootstrapinden daha iyi bir fikir). Blok önyüklemede, zaman serisinin uzak bölümlerinin yaklaşık olarak bağımsız olduğu konusunda eğitimli bir tahmin yapmalısınız (veya başka bir deyişle inanmak için iyi nedenlere sahip olmalısınız), böylece tüm korelasyon yapısının bitişik 5 veya 10 tarafından yakalanması gerekir. bloğu oluşturan gözlemler. Dolayısıyla, zaman serisinin korelasyon yapısını tamamen görmezden gelen gözlemleri tek tek yeniden örneklemek yerine, bunun korelasyon yapısına saygı göstereceğini umarak bloklar halinde yeniden örneklersiniz. Bahsettiğiniz parametrik bootstrap şöyle diyor: "Verilerle uğraşmak ve yeni bebekleri eskilerin parçalarından birleştirmek yerine, neden tüm kalıplanmış Barbie'yi sizin için damgalamıyorum? Sevdiğin Barbie ve sana da istediğini yapacağım söz veriyorum. " Verilerle uğraşmak ve yeni bebekleri eskilerin parçalarından birleştirmek yerine, neden tüm kalıplanmış Barbie'yi sizin için damgalamıyorum? Ne tür Barbie'leri sevdiğini anladım ve söz veriyorum sana da istediğini yapacağım. " Verilerle uğraşmak ve yeni bebekleri eskilerin parçalarından birleştirmek yerine, neden tüm kalıplanmış Barbie'yi sizin için damgalamıyorum? Ne tür Barbie'leri sevdiğini anladım ve söz veriyorum sana da istediğini yapacağım. "
Tanımladığınız parametrik bootstrap durumunda, HMM model uyumunuzun oldukça mükemmel olduğundan emin olmalısınız, aksi takdirde parametrik bootstrapiniz yanlış sonuçlara yol açabilir (Kollarını hareket ettiremeyen Barbie). Yukarıdaki heteroskedastik regresyon örneğini düşünün; veya bir AR (1) modelini AR (5) verilerine takmayı düşünün: parametrik olarak simüle edilmiş verilerle ne yaparsanız yapın, orijinal verilerin sahip olduğu yapıya sahip olmazlar.
Edit : Sadeghd sorusunu açıklığa kavuştururken, ben de buna cevap verebilirim. Her biri istatistik, örnek boyutu, bağımlılık veya bootstrap ile ilgili bir sorun ne olursa olsun belirli bir tuhaflığa hitap eden çok çeşitli bootstrap prosedürleri vardır. Örneğin, bağımlılığı ele almanın tek bir yolu yoktur. (Anket bootstraps'ları ile çalıştım, bazıları pratik çıkartan ziyade çoğunlukla metodolojik olsa da yaklaşık 8 farklı prosedür var; Bootstrap ile karşılaşabileceğiniz sorunların genel tartışması, bkz. Canty, Davison, Hinkley ve Ventura (2006). Önyükleme tanılama ve çareleri. Kanada İstatistik Dergisi, 34 (1), 5-27 .