Homoscedasticity varsayımının ihlal edildiği regresyonlarda önyükleme standart hataları ve güven aralıkları uygun mu?


13

Standart OLS regresyonlarında iki varsayım ihlal edilirse (hataların normal dağılımı, eşcinsellik), önyükleme standart hataları ve güven aralıkları, regresör katsayılarının önemi açısından anlamlı sonuçlara ulaşmak için uygun bir alternatif mi?

Önyükleme yapılan standart hatalar ve güven aralıkları ile önem testleri hâlâ hetero-esneklikle çalışır mı?

Evetse, bu senaryoda kullanılabilecek geçerli güven aralıkları ne olacaktır (yüzdebirlik, BC, BCA)?

Son olarak, bu senaryoda önyükleme uygunsa, bu sonuca varmak için okunması ve alıntılanması gereken ilgili literatür ne olur? Herhangi bir ipucu büyük mutluluk duyacağız!


1
Böyle bir ihlal varsa, önyüklemenin tedavi ettiğini düşünmüyorum. Bunun yerine, normale yaklaşmak ve R'deki sandviç paketinden olduğu gibi sağlam bir standart hata kullanmak için verileri dönüştürmeye (günlüğe kaydetmeye) neden?
B_Miner

Yeniden örnekleme şemasını bulunduğunuz duruma
uyarlarsanız

Yanıtlar:


20

Bağımsız, ancak aynı şekilde dağılmayan verilerle doğrusal regresyon için önyükleme gerçekleştirmek için en az üç (daha fazla olabilir) yaklaşım vardır. (Örneğin, "zaman serisi verileriyle otomatik korelasyonlar veya örnekleme tasarımı nedeniyle kümelenme nedeniyle" standart "varsayımların başka ihlalleri varsa, işler daha da karmaşık hale gelir).

  1. Sen, yani bir bütün olarak gözlem yeniden örneklemek yerine geçmesiyle örnek alabilirler orijinal verilerden . Bu asemptotik olarak Huber-Beyaz heteroskedastisite düzeltmesinin gerçekleştirilmesine eşdeğer olacaktır .{ ( y i , x i ) }(yj,xj){(yi,xi)}
  2. Modelinizi sığdırabilir, kalıntılarını elde edebilir ve ve ilgili ampirik dağılımlarından değiştirerek bağımsız olarak yeniden örnekleyebilirsiniz , ancak bu varsa heteroskedasticity kalıpları yıkar, bu yüzden bu bootstrap tutarlı olduğundan şüpheliyim. X * j e * jei=yixiβ^xjej
  3. Koşullu ikinci anı (ve koşullu üçüncü an için de bazı ekstra ince ayarlarla) kontrol eden kalıntı işaretini yeniden örneklediğiniz vahşi önyükleme gerçekleştirebilirsiniz . Bu, tavsiye edeceğim prosedür olacaktır ("heteroskedastisite kontrol etmek için ne yaptınız? Çalıştığını nasıl anlarsınız?") Sorulduğunda bunu anlamanız ve başkalarına karşı savunmanız şartıyla.

Nihai referans Wu (1986) ' dır , ancak Annals tam olarak resimli kitap okuması değildir.

OP'nin yorumlarda sorulan takip sorularına dayanan GÜNCELLEMELER :

Kopyaların sayısı bana çok büyük geldi; farkında olduğum bu bootstrap parametresinin tek iyi tartışması Efron & Tibshirani'nin Bootstrap'a Giriş kitabında .

Huber / White standart hataları ile dağıtım varsayımlarının eksikliği için genellikle benzer düzeltmelerin yapılabileceğine inanıyorum. Cameron ve Triverdi'nin ders kitabı , çift bootstrap ve White'ın heteroskedastisite düzeltmesinin denkliğini tartışıyor. Denklik, tahminleri için genel sağlamlık teorisinden gelir : her iki düzeltme de, her ne olursa olsun, dağılımsal varsayımları, sonlu ikinci kalıntı anlarının minimum varsayımı ve gözlemler arasındaki bağımsızlık ile düzeltmeyi amaçlamaktadır. Sonlu örneklerde daha spesifik karşılaştırmalar için Hausman ve Palmer'a (2012) da bakınız (bu makalenin bir versiyonu yazarların web sitelerinden birinde mevcuttur)M), bootstrap ve heteroskedasticity düzeltmeleri arasında karşılaştırma yapar.


Yardımın için çok teşekkürler! Lütfen bana bir takip sorusu verin: İhlal ettiğim tek varsayımlar, hataların normal dağılımı ve homoscedasticity varsayımlarıdır. Ayrıca, sadece regresyon katsayılarımın sig olup olmadığını görmekle ilgileniyorum. beklenen yönde veya hayır. Etkinin büyüklüğü önemli değildir. Ben şimdiye kadar yaptığım seçenek 1 olduğunu düşünüyorum. Ben standart hataları bootstrapped ve ayrıca bootstrapped güven aralıkları üretti. Bunu Stata: vce (bootstrap, reps (2500) bca), estat bootstrap kullanarak yaptım. Bu, varsayım ihlallerimi tedavi ediyor mu?
David

Verilerin teşhisini sadece sözdiziminize göre yapmıyorum ve kimse yapmayacak. Veri kümenizin boyutu nedir? reps(2500)muhtemelen en azından standart hatalar için aşırıya kaçmaktır; reps(500)En pratik amaçlar için iyi olduğunu düşünüyorum . Efron & Tibshirani'nin giriş önyükleme kitabında kopyaların sayısı hakkında bir bölüm vardır. Regresyonla ilgili bütün bir bölümleri de var, bu yüzden bakmanız için iyi bir referans olabilir.
StasK

Hızlı yanıtınız için teşekkürler. Veri kümesi ~ 250'dir. Çoğaltmaların sayısı (bağlantı için teşekkür ederiz!) İle ilgili sorular, önyüklemeli standart hataların (gözlemleri bir bütün olarak yeniden örnekleme yoluyla) ve / veya önyüklemeli güven aralıklarının (örn. Yüzdebirlik veya önyargı düzeltildi) homossedastisite ihlali ve hata varsayımının normal dağılımı göz önüne alındığında bir regresyon katsayısının önemini (veya eksikliğini) belirlemenin uygun bir yolu var mı? Girişiniz için çok teşekkürler!
David

Evet, daha iyi olduğunu söyleyebilirim. Eğer Stata'yı kullanırsanız robust, regresyonunuzun seçeneğini kullanarak çok benzer bir cevap alabilirsiniz .est storeher iki sonuç ve est tab, sebunları yan yana karşılaştırmak için.
StasK

Teşekkürler StasK. Bu sitede başka bir yerde yaptığınız aşağıdaki yorumu da gördüm: "Yeniden örnekleme ile basit bootstrap ⇔ Beyaz'ın heteroskedastisitesi sağlam tahmincisi". Yukarıda özetlenen sorularım bağlamında: Bu hususu vurgulayan dergi makaleleri var mı?
David
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.