Student-t hatalarıyla gerilemeler işe yaramaz mı?


10

Lütfen düzenlemeye bakın.

Ağır kuyruklu verileriniz olduğunda, student-t hatalarıyla gerileme yapmak sezgisel bir şey gibi görünüyor. Bu olasılığı keşfederken, şu makaleyle karşılaştım:

Breusch, TS, Robertson, JC ve Welsh, AH (01 Kasım 1997). İmparatorun yeni giysileri: çok değişkenli t regresyon modelinin eleştirisi. Statistica Neerlandica, 51, 3.) ( bağlantı , pdf )

Hangi ölçek parametresi ve serbestlik derecesi parametresinin bir anlamda birbirine göre tanımlanamayacağını ve bu nedenle t hatalarıyla bir regresyon yapmanın standart bir lineer regresyonun ötesinde bir şey yapmadığını iddia eder.

Zellner (1976), veri vektörünün (veya hata vektörünün) çok değişkenli Student t dağılımından bir gerçekleştirme olarak temsil edildiği bir regresyon modeli önermiştir. Bu model büyük ilgi gördü çünkü daha ağır kuyruklu hata dağılımlarına izin vermek için her zamanki Gauss varsayımını genişletiyor gibi görünüyor. Literatürdeki bazı sonuçlar, Gauss modeline yönelik standart çıkarım prosedürlerinin daha geniş dağıtım varsayımı altında uygun kaldığını ve bu da standart yöntemlerin sağlamlık iddialarına yol açtığını göstermektedir. Matematiksel olarak iki model farklı olsa da, istatistiksel çıkarım amacıyla ayırt edilemez olduklarını gösteriyoruz. Çok değişkenli t modelinin ampirik sonuçları, Gauss modelininkilerle tamamen aynıdır. Bu nedenle, verilerin daha geniş bir dağıtım temsilinin önerisi sahte ve sağlamlık iddiaları yanıltıcıdır. Bu sonuçlara hem sık, hem de Bayesci perspektiflerden ulaşılmaktadır.

Bu beni şaşırtıyor.

Argümanlarını iyi değerlendirmek için matematiksel karmaşıklığa sahip değilim, bu yüzden birkaç sorum var: T hatalarıyla regresyon yapmanın genellikle yararlı olmadığı doğru mu? Bazen yararlı olurlarsa, kağıdı yanlış anladım mı yoksa yanıltıcı mı? Yararlı değilse, bu iyi bilinen bir gerçek midir? Ağır kuyruklu verileri hesaba katmanın başka yolları var mı?

Düzenleme : Paragraf 3 ve bölüm 4'ü daha yakından okuduktan sonra, aşağıdaki makalenin bir öğrenci-t regresyonu olarak düşündüğümden bahsetmediği anlaşılıyor (hatalar bağımsız tek değişkenli dağılımlardır). Hatalar bunun yerine tek bir dağıtımdan alınır ve bağımsız değildir. Doğru anlarsam, bu bağımsızlık eksikliği, ölçeği ve özgürlük derecelerini neden bağımsız olarak tahmin edemediğinizi açıklayan şeydir.

Sanırım bu yazı okumayı önlemek için bir kağıt listesi sunuyor.


kağıdı dropbox aracılığıyla dağıtmanıza izin verdiğinizden emin misiniz? daha iyi çift kontrol.
Toby El Tejedor

Bence laplace dağılımı size ağır kuyrukları bir dereceye kadar tedavi etme fırsatı veriyor.
Toby El Tejedor

Yanıtlar:


5

Yaptığınız düzenleme doğru. Makalede sunulan sonuçlar sadece çok değişkenli hatalar için geçerlidir. Bağımsız t hataları kullanıyorsanız, güvende olursunuz.

Kağıdın iyi bilindiğini sanmıyorum, ama doğru olduğunu düşünüyorum.

İstatistiksel literatür, çoğu durumda ya yeniden parametrelendirme, bire bir dönüşümler ya da bazen yararsız olan "genellemeler" ile doludur, çünkü söz konusu modelin bazı özelliklerinin genelleştirilmesine önemli ölçüde katkıda bulunmazlar.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.