Lütfen düzenlemeye bakın.
Ağır kuyruklu verileriniz olduğunda, student-t hatalarıyla gerileme yapmak sezgisel bir şey gibi görünüyor. Bu olasılığı keşfederken, şu makaleyle karşılaştım:
Breusch, TS, Robertson, JC ve Welsh, AH (01 Kasım 1997). İmparatorun yeni giysileri: çok değişkenli t regresyon modelinin eleştirisi. Statistica Neerlandica, 51, 3.) ( bağlantı , pdf )
Hangi ölçek parametresi ve serbestlik derecesi parametresinin bir anlamda birbirine göre tanımlanamayacağını ve bu nedenle t hatalarıyla bir regresyon yapmanın standart bir lineer regresyonun ötesinde bir şey yapmadığını iddia eder.
Zellner (1976), veri vektörünün (veya hata vektörünün) çok değişkenli Student t dağılımından bir gerçekleştirme olarak temsil edildiği bir regresyon modeli önermiştir. Bu model büyük ilgi gördü çünkü daha ağır kuyruklu hata dağılımlarına izin vermek için her zamanki Gauss varsayımını genişletiyor gibi görünüyor. Literatürdeki bazı sonuçlar, Gauss modeline yönelik standart çıkarım prosedürlerinin daha geniş dağıtım varsayımı altında uygun kaldığını ve bu da standart yöntemlerin sağlamlık iddialarına yol açtığını göstermektedir. Matematiksel olarak iki model farklı olsa da, istatistiksel çıkarım amacıyla ayırt edilemez olduklarını gösteriyoruz. Çok değişkenli t modelinin ampirik sonuçları, Gauss modelininkilerle tamamen aynıdır. Bu nedenle, verilerin daha geniş bir dağıtım temsilinin önerisi sahte ve sağlamlık iddiaları yanıltıcıdır. Bu sonuçlara hem sık, hem de Bayesci perspektiflerden ulaşılmaktadır.
Bu beni şaşırtıyor.
Argümanlarını iyi değerlendirmek için matematiksel karmaşıklığa sahip değilim, bu yüzden birkaç sorum var: T hatalarıyla regresyon yapmanın genellikle yararlı olmadığı doğru mu? Bazen yararlı olurlarsa, kağıdı yanlış anladım mı yoksa yanıltıcı mı? Yararlı değilse, bu iyi bilinen bir gerçek midir? Ağır kuyruklu verileri hesaba katmanın başka yolları var mı?
Düzenleme : Paragraf 3 ve bölüm 4'ü daha yakından okuduktan sonra, aşağıdaki makalenin bir öğrenci-t regresyonu olarak düşündüğümden bahsetmediği anlaşılıyor (hatalar bağımsız tek değişkenli dağılımlardır). Hatalar bunun yerine tek bir dağıtımdan alınır ve bağımsız değildir. Doğru anlarsam, bu bağımsızlık eksikliği, ölçeği ve özgürlük derecelerini neden bağımsız olarak tahmin edemediğinizi açıklayan şeydir.
Sanırım bu yazı okumayı önlemek için bir kağıt listesi sunuyor.