Uygunsuz doğrusal modeller ne zaman sağlam bir şekilde güzelleşir?


9

Sorular:

  • Uygun olmayan lineer modeller pratikte kullanılıyor mu veya bilimsel dergilerde zaman zaman bir tür merak mı anlatılıyor? Eğer öyleyse, hangi alanlarda kullanılıyorlar?
  • Bu tür modellerin başka örnekleri var mı?
  • Son olarak, standart hatalar, p'lik değerler, R2 Bu tür modeller için OLS'den alınan vb. doğru mu, yoksa bir şekilde düzeltilmeli mi?

Amaç: Literatürde uygunsuz doğrusal modeller zaman zaman tanımlanmaktadır. Genel olarak, bu modeller şu şekilde tarif edilebilir:

y=a+biwixi+ε

onları regresyondan farklı kılan şey wjdeğerleri modelde tahmin edilen katsayılar değil ,

  • her değişken için eşit wi=1( birim ağırlıklı regresyon ),
  • korelasyonlara dayalı wi=ρ(y,xi) (Dana ve Dawes, 2004),
  • rastgele seçildi (Dawes, 1979),
  • 1 ile negatif ilişkili değişkenler için y, 1 ile ilgili pozitif değişkenler için y (Wainer, 1976).

Ayrıca, değişkenleri dönüştürmek gibi bir tür özellik ölçeklendirmesi kullanmak yaygındır. Z-scores. Yani, bu tür bir model tek değişkenli doğrusal regresyona sadeleştirilebilir

y=a+bv+ε

nerede v=wixve OLS regresyonu kullanılarak kolayca tahmin edilebilir.

Kaynaklar:
Dawes, Robyn M. (1979). Karar vermede uygunsuz lineer modellerin sağlam güzelliği . Amerikalı Psikolog, 34, 571-582.

Graefe, A. (2015). Eşit ağırlıklı öngörücüler kullanarak tahminleri iyileştirme . İşletme Araştırmaları Dergisi, 68 (8), 1792-1799.

Wainer, Howard (1976). Doğrusal modellerde katsayıları tahmin etme: Hiçbir şey yapmaz . Psikolojik Bülten 83 (2), 213.

Dana, J. ve Dawes, RM (2004). Sosyal Bilimin Tahminleri İçin Regresyona Basit Alternatiflerin Üstünlüğü . Eğitim ve Davranış İstatistikleri Dergisi, 29 (3), 317-331.


3
Bu modellerden elde edilen istatistikler ne anlamda "yanlış" olur?
whuber

1
Ne zaman wbens önceden belirtilmiş & btahmin edileceği üzere, bu sadece normal OLS çerçevesindeki çıkarımın geçerliliğini etkilemeyen çeşitli biçimlerde yeterince yaygın olan (örneğin, Glasgow Koma Ölçeği ve Charlson Eş-Morbidite İndeksi) öngörücülerde gerçekleştirilen veri indirgemesidir. Ne zamany belirlemek için kullanılır wbens, standart hatalar & c. dışarı çıkacağım, iyimser yönde düşünürüm.
Scortchi - Monica'yı eski durumuna döndürün

1
Bilgili bir yorum değildi - kağıtlar hala benim "okumak için" yığını üzerinde. Sadece merak ettim: - "neden 'uygunsuz'?" Bir öngörücünün diğer değişkenlerin doğrusal bir kombinasyonu olması olağandışı değildir - birkaç ölçümün ortalaması, ana bileşen puanı, başka bir gerilemeden tahmin, üstel olarak yumuşatılmış bir zaman serisinden seviye veya iyi kurulmuş bir hesaptan hesaplanan değer veya geçici bir dizin. Yanıttan ağırlıkları tahmin etmemek, serbestlik derecelerini arttırır ve daha küçük örnek boyutlarıyla aşırı uymayı önlemeye yardımcı olur.
Scortchi - Monica'yı eski durumuna döndürün

1
Örneğin Beddhu'da (2000), "Basit bir komorbidite ölçeği diyaliz hastalarında klinik sonuçları ve maliyetleri öngörür" Am. J. Med., 108 , 8 model denklemi, sizinkiyle aynı forma sahiptir.xis, diyabet, lenfoma ve c. için gösterge değişkenleri olarak tanımlanır. wis önceden belirtilmiştir. Sanırım söylediğim şey, "uygunsuz" ve "uygun" regresyon modelleri arasındaki ayrımın Tanrı tarafından verilen bir dizixiher biri için "uygun" bir model bir katsayı tahmin edecektir.
Scortchi - Monica'yı eski durumuna döndürün

4
Ne zaman wi=ρ(y,xi), & Eğer ρmodelin uyduğu aynı verilerden tahmin edildi, bu oldukça farklı bir balık su ısıtıcısı olurdu.
Scortchi - Monica'yı eski durumuna döndürün

Yanıtlar:


1

Aslında bana öyle geliyor ki, bu varsayılan kovaryans yapılarının bir çeşididir. Başka bir deyişle, bu bir önceki Bayes modellemesidir.

Bu, parametre sayısı nedeniyle sıradan bir MLR prosedürü üzerinde sağlamlık kazanır (df) azaltılır ve artırılmış atlanan değişken sapma OVB nedeniyle yanlışlık getirir. OVB nedeniyle, eğim düzleştirilir,|β^|<|β|, belirleme katsayısı azalır R^2<R2.

Benim kişisel deneyimim, Bayesci yaklaşımdan üstün olanın daha iyi modelleme kullanmak olduğu; parametreleri dönüştürmek, diğer normları kullanmak ve / veya doğrusal olmayan yöntemleri kullanmak. Yani, sorunun fiziği ve yöntemler düzgün bir şekilde araştırılıp koordine edildikten sonra, F istatistikleri, belirleme katsayısı, vb.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.