Doğrusal regresyonda varsayımlara ihtiyaç nedir?


15

Doğrusal regresyonda, aşağıdaki varsayımları yaparız

  • Her bir öngörücünün değer kümesinde yanıtın ortalaması , öngörücülerin Doğrusal bir işlevidir.( x 1 i , x 2 i , )E(Yi)(x1i,x2i,)
  • hataları εiBağımsızdır.
  • εi her bir değer kümesindeki ε_i hataları ( x_ (x1i,x2i,) Normal olarak dağıtılır.
  • εi her bir değer kümesindeki ε_i hataları ( x_ (x1i,x2i,) , Eşit varyanslara sahiptir ( σ2 ile gösterilir σ2).
  • Doğrusal regresyonu çözebilmemizin yollarından biri, şu şekilde yazabileceğimiz normal denklemlerdir.

    θ=(XTX)1XTY

    Matematiksel bir bakış açısından, yukarıdaki denklemin tersine çevrilebilir olması için sadece XTX gerekir. Öyleyse, neden bu varsayımlara ihtiyacımız var? Birkaç meslektaşım diye sordum ve bunun iyi sonuçlar elde etmek olduğunu ve normal denklemlerin bunu başarmak için bir algoritma olduğunu söylediler. Fakat bu durumda, bu varsayımlar nasıl yardımcı olur? Onları korumak daha iyi bir model elde etmeye nasıl yardımcı olur?


    2
    Normal formüllerle katsayı güven aralıklarını hesaplamak için normal dağılım gereklidir. CI hesaplamasının diğer formülleri (sanırım Beyaz olduğunu) normal olmayan dağılıma izin verir.
    keiv.fly

    Modelin çalışması için her zaman bu varsayımlara ihtiyacınız yoktur. Sinir ağlarında, lineer regresyonlar vardır ve sağladığınız formül gibi rmse'yi en aza indirirler, ancak büyük olasılıkla varsayımların hiçbiri geçerli değildir. Normal dağılım yok, eşit varyans yok, doğrusal fonksiyon yok, hatalar bile bağımlı olabilir.
    keiv.fly


    1
    @Alexis Bağımsız değişkenler kesinlikle bir varsayım değildir (ve bağımlı değişken de bir varsayım değildir. Değişkenleri atlamaktan kaçınmak iyi olsa da, "atlanan değişken yok" gerçekten ek bir varsayım değildir - listelenen ilk varsayım gerçekten bununla ilgilenir.
    Dason

    1
    @ Donan Bağlantımın geçerli yorumlama için zorunlu olan "atlanan değişken yok" unun oldukça güçlü bir örneğini verdiğini düşünüyorum. Ben de iid (öngörücüler üzerinde koşullu, evet) gerekli olduğunu düşünüyorum, rastgele yürüyüşler ile iid olmayan tahmin başarısız olabilir (şimdiye kadar sadece ortalama tahmin başvurmak) mükemmel bir örnek sağlar.
    Alexis

    Yanıtlar:


    19

    Haklısınız - noktalara en az kareler çizgisi sığdırmak için bu varsayımları yerine getirmeniz gerekmez. Sonuçları yorumlamak için bu varsayımlara ihtiyacınız vardır. Örneğin, bir girişi ile arasında bir ilişki olmadığı varsayılarak , en azından regresyondan gördüğümüz kadar büyük bir katsayı elde etme olasılığı nedir? Y β 1X1Yβ1


    17

    Anscombe'un dörtlüsü imajını Wikipedia'dan deneyin, bu varsayımlardan bazıları açıkça yanlış olduğunda doğrusal regresyonu yorumlamakla ilgili potansiyel konular hakkında fikir edinmek için: temel tanımlayıcı istatistiklerin çoğu dördünde de aynıdır (ve bireysel değerleri sağ alttaki hariç hepsi aynı) xi

    https://upload.wikimedia.org/wikipedia/commons/thumb/e/ec/Anscombe%27s_quartet_3.svg/1280px-Anscombe%27s_quartet_3.svg.png


    Anscombe'un ardından atlanan değişken varsayımını ihlal etmenin neye benzeyebileceğini gösteren bir resim yaptım . Hala iid varsayımının ihlali Anscombe benzeri bir örnek üzerinde çalışıyor .
    Alexis

    3

    Doğrusal bir modele uyması için bu varsayımlara ihtiyacınız yoktur. Bununla birlikte, parametre tahminleriniz taraflı olabilir veya minimum varyansa sahip olmayabilir. Varsayımları ihlal etmek, örneğin bir güven aralığı oluşturmak gibi, regresyon sonuçlarını yorumlamada kendinizi zorlaştıracaktır.


    1

    Tamam, şu ana kadar cevaplar şöyle: Varsayımları ihlal edersek kötü şeyler olabilir. İlginç yönün şu olduğuna inanıyorum: İhtiyacımız olan tüm varsayımlar (aslında yukarıdakilerden biraz farklı) karşılandığında, lineer regresyonun en iyi model olduğundan neden ve nasıl emin olabiliriz?

    Bu sorunun cevabının şöyle olduğunu düşünüyorum: Eğer bu sorunun cevabında olduğu gibi varsayımlar yaparsak, koşullu yoğunluğu hesaplayabiliriz . Burdan şunu hesaplayabilir (en koşullu beklenti faktörizasyonu ) ve gerçekten lineer regresyon fonksiyonu olduğunu görüyoruz. Sonra kullanmak bu bu doğru risk açısından en iyi fonksiyon olduğunu görmek için.E [ Y i | X i = x i ] x ip(yi|xi)E[Yi|Xi=xi]xi


    0

    İki temel varsayım

    1. Gözlemlerin bağımsızlığı
    2. Ortalama varyansla ilgili değil

    Bkz. Julian Faraway'in kitabındaki tartışma .

    Bunların ikisi de doğruysa, OLS, listelediğiniz diğer varsayımlardaki ihlallere şaşırtıcı bir şekilde dirençlidir.

    Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
    Licensed under cc by-sa 3.0 with attribution required.