Çoklu regresyonda 'kontrol etme' ile diğer değişkenleri yoksayma arasında bir fark var mı?


50

Açıklayıcı bir değişkenin çoklu regresyondaki katsayısı bize, açıklayıcı değişkenin bağımlı değişkenle ilişkisini gösterir. Bütün bunlar diğer açıklayıcı değişkenleri kontrol ederken.

Şimdiye kadar nasıl izledim:

Her katsayı hesaplanırken, diğer değişkenler dikkate alınmaz, bu yüzden göz ardı edilmelerini düşünüyorum.

Öyleyse, “kontrollü” ve “yok sayılan” terimlerinin birbirinin yerine kullanılabileceğini düşündüğümde haklı mıyım?


2
İki kişiye teklif vermek için ilham verdiğinizi düşündüğünüzü görene kadar bu konuda çok heyecanlanmadım.
DW

1
Bu soruyu motive eden başka bir yerde yaptığımız konuşmanın farkında değildiniz, @DWin. Bunu bir yorumda açıklamaya çalışmak çok fazlaydı, bu yüzden OP'den resmi bir soru yapmasını istedim. Aslında b / t ayrımını göz ardı etmenin ve regresyondaki diğer değişkenleri kontrol etmenin açıkça ortaya çıkması bence harika bir soru, ve burada tartışıldığı için memnunum.
gung - Monica’yı eski durumuna getirme

2
aynı zamanda ilk şemasına bakınız burada
Glen_b

1
Bu soruda kullanılan veriler mevcut mudur, bu yüzden kendimizi eğitici bir örnek olarak çalıştırabiliriz.
Larry,

Yanıtlar:


88

YX1X2YX1

  1. X1YX2
    Y=β0+β1X1+β2X2
  2. X1Y X2

    Y=β0+β1X1

X1Yβ^1X1X2

görüntü tanımını buraya girin

X1X2X2X2 X2X2X2=1X2=2X2=3X1YX2 X2

görüntü tanımını buraya girin

Arasındaki ayrımın düşünmek için başka bir yol yok sayarak ve kontrol başka değişken için, bir arasındaki farkı dikkate almaktır marjinal dağılımı ve koşullu dağılımı . Bu rakamı düşünün:

görüntü tanımını buraya girin

( Buradaki cevabımdan alınmıştır: Koşullu Gauss dağılımlarının ardındaki sezgi nedir? )

YYXYX1=25X1=45X1


2
Gung, bu aydınlatıcı, bu soruya cevabımda 'yoksay' kelimesini kullanarak hata yaptığım için memnunum. Şimdi istatistiksel paketlerin diğer değişkenler için tam olarak nasıl 'kontrol' olduğunu bulmaya çalışacağım. (İlk düşüncem, pearson korelasyon katsayısı gibi bir ölçü kullanmalarıdır. Birçok açıklayıcı değişkenle birlikte işler karmakarışık olurdu.) Bu cevap için teşekkür ederiz!
Siddharth Gopi

1
Bir şey değil, @ garciaj, henüz bitmediysem ;-). Başka bir rakam arıyorum; Sıfırdan yapmak zorunda kalabilirim.
dediklerinin - Monica Yeniden

4
İlk şekildeki en önemli fikir, bu noktaların, bilgisayar ekranındaki düz bir düzlemde kırmızı daireler, ekranın biraz önünde yeşil bir paralel düzlemde mavi üçgenler bulunan üç boyutlu bir uzayda uzanmasıdır. biraz önünde bir uçakta artılar. Regresyon düzlemi, aşağı doğru sağa doğru eğim yapar, ancak ekrandan size doğru ilerlerken yukarı doğru eğilir. Bu fenomenin, X1 ve X2'nin korele olması nedeniyle oluştuğunu, eğer ilişkisiz olsaydı, tahmini betaların aynı olacağını unutmayın.
gung - Monica'yı yeniden yerleştirme

1
Tahmin ediciler arasındaki bu tür bir korelasyon (örneğin, gung senaryosu) genellikle Simpson'un paradoksunun bir örneğini oluşturur . Üçten fazla değişkenli bir evrende, çıkarımlarınızı gizleyebileceğini hatırlamak akıllıca olur (ohh!).
FairMiles

2
@ MSIS, bir modeldeki bir değişkeni kontrol ettiğinizde, modeldeki diğer her şeyi tahmin etmek amacıyla model sabit tutmaya çalışır. Ancak, bu sadece bir deneme girişimidir ve rastgele hataya tabidir, bu nedenle fiziksel olarak belirli bir değerde sabitlenmiş bir değişkenle bir çalışma yapsanız, elde edeceğinizle aynı değildir.
gung - Reinstate Monica

8

İhmal edilmezler . 'Görmezden gelinirlerse' modelde olmazlardı. İlgi açıklayıcı değişkenin tahmini koşullu diğer değişkenlere. Tahmin, modeldeki diğer değişkenlerin "bağlamında" veya "etkisine olanak sağlayan" şeklinde oluşturulmuştur.


Tahmin elbette diğer değişkenlere tabidir. Fakat modelde sözde diğer faktörleri de tanıtarak arındırmamız gerekiyor. Ancak, bazen bu faktörler kategorik nitelikte olabilir ve geçerli bir çözüm vermekten daha fazla soruna neden olabilir.
Subhash C. Davar
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.