Spesifik bir çoklu-doğrusallık ölçüsünü tercih etmek için bir sebep var mı?


22

Birçok giriş değişkeni ile çalışırken, çoğu zaman çoklu bağlanma konusunda endişeliyiz . Çok kutupluluk algılamak, düşünmek ve / veya iletmek için kullanılan çok sayıda çoklu doğrusallık önlemi vardır. Bazı yaygın öneriler:

  1. Belirli bir değişken için çokluR,j2
  2. Belirli bir değişken için tolerans,1-R,j2
  3. Varyans enflasyon faktörü, , belirli bir değişken için VIF'ye=1hoşgörü
  4. Tasarım matrisinin bir bütün olarak koşul numarası:

    v max (özdeğer (X'X))dak (özdeğer (X'X))

(Wikipedia makalesinde ve burada R bağlamında SO konusunda tartışılan başka seçenekler de var.)

İlk üçünün birbirlerinin mükemmel bir işlevi olması, aralarındaki tek olası avantajın psikolojik olacağını göstermektedir. Öte yandan, ilk üç değişken ayrı ayrı incelemenize izin veriyor, ki bu bir avantaj olabilir, ancak durum numarası yönteminin en iyi olduğunu düşündüm.

  • Bu doğru mu? Ne için en iyisi?
  • Durum numarası 'nin kusursuz bir fonksiyonu mu? (Ben olacağını düşünürdüm.) R,j2
  • İnsanlar bunlardan birinin açıklamanın en kolay yolu olduğunu mu düşünüyor? (Bu sayıları sınıf dışında açıklamaya hiç çalışmamıştım, sadece çok sınıflılığın gevşek, niteliksel bir tanımını verdim.)

: O konuda zaten burada ne tamamlayıcı cevaplarını söz kadar ilgili takip gönderdiniz stats.stackexchange.com/questions/173665/...
Girne

Yanıtlar:


15

1990'ların sonlarında, eşlik üzerine tezimi yaptım.

Sonuç, durum indekslerinin en iyisi olduğu yönünde oldu.

Ana sebep, bireysel değişkenlere bakmak yerine , değişken gruplarına bakmanıza izin vermesiydi. Eşdoğrusallık değişken kümelerinin bir işlevi olduğundan, bu iyi bir şeydir.

Ayrıca, Monte Carlo çalışmamın sonuçları sorunlu collinearity için daha iyi hassasiyet gösterdi, ancak uzun zaman önce detayları unuttum.

Öte yandan, açıklaması muhtemelen en zoru. Birçok insan ne olduğunu biliyor . Bu insanların sadece küçük bir alt grubu özdeğerleri duymuştur. Ancak, durum indekslerini teşhis aracı olarak kullandığımda, hiçbir zaman açıklama yapmam istenmedi.R,2

Bununla ilgili daha fazla bilgi için David Belsley'in kitaplarına bakın. Ya da gerçekten istiyorsan, çoklu regresyon için tezimi alabilirim Çoklu Doğrusallık Teşhisi: Bir Monte Carlo çalışması


1
Öyleyse, buradaki VIF'lere bakmak, yanlışlıkla çok kutupluluğun bir sorun olmadığı sonucuna varabilirsiniz, ancak koşul numarasına bakmış olsaydınız, doğru sonucu çıkarmanız daha olası olurdu? Belki bir test gibi bir şey w / daha büyük istatistiksel güç?
gung - Monica

4
+1. Neyse ki, durum numarasını açıklamak için zaten bu sitede göze çarpan bir konu var: tasarım değişkenlerinin ikinci dereceden tanımında bir nokta bulutu olarak bulunan maksimum bozulma. Bozulma ne kadar büyük olursa, puanlar bir alt uzayda daha fazla yatma eğilimindedir. Bu geometrik içgörü aynı zamanda merkezlenmiş bir tasarım matrisinin şartlanmasının neden ham tasarım matrisininkinden daha iyi olduğunu gösteriyor.
whuber

1
“Doğru” sonucun tam olarak ne olduğunu tanımlamak zor; ancak çıktıda büyük değişiklikler üreten verilerdeki küçük değişikliklerle ilgisi olmalıdır. Hatırladığım kadarıyla durum endeksleri bununla daha doğrudan ilişkiliydi. Fakat en büyük şey, değişken kümelerini ve onların eşlik derecelerini görmenizi sağlayan varyans oranlarını elde etmektir. (Tabii ki, tüm bunlar 14 yıl önceydi .... ama bir şeylerin değiştiğini sanmıyorum. Önlemler aynı. Ama hafızam mükemmel olmayabilir).
Peter Flom - Eski Monica

3
Gung, burada bir anahtar nokta, durum sayısının koordinatlardan bağımsız olmasıdır: verilerin (ortogonal) doğrusal rekombinasyonları altında değişmeden kalır. Bu nedenle, bireysel değişkenler hakkında hiçbir şey ifade edemez, ancak koleksiyonun tüm özelliklerini yakalamalıdır. Bu sayede kullanmanız, değişkenlerinizin nasıl ifade edildiği ile sizi yanlış yönlendirilmenizi kısmen önler.
whuber

1
Tezini henüz bitirmek için çok fazla batak oldum, ama şu ana kadar gerçekten çok yardımcı oldu. Tekrar teşekkürler.
gung - Reinstate Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.