«multicollinearity» etiketlenmiş sorular

Tahmin değişkenleri arasında güçlü bir doğrusal ilişki olduğunda durum, böylece korelasyon matrisi (neredeyse) tekil hale gelir. Bu "kötü durum" her bir öngörücünün oynadığı benzersiz rolü belirlemeyi zorlaştırır: tahmin problemleri ortaya çıkar ve standart hatalar artar. İki değişkenli çok yüksek korelasyonlu prediktörler, çoklu bağışıklığa bir örnektir.

9
Doğrusal regresyonda çoklu bağlantı mekanizmasının neden bir sorun olduğu konusunda sezgisel bir açıklama var mı?
Wiki, çoklu bağlantı doğrusallık regresyonunda bir sorun olduğunda ortaya çıkan sorunları tartışır . Temel problem, çoklu doğrusallık, bağımsız değişkenlerin bağımlı değişkenler üzerindeki etkisinin değerlendirilmesini çok zorlaştıran kararsız parametre tahminleriyle sonuçlanır. Ben sorunları geride teknik nedenleri anlamak (ters çevirmek için mümkün olmayabilir , kötü koşullanmış vs) ama bu sorun için daha …

9
Neden önemli bir F istatistiği (p <.001), ancak önemli olmayan regresör t-testleri elde etmek mümkündür?
Çoklu bir doğrusal regresyonda, neden oldukça anlamlı bir F istatistiğine sahip olmak mümkündür (p &lt;.001), ancak tüm regresörün t testlerinde p değeri çok yüksek? Benim modelimde 10 adet regülatör var. Biri p-değeri 0.1, geri kalanı 0.9'un üstünde Bu sorunla ilgilenmek için takip eden soruya bakınız .

1
Hangi korelasyon bir matrisi tekil kılar ve tekillik veya tekilliğe yakınlığın etkileri nelerdir?
Farklı matrisler üzerinde bazı hesaplamalar yapıyorum (çoğunlukla lojistik regresyonda) ve genellikle "Matrix tekildir" hatasını alıyorum, burada geri dönüp korelasyonlu değişkenleri silmeliyim. Buradaki sorum, "yüksek" korelasyonlu bir matris olarak ne düşünürsünüz? Bu sözcüğü temsil etmek için bir eşik değer korelasyon var mı? Bir değişkenin bir başkasıyla 0.97 olması halinde, bu bir …

3
Çoklu regresyon modelinde korelasyon belirleyicilerinin olmasının etkisi nedir?
Doğrusal modeller sınıfımda iki yordayıcının bağıntılı olması ve her ikisinin de bir modele dahil edilmesi durumunda birinin önemsiz olacağını öğrendim. Örneğin, bir evin büyüklüğünü ve yatak odası sayısının korele olduğunu varsayın. Bu iki öngörücüyü kullanan bir evin maliyetini tahmin ederken, ikisi de aynı bilgiyi sağladığı için bunlardan biri düşebilir. Sezgisel …

6
Modern istatistik / makine öğreniminde neden çoklu doğrusallık kontrol edilmiyor?
Geleneksel istatistiklerde, bir model oluştururken, varyans enflasyon faktörünün (VIF) tahminleri gibi yöntemleri kullanarak çok doğrusallığı kontrol ediyoruz, ancak makine öğreniminde, bunun yerine özellik seçimi için düzenlileştirme kullanıyoruz ve özelliklerin birbiriyle ilişkili olup olmadığını kontrol etmiyoruz. hiç. Neden bunu yapıyoruz?

2
Rastgele orman çarpıtma doğruluğu ve özellik seçimindeki yüksek korelasyonlu değişkenler olmaz mı?
Anladığım kadarıyla, yüksek korelasyonlu değişkenler, rastgele orman modelinde çoklu-derinlik sorunlarına neden olmayacak (Lütfen hatalıysam düzeltin). Bununla birlikte, diğer taraftan, benzer bilgileri içeren çok fazla değişkenim varsa, model bu sette diğerlerinden çok daha fazla ağırlık alır mı? Örneğin, aynı tahmine dayalı güce sahip iki bilgi seti (A, B) vardır. Değişken , …

3
Hangi değişken enflasyon faktörü kullanmalıyım: veya ?
vifR paketindeki işlevi kullanarak varyans enflasyon faktörlerini yorumlamaya çalışıyorum car. İşlev hem genelleştirilmiş bir hem de . Göre yardım dosyası , ikinci değerdirVIFVIF\text{VIF}GVIF1/(2⋅df)GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Güven elipsoidinin boyutunu ayarlamak için, işlev ayrıca GVIF ^ [1 / (2 * df)] değerini de basar, burada df terimi ile ilişkili serbestlik dereceleridir. Bu açıklamanın anlamını …

3
Değişken seçimi yaparken çoklu doğrusallık ile nasıl başa çıkılır?
9 sürekli bağımsız değişken içeren bir veri kümem var. Bir modele tek bir yüzde (bağımlı) değişkene uyacak şekilde bu değişkenler arasından seçim yapmaya çalışıyorum Score. Ne yazık ki, bazı değişkenler arasında ciddi bir eşliklilik olacağını biliyorum. stepAIC()Değişken seçimi için R'deki işlevi kullanmayı denedim , ancak bu yöntem garip bir şekilde …

3
Doğrusal ve doğrusal olmayan regresyon modelleri arasındaki farkı nasıl anlatabilirim?
Lineer olmayan regresyon SAS Non Linear ile ilgili aşağıdaki linki okuyordum . “Doğrusal Olmayan Regresyona Karşı Doğrusal Regresyon” adlı ilk bölümü okuduğumdaki anlayış, aşağıdaki denklemin aslında doğrusal bir regresyon olduğuydu, doğru mu? Öyleyse neden? y=b1x3+b2x2+b3x+cy=b1x3+b2x2+b3x+cy = b_1x^3 + b_2x^2 + b_3x + c Am I also to understand that in …

2
Eş zamanlılık teşhisi sadece etkileşim terimi dahil edildiğinde problemlidir
ABD ülkelerinde bir gerileme yürüttüm ve 'bağımsız' değişkenlerimde eşitliğini kontrol ediyorum. Belsley, Kuh ve Welsch Regresyon Teşhisi , Durum Endeksi ve Varyans Ayrışma Oranlarına bakmayı önerir: library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition Index Variance Decomposition Proportions (Intercept) inc09_10k unins09 sqmi_log pop10_perSqmi_log phys_per100k nppa_per100k black10_pct hisp10_pct elderly09_pct inc09_10k:unins09 …

5
Karma doğrusal modelde çoklu bağlantı doğrusallığı nasıl test edilir ve önlenir?
Şu anda bazı karışık efektli doğrusal modeller kullanıyorum. R içinde "lme4" paketini kullanıyorum. Modellerim şu formu alıyor: model &lt;- lmer(response ~ predictor1 + predictor2 + (1 | random effect)) Modellerimi çalıştırmadan önce, öngörücüler arasında olası çoklu bağlantı olup olmadığını kontrol ettim. Bunu ben yaptım: Tahmin edicilerin bir veri çerçevesi oluşturun …

2
PCA çoklu bağlantı altında kararsız mı?
Bir regresyon durumunda, bir dizi yüksek korelasyonlu değişkeniniz varsa, bunun tahmin edilen katsayılardaki dengesizlikten dolayı genellikle "kötü" olduğunu biliyorum (varyans belirleyici sıfıra giderken sonsuzluğa gider). Sorum şu, “kötülüğün” bir PCA durumunda da devam edip etmeyeceği. Herhangi bir PC için katsayılar / yükler / ağırlıklar / özvektörler kovaryans matrisi tekil hale …


1
Spesifik bir çoklu-doğrusallık ölçüsünü tercih etmek için bir sebep var mı?
Birçok giriş değişkeni ile çalışırken, çoğu zaman çoklu bağlanma konusunda endişeliyiz . Çok kutupluluk algılamak, düşünmek ve / veya iletmek için kullanılan çok sayıda çoklu doğrusallık önlemi vardır. Bazı yaygın öneriler: Belirli bir değişken için çokluR,2jR,j2R^2_j Belirli bir değişken için tolerans,1 - R2j1-R,j21-R^2_j Varyans enflasyon faktörü, , belirli bir değişken …

1
Çoklu regresyondaki yordayıcılar arasında yüksek korelasyon ile nasıl başa çıkılır?
Aşağıdaki gibi bir makalede bir referans buldum: Tabachnick &amp; Fidell'e (1996) göre, iki değişkenli korelasyonu .70'den fazla olan bağımsız değişkenler çoklu regresyon analizine dahil edilmemelidir. Sorun: Çoklu regresyon tasarımında,&gt; .80, VIF'ler yaklaşık .2 - .3, Tolerans ~ 4-5 ile ilişkili 3 değişken kullandım. Bunlardan hiçbirini dışlayamıyorum (önemli öngörücüler ve sonuç). …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.