«multicollinearity» etiketlenmiş sorular

Tahmin değişkenleri arasında güçlü bir doğrusal ilişki olduğunda durum, böylece korelasyon matrisi (neredeyse) tekil hale gelir. Bu "kötü durum" her bir öngörücünün oynadığı benzersiz rolü belirlemeyi zorlaştırır: tahmin problemleri ortaya çıkar ve standart hatalar artar. İki değişkenli çok yüksek korelasyonlu prediktörler, çoklu bağışıklığa bir örnektir.

3
Python'daki collinear değişkenleri sistematik olarak nasıl kaldırırım? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Soruyu , Çapraz Doğrulanmış için konuyla ilgili olacak şekilde güncelleyin . 2 yıl önce kapalı . Şimdiye kadar, korelasyon tablolarına bakarak ve belirli bir eşiğin üzerindeki değişkenleri kaldırarak veri hazırlama sürecinin bir parçası olarak …

2
Regresyonda nitel değişken kodlama “tekilliklere” yol açar
"Kalite" adı verilen bağımsız bir değişkenim var; bu değişkenin 3 tepki yöntemi vardır (kötü kalite; orta kalite; yüksek kalite). Bu bağımsız değişkeni çoklu doğrusal regresyonuma tanıtmak istiyorum. Bir ikili bağımsız değişken (kukla değişken, ben kod 0/ olabilir 1) olduğunda, bir çoklu doğrusal regresyon modeline tanıtmak kolaydır. Ancak 3 yanıt yöntemi …

1
Lojistik Regresyon - Çoklu Doğrusal Sorunlar / Tuzaklar
Lojistik Regresyonda, doğrudan OLS regresyonunda olduğu gibi çoklu doğrusallık konusunda endişelenmeye ihtiyaç var mı? Örneğin, çoklu doğrusallığın bulunduğu lojistik regresyon ile, Beta katsayılarından çıkarım konusunda dikkatli olmanız gerekir (OLS regresyonunda olduğu gibi)? OLS regresyonu için yüksek çoklu bağlantıya yönelik bir "düzeltme" sırt regresyonudur, lojistik regresyon için böyle bir şey var …

1
Sıfır hipotezi altında değiştirilebilir örneklerin ardındaki sezgi nedir?
Permütasyon testleri (randomizasyon testi, yeniden randomizasyon testi veya kesin test olarak da adlandırılır) çok faydalıdır ve örneğin normal dağıtım varsayımı t-testkarşılanmadığında ve değerlerin parametrik olmayan test Mann-Whitney-U-test, daha fazla bilginin kaybolmasına neden olur. Bununla birlikte, bu tür bir test kullanılırken bir ve sadece bir varsayım göz ardı edilmemelidir, örneklerin sıfır …
16 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

3
Kollearlıktan ne zaman bahsedebiliriz
Doğrusal modellerde, açıklayıcı değişkenler arasında bir ilişki olup olmadığını kontrol etmeliyiz. Eğer çok fazla korelasyon gösterirlerse, o zaman eşbiçimlilik vardır (yani, değişkenler kısmen birbirlerini açıklar). Şu anda sadece açıklayıcı değişkenlerin her biri arasındaki ikili korelasyona bakıyorum. Soru 1: Çok fazla korelasyon olarak ne sınıflandırır? Örneğin, 0.5 arası bir Pearson korelasyonu …

1
Bir değişken diğerlerinin lineer bir kombinasyonu olmasına rağmen, bu regresyon neden mükemmel çoklu doğrusallık nedeniyle başarısız DEĞİLDİR?
Bugün, küçük bir veri kümesiyle oynuyordum ve mükemmel çoklu bağlantı nedeniyle başarısız olmasını beklediğim basit bir OLS regresyonu yaptım . Ancak, olmadı. Bu, çoklu bağlantı konusundaki anlayışımın yanlış olduğunu ima ediyor. Sorum şu: Nerede yanılıyorum? Değişkenlerimden birinin diğerlerinin doğrusal bir kombinasyonu olduğunu gösterebileceğimi düşünüyorum. Bu, tam sıralaması olmayan bir regresör …

2
VIF, durum Dizini ve özdeğerler
Şu anda veri kümelerimdeki çoklu bağlantıyı değerlendiriyorum. Hangi VIF eşik değerleri ve altındaki / yukarıdaki koşul indeksi bir sorun olduğunu gösteriyor? VIF: VIF bir sorun olduğunu duydum .≥10≥10\geq 10 İki problem değişkeni kaldırıldıktan sonra her değişken için VIF . Değişkenlerin daha fazla tedaviye ihtiyacı var mı veya bu VIF iyi …


3
Kmeans çalıştırmadan önce korelasyonlu / doğrusal olan değişkenleri düşürmem gerekir mi?
Müşteri kümelerini tanımlamak için kmeans kullanıyorum. Kümeleri tanımlamak için yaklaşık 100 değişkenim var. Bu değişkenlerin her biri, bir müşterinin bir kategoriye yaptığı harcama yüzdesini temsil eder. Yani, 100 kategorim varsa, bu değişkenlerin toplamı her müşteri için% 100 olacak şekilde 100 değişkenim var. Şimdi, bu değişkenler birbiriyle güçlü bir şekilde ilişkilidir. …

4
Doğrusal olmayan modeller kullanılırken çoklu-eş-doğrusallıktan endişe edilmeli mi?
Diyelim ki çoğunlukla kategorik özelliklere sahip bir ikili sınıflandırma problemimiz var. Öğrenmek için bazı doğrusal olmayan modeller (örneğin, XGBoost veya Rastgele Ormanlar) kullanıyoruz. Kişi hala çok eşbiçimli olma konusunda endişelenmeli mi? Neden? Yukarıdakilerin cevabı doğruysa, bu tip doğrusal olmayan modelleri kullandığını düşünerek nasıl mücadele etmeliyiz?

2
Yalnızca bilmek Doğrusal regresyon , değil doğrudan
Varsayalım .Xβ=YXβ=YX\beta =Y Bilmiyoruz , tam olarak her etkenin, sadece onun korelasyon .YYYXtYXtYX^\mathrm{t}Y Sıradan en küçük kareler (OLS) çözümü ve bir sorun yoktur.β=(XtX)−1XtYβ=(XtX)−1XtY\beta=(X^\mathrm{t} X)^{-1} X^\mathrm{t}Y Ancak tekil (çok doğrusal doğrusallık) yakınında olduğunu ve optimal sırt parametresini tahmin etmeniz gerektiğini varsayalım . Tüm yöntemlerin kesin değerlerine ihtiyacı olduğu görülmektedir .XtXXtXX^\mathrm{t}XYYY Yalnızca …

2
Yığın testleri nedir?
Bir soruya yanıt olarak çoklu doğrusal varlığında model seçimi , Frank Harrell önerdi : Tüm değişkenleri modele koyun ancak rakip değişkenlerin etkilerine göre ayarlanmış bir değişkenin etkisini test etmeyin ... Rakip değişkenlerin yığın testleri güçlüdür, çünkü eş değişkenler genel olarak çoklu serbestlik derecesi ilişkilendirme testinde güçlerini birleştirir. değişkenleri tek tek …

6
Bireysel regresyonlar önemli olduğunda, ancak VIF'ler düşük olduğunda çoklu bağlantı
tahmin etmek için kullandığım 6 değişkenim var ( ) . Veri analizimi yaparken önce çoklu doğrusal regresyon denedim. Bundan sadece iki değişken anlamlıydı. Bununla birlikte, her bir değişkeni ayrı ayrı karşılaştıran doğrusal bir regresyon çalıştırdığımda , biri hariç hepsi anlamlıydı ( , 0.01'den 0.001'e kadar herhangi bir yerde). Bunun çoklu …

3
Değişkenleri dışarı atmadan lineer regresyonda yüksek çoklu-eş-doğrusallık ile kararsız tahminlerini nasıl ele alabilirsiniz ?
Yüksek çoklu eş-doğrusallık ile doğrusal regresyonda beta kararlılığı? Diyelim ki doğrusal bir regresyonda, ve değişkenleri yüksek çoklu sahiptir (korelasyon 0.9 civarındadır).x1x1x_1x2x2x_2 katsayı kararlılığı konusunda endişeliyiz, bu nedenle çoklu-eş-doğrusallığı tedavi etmek zorundayız.ββ\beta Ders kitabı çözümü sadece değişkenlerden birini atmak olacaktır. Ancak değişkenleri atarak yararlı bilgileri kaybetmek istemiyoruz. Herhangi bir öneri?

2
Çoklu doğrusallık ile başa çıkmak
Paket vif()yöntemini kullanarak car, bir modeldeki girdilerin çok doğrusallık derecesini hesaplayabileceğimizi öğrendim . Gönderen wikipedia eğer vifdeğer büyükse 5o zaman giriş çoklu bağlantı problemi yaşayan olduğunu düşünebilirsiniz. Örneğin, lm()yöntemi kullanarak doğrusal bir regresyon modeli geliştirdim ve vif()aşağıdaki gibi verir. Gördüğümüz gibi, girişler ub, lbve tbçoklu doğrusal yaşıyorlar. vif(lrmodel) tb ub …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.