«regression» etiketlenmiş sorular

Bir (veya daha fazla) "bağımlı" değişken ile "bağımsız" değişken arasındaki ilişkiyi analiz etme teknikleri.

2
Etkili nokta, yüksek kaldıraç noktası ve aykırı değerlerin tam anlamı ve karşılaştırması?
Wikipedia'dan Etkili gözlemler , regresyon modelinin tahminleri üzerinde nispeten büyük etkisi olan gözlemlerdir. Wikipedia'dan Kaldıraç noktaları , varsa, bağımsız değişkenlerin aşırı veya dış değerlerinde yapılan gözlemlerdir, böylece komşu gözlemlerin eksikliği, yerleştirilmiş regresyon modelinin söz konusu gözleme yakın olacağı anlamına gelir. Aşağıdaki Wikipedia neden karşılaştırması Etkili bir nokta tipik olarak yüksek …





7
Rastgele orman aşırı uyuyor
Ben scikits-learn Rastgele Orman Regresyonu kullanmaya çalışıyorum. Sorun gerçekten yüksek bir test hatası alıyorum: train MSE, 4.64, test MSE: 252.25. Verilerim şöyle görünüyor: (mavi: gerçek veriler, yeşil: tahmin edilen): Eğitim için% 90, test için% 10 kullanıyorum. Bu, birkaç parametre kombinasyonunu denedikten sonra kullandığım kod: rf = rf = RandomForestRegressor(n_estimators=10, max_features=2, …

1
Değişkenlerdeki hatalar regresyonu: üç siteden veri toplamak için geçerli mi?
Son zamanlarda bir istemci bana bir bootstrap analizi yapmak için geldi çünkü bir FDA inceleme değişkenleri hataları regresyon geçersiz olduğunu söyledi, çünkü sitelerden veri toplarken analiz iki sitenin bazı örnekleri dahil üç siteden veri havuzu içerir aynısı. ARKA FON Müşteri, göstermek istediği yeni bir test yöntemine sahip, mevcut bir onaylanmış …

3
En güçlü korelasyon ile veri noktalarının alt kümesini seçmek için otomatik prosedür?
En güçlü korelasyona sahip (sadece iki boyut boyunca) daha büyük bir havuzdan veri noktalarının alt kümesini seçmek için bazı standart prosedürler var mı (referans olarak gösterilebilir)? Örneğin, 100 veri noktanız olduğunu varsayalım. X ve Y boyutları boyunca mümkün olan en güçlü korelasyona sahip 40 noktadan oluşan bir alt küme istiyorsunuz. …

2
Farklı Düzeltilmiş formülleri arasında nasıl seçim yapılır ?
Aklımda tarafından ayarlanmış R kare formülleri var: Hâlâ SPSS'de kullanılan olduğuna inanıyorum Ezekiel (1930). R2adjusted=1−(N−1)(N−p−1)(1−R2)Radjusted2=1−(N−1)(N−p−1)(1−R2)R^2_{\rm adjusted} = 1 - \frac{(N-1)}{(N-p-1)} (1-R^2) Olkin ve Pratt (1958) R2unbiased=1−(N−3)(1−R2)(N−p−1)−2(N−3)(1−R2)2(N−p−1)(N−p+1)Runbiased2=1−(N−3)(1−R2)(N−p−1)−2(N−3)(1−R2)2(N−p−1)(N−p+1)R^2_{\rm unbiased} = 1 - \frac{(N-3)(1-R^2)}{(N-p-1)} - \frac{2(N-3)(1-R^2)^2}{(N-p-1)(N-p+1)} Hangi koşullarda (eğer varsa) 'tarafsız' R ^ 2'ye 'ayarlanmış'ı tercih etmeliyim R2R2R^2? Referanslar Hezekiel, M. (1930). Korelasyon …

2
Büyük bir veri kümesi için önem düzeyi nasıl seçilir?
N 200.000 civarında bir veri kümesiyle çalışıyorum. Regresyonlarda, çok küçük etki boyutlarıyla ilişkili çok küçük önem değerleri << 0.001 görüyorum, örneğin r = 0.028. Bilmek istediğim, örneklem büyüklüğü ile ilgili uygun bir anlamlılık eşiğine karar vermenin ilkeli bir yolu var mı? Etki büyüklüğünün bu kadar büyük bir örnekle yorumlanmasında başka …



5
Fiyatlar nasıl modellenir?
Diye sordum bu soruyu matemathics Stack Exchange sitesinde ve burada sormak önerildi. Bir hobi projesi üzerinde çalışıyorum ve aşağıdaki sorunla ilgili yardıma ihtiyacım var. Biraz bağlam Diyelim ki özelliklerin açıklaması ve fiyatı olan bir öğe koleksiyonu var. Arabaların ve fiyatların bir listesini düşünün. Tüm otomobiller, motor boyutu, renk, beygir gücü, …

5
Biri diğer birkaç bilgisayardan bir ana bileşeni (PC) tahmin etmek için çoklu regresyon kullanabilir mi?
Bir süre önce, R-yardım posta listesindeki bir kullanıcı, bir regresyonda PCA skorlarını kullanmanın sağlamlığını sordu. Kullanıcı başka bir PC'deki varyasyonu açıklamak için bazı PC skorlarını kullanmaya çalışıyor (tüm tartışmaya buradan bakın ). Cevap hayırdı, bu ses değil çünkü PC'ler birbirine dik. Birisi bunun neden böyle olduğunu daha ayrıntılı olarak açıklayabilir …
15 regression  pca 


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.