«regression» etiketlenmiş sorular

Bir (veya daha fazla) "bağımlı" değişken ile "bağımsız" değişken arasındaki ilişkiyi analiz etme teknikleri.

7
Sürekli bir tahmin değişkeninden ayrılmanın faydası nedir?
Bir modelde kullanmadan önce, sürekli bir yordayıcı değişkenini almanın ve onu parçalara ayırmanın (örn. Quintiles) ne olduğunu merak ediyorum. Bana öyle geliyor ki değişkeni binerek bilgiyi kaybediyoruz. Bu sadece doğrusal olmayan etkileri modelleyebilmemiz için mi? Değişkeni sürekli tutsak ve gerçekten düz bir doğrusal ilişki olmasaydı verilere en iyi şekilde uyacak …

3
Bir örnek: ikili sonuç için glmnet kullanarak LASSO regresyonu
Ben kullanımı ile serpmek başlıyorum glmnetile LASSO Regresyon ilgi benim sonuç dikotom olduğunu. Aşağıda küçük bir sahte veri çerçevesi oluşturdum: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
R kare ne zaman negatif olur?
Anladığım kadarıyla , karesi olduğu için negatif olamaz. Ancak, tek bir bağımsız değişken ve bağımlı değişken olan SPSS'de basit bir doğrusal regresyon yaptım. SPSS çıkışım bana için negatif bir değer verir . Bunu R'den elle hesaplamak isteseydim, pozitif olurdu. Bunu negatif olarak hesaplamak için SPSS ne yaptı?R2R2R^2R2R2R^2R2R2R^2 R=-.395 R squared …

5
Kademeli regresyona modern, kolay kullanılan alternatifler nelerdir?
Yaklaşık 30 bağımsız değişken içeren bir veri kümesine sahibim ve bunlar ile bağımlı değişken arasındaki ilişkiyi araştırmak için genelleştirilmiş bir doğrusal model (GLM) oluşturmak istiyorum. Bu durum için öğretildiğim yöntemin, adım adım gerilemenin artık istatistiksel bir günah olarak kabul edildiğinin farkındayım . Bu durumda hangi modern model seçim yöntemleri kullanılmalıdır?

3
Kement neden Değişken Seçim sağlıyor?
İstatistiksel Öğrenme Öğelerini okudum ve Lasso'nun neden değişken seçim sağladığını ve sırt regresyonunun neden olmadığını bilmek istiyorum. Her iki yöntem de artık kareler toplamını en aza indirir ve parametrelerinin olası değerleri üzerinde bir kısıtlamaya sahiptir . Kement için sınırlama iken, sırt için bazı için .| | β | | 1 …


3
Lojistik regresyon için teşhis?
Doğrusal regresyon için, doğrusal regresyon varsayımlarının ihlal edilip edilmediğini kontrol etmek için teşhis grafiklerini (artıklar grafikleri, Normal QQ grafikleri, vb.) Kontrol edebiliriz. Lojistik regresyon için, lojistik regresyon modelinin uygunluğunun nasıl teşhis edileceğini açıklayan kaynakları bulmakta güçlük çekiyorum. GLM için bazı ders notları kazmak, sadece kalıntıları kontrol etmenin lojistik bir regresyon …

6
Kapalı formlu bir matematik çözümü olduğunda doğrusal regresyon için neden gradyan inişini kullanmalısınız?
Makine Öğrenimi derslerini çevrimiçi olarak alıyorum ve hipotezdeki en uygun değerleri hesaplamak için Gradient Descent'i öğrendim. h(x) = B0 + B1X değerleri aşağıdaki formüle göre kolayca bulabiliyorsak neden Gradient Descent kullanmamız gerekiyor? Bu da ileri ve kolay görünüyor. ancak GD'nin değeri elde etmek için çoklu yinelemeye ihtiyacı var. B1 = …

9
Aykırı değerler doğrusal regresyon analizinde nasıl ele alınmalıdır?
Çoğu zaman istatistiksel bir analiste set veri kümesi verilir ve doğrusal regresyon gibi bir teknik kullanılarak bir modele uyması istenir. Veri setine sıklıkla "Ah evet, bu veri noktalarının bir kısmını topladık - yapabileceklerinizi yapın" gibi bir feragatname eşlik eder. Bu durum hatalı veri olabilecek aykırı değerlerin varlığından büyük ölçüde etkilenen …

7
Çoklu regresyon için minimum örneklem büyüklüğü için kurallar
Sosyal bilimlerde bir araştırma önerisi kapsamında bana şu soru soruldu: Çoklu regresyon için minimum örneklem büyüklüğü belirlenirken her zaman 100 + m (burada m, tahmincilerin sayısıdır) olmuştur. Bu uygun mu? Sık sık farklı kurallarla, benzer soruları çok alıyorum. Ayrıca, çeşitli ders kitaplarında bu tür kurallar okudum. Bazen bir kuralın atıflar …


2
Kapalı formda regresyon parametrelerinin gradient inişle çözülmesi
Andrew Ng'nin makine öğrenim kursunda , doğrusal regresyon ve lojistik regresyon tanıtıyor ve gradyan iniş ve Newton yöntemini kullanarak model parametrelerine nasıl uyulacağını gösteriyor. Degrade inişinin bazı makine öğrenmesi uygulamalarında (örneğin backpropogation) faydalı olabileceğini biliyorum, ancak daha genel bir durumda, parametreleri kapalı formda çözememeniz için herhangi bir neden var - …

8
Mevcut bir değişken (ler) ile tanımlanmış bir korelasyon ile rastgele bir değişken oluşturun
Bir simülasyon çalışması için, mevcut bir değişkenine önceden tanımlanmış (popülasyon) bir korelasyon gösteren rastgele değişkenler oluşturmalıyım .YYY RPaketlere baktım copulave CDVinebelirli bir bağımlılık yapısına sahip rastgele çok değişkenli dağılımlar üretebiliyorum. Bununla birlikte, ortaya çıkan değişkenlerden birini mevcut bir değişkene sabitlemek mümkün değildir. Herhangi bir fikir ve mevcut fonksiyonlara bağlantılar takdir …

12
Doğrusal regresyonla ilgili en yaygın yanlış anlamalar nelerdir?
Merak ediyorum, diğer araştırmacılarla işbirliği konusunda geniş deneyime sahip olanlarınız için, karşılaştığınız lineer regresyon hakkındaki en yaygın yanlış anlamalar nelerdir? Bence vaktinden önceki ortak yanlış anlamaları düşünmek için yararlı bir alıştırma olabilir. İnsanların hatalarını tahmin etmek ve bazı yanlış anlamaların neden yanlış olduğunu açıkça ifade edebilmek Bazı kavram yanılgılarımı kendim …

4
Hangi kanonik korelasyon analizinin yapıldığını nasıl görselleştirin (hangi temel bileşen analizine kıyasla)?
Kanonik korelasyon analizi (CCA), temel bileşen analizi (PCA) ile ilgili bir tekniktir. Bir dağılım grafiği kullanarak PCA veya doğrusal regresyon öğretmek kolay olsa da (google resim aramada birkaç bin örneğe bakın), CCA için benzer bir sezgisel örnek görmedim. Lineer CCA'nın ne yaptığını görsel olarak nasıl açıklayabilirim?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.