«lasso» etiketlenmiş sorular

Regresyon modelleri için katsayıları sıfıra indiren ve bir kısmını sıfıra eşitleyen bir düzenleme yöntemi. Böylece kement özellik seçimini gerçekleştirir.

3
Kement vs sırtını ne zaman kullanmalıyım?
Diyelim ki çok sayıda parametre tahmin etmek istiyorum ve bazılarını cezalandırmak istiyorum çünkü diğerlerine kıyasla daha az etkili olmaları gerektiğine inanıyorum. Hangi ceza planının kullanılacağına nasıl karar verebilirim? Sırt regresyonu ne zaman daha uygun olur? Kement'i ne zaman kullanmalıyım?




3
Bir örnek: ikili sonuç için glmnet kullanarak LASSO regresyonu
Ben kullanımı ile serpmek başlıyorum glmnetile LASSO Regresyon ilgi benim sonuç dikotom olduğunu. Aşağıda küçük bir sahte veri çerçevesi oluşturdum: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
Kement neden Değişken Seçim sağlıyor?
İstatistiksel Öğrenme Öğelerini okudum ve Lasso'nun neden değişken seçim sağladığını ve sırt regresyonunun neden olmadığını bilmek istiyorum. Her iki yöntem de artık kareler toplamını en aza indirir ve parametrelerinin olası değerleri üzerinde bir kısıtlamaya sahiptir . Kement için sınırlama iken, sırt için bazı için .| | β | | 1 …

5
Büzülme yöntemleri hangi sorunu çözer?
Tatil mevsimi bana İstatistiksel Öğrenme Elemanları ile ateşin yanında kıvrılma fırsatı verdi . (Sık) bir ekonometri perspektifinden gelince, sırt regresyonu, kement ve en düşük açılı regresyon (LAR) gibi büzülme yöntemlerinin kullanımını kavramakta güçlük çekiyorum. Tipik olarak, parametrenin kendilerini tahmin etmesini ve yansızlık veya en azından tutarlılığı elde etmekle ilgilenirim. Büzülme …

6
R kullanarak serbest tahmin için standart hatalar
Tahmin için bir LASSO modeli kullanmaya çalışıyorum ve standart hataları tahmin etmem gerekiyor. Elbette birileri bunu yapmak için zaten bir paket yazmıştır. Ancak görebildiğim kadarıyla, bir LASSO kullanarak tahmin yapan CRAN paketlerinin hiçbiri bu tahminler için standart hatalar getirmeyecek. Öyleyse sorum şu: LASSO tahminlerinde standart hataları hesaplamak için bir paket …

9
Kementin regresyon için değişken seçimi için kullanılmasının dezavantajları nelerdir?
Bildiğim kadarıyla değişken seçimi için Kement kullanımı, korelasyonlu girdiler sorununu ele alıyor. Ayrıca, En Az Açı Regresyonu ile eşdeğer olduğundan, hesaplamalı olarak yavaş değildir. Bununla birlikte, birçok insan (örneğin biyo-istatistik yapmayı bildiğim insanlar) hala adım adım veya stagewise değişken seçimini desteklemektedir. Kementin elverişsiz kılan kullanımının herhangi bir pratik dezavantajı var …

2
Büzülme neden işe yarıyor?
Model seçimindeki problemleri çözmek için, bir dizi yöntem (LASSO, ridge regresyon, vb.) Yordayıcı değişkenlerinin katsayılarını sıfıra çekecektir. Bunun neden tahmin edilebilirliği geliştirdiğine dair sezgisel bir açıklama arıyorum. Değişkenin gerçek etkisi aslında çok büyükse, neden parametreyi küçültmek daha kötü bir tahminle sonuçlanmıyor?

2
Kapalı formdaki kement çözeltisinin türetilmesi
Kement sorunu için öyle \ | \ beta \ | _1 \ leq t . Yumuşak eşikleme sonucunu sık sık görüyorum \ beta_j ^ {\ text {lasso}} = \ mathrm {sgn} (\ beta ^ {\ text {LS}} _ j) (| \ beta_j ^ {\ text {LS}} | - \ gamma) …
52 lasso 

3
Glmnet kullanarak bir Kement'in sonuçları nasıl sunulur?
30 bağımsız değişken kümesinden sürekli bir bağımlı değişken için tahmincileri bulmak istiyorum. R'deki glmnet paketinde uygulanan Lasso regresyonunu kullanıyorum . İşte bazı boş kod: # generate a dummy dataset with 30 predictors (10 useful & 20 useless) y=rnorm(100) x1=matrix(rnorm(100*20),100,20) x2=matrix(y+rnorm(100*10),100,10) x=cbind(x1,x2) # use crossvalidation to find the best lambda library(glmnet) …

5
Değişken seçimi için R 'de larass (veya glmnet) paketinden LASSO kullanımı
Bu soru biraz basit gelirse özür dilerim. R'da çoklu lineer regresyon modeli için LASSO değişken seçimini kullanmaya çalışıyorum, biri kategorik (15 soruna neden olur?) Olan 15 öngörücüm var. ve ayarlarımı yaptıktan sonra aşağıdaki komutları kullanıyorum:yxxxyyy model = lars(x, y) coef(model) Benim sorunum kullandığım zaman coef(model). Bu, her seferinde bir ekstra …

6
En az açılı regresyon ve kement
En küçük açılı regresyon ve kement çok benzer düzenlileştirme yolları üretme eğilimindedir (bir katsayının sıfırı geçtiği durumlar dışında aynıdır) Her ikisi de neredeyse aynı algoritmalarla verimli bir şekilde sığabilir. Bir yöntemi diğerine tercih etmek için herhangi bir pratik sebep var mı?
39 regression  lasso 


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.