İstatistikler ve Büyük Veri lasso

5

Bu yazı bunu takip ediyor: Çapraz tahmin, diyagonal bir sabit ekleyerek neden OLS'den daha iyi hale geliyor? İşte sorum: Bildiğim kadarıyla, sırt düzenlenmesi normu (öklid mesafesi) kullanır. Ama neden bu normun karesini kullanıyoruz? ( doğrudan uygulanması , beta kare toplamının kare kökü ile sonuçlanır).ℓ 2ℓ2ℓ2\ell_2ℓ2ℓ2\ell_2 Bir karşılaştırma olarak, bunu düzenlemek …

12 lasso regularization ridge-regression

3

Kement ve adaptif Kement Karşılaştırması

LASSO ve uyarlanabilir LASSO iki farklı şey, değil mi? (Bana göre cezalar farklı görünüyor, ama sadece bir şeyleri özleyip özlemediğimi kontrol ediyorum.) Genelde elastik ağ hakkında konuştuğunuzda, özel durum LASSO veya uyarlanabilir LASSO mu? Alpha = 1'i seçmeniz koşuluyla glmnet paketi hangisini yapar? Uyarlanabilir LASSO daha ılımlı koşullarda çalışır, değil …

12 lasso glmnet elastic-net oracle

3

Glmnet kullanarak büzülme (Kement) yönteminde NA değerleri nasıl işlenir

GWAS'ta kement regresyonu için "glmnet" kullanıyorum. Bazı varyantlar ve bireyler eksik değerlere sahiptir ve glmnet'in eksik değerleri işleyemediği görülmektedir. Bunun için herhangi bir çözüm var mı? veya kement regresyonunda eksik değerleri işleyebilecek başka bir paket var mı? İşte senaryolarım. > library(glmnet) > geno6<-read.table("c6sigCnt.geno") > geno6[1:10,1:10] #genotype file (0,1,2 for minor …

12 missing-data lasso glmnet

2

Çapraz doğrulama ile glmnet paketindeki Sapma ölçümünün tam tanımı?

Mevcut araştırma için Binom bağımlı bir değişkene R glmnet paketi aracılığıyla Kement yöntemini kullanıyorum. Glmnet'te optimal lambda çapraz validasyon yoluyla bulunur ve ortaya çıkan modeller çeşitli ölçümlerle karşılaştırılabilir, örneğin yanlış sınıflandırma hatası veya sapma. Benim sorum: glmnet'te sapma tam olarak nasıl tanımlanır? Nasıl hesaplanır? (Friedman ve ark.'nın "Koordinat İniş Yoluyla …

12 cross-validation lasso glmnet deviance lars

1

Hem sırt hem de kement ayrı olarak iyi performans gösterdiğinde ancak farklı katsayılar üretildiğinde sonuçlar nasıl yorumlanır

Hem Kement hem de Ridge ile bir regresyon modeli kullanıyorum (0-5 arasında değişen ayrı bir sonuç değişkenini tahmin etmek için). Modeli çalıştırmadan önce, kullandığım SelectKBestyöntemi scikit-learngelen özellik kümesi azaltmak için 250 ile 25 . İlk özellik seçimi olmadan, hem Kement hem de Ridge daha düşük doğruluk puanlarına neden olur [bu, …

11 regression predictive-models feature-selection lasso ridge-regression

2

Karmaşık anket verilerinde LASSO'dan sonra çapraz doğrulama

Sürekli bir sonuçla LASSO kullanan bazı aday öngörücülerde model seçimi yapmaya çalışıyorum. Amaç, LASSO'dan ayarlama parametrelerinin bir çözüm yolunu elde ettikten sonra genellikle K-kat çapraz doğrulaması ile yapılabilen en iyi tahmin performansına sahip optimal modeli seçmektir. Burada mesele, verilerin küme örneklemesi ve tabakalandırması ile karmaşık çok aşamalı bir anket tasarımından …

11 cross-validation survey lasso glmnet

2

Karesel Programlama ve Kement

Aşağıdaki formu olan bir kement regresyon gerçekleştirmek için çalışıyorum: Minimize olarak( Y - X w ) ′ ( Y - X w ) + λwww(Y−Xw)′(Y−Xw)+λ|w|1(Y−Xw)′(Y−Xw)+λ|w|1(Y - Xw)'(Y - Xw) + \lambda \;|w|_1 Bir verildiğinde , aşağıdaki formu alan ikinci dereceden programlama yardımıyla en uygun w'yi bulmam tavsiye edildi :wλλ\lambdawww Minimize …

11 regression lasso quadratic-form

4

Bir katsayıyı düzeltme ve regresyon kullanarak diğerlerine uyma

El ile belirli bir katsayı çözmek isteriz derler , tüm diğer öngördü- sonra uygun katsayılar, tutma sırasında modelinde.β 1 = 1,0β1=1.0β1=1.0\beta_1=1.0β1=1.0β1=1.0\beta_1=1.0 R kullanarak bunu nasıl başarabilirim? Mümkünse özellikle LASSO ( glmnet) ile çalışmak istiyorum . Alternatif olarak, bu katsayıyı belirli bir aralıkla nasıl kısıtlayabilirim ?0.5≤β1≤1.00.5≤β1≤1.00.5\le\beta_1\le1.0

11 r multiple-regression lasso glmnet constrained-regression

1

Ridge ve LASSO bir kovaryans yapısına sahip mi?

İstatistiksel Öğrenme Unsurları'nda (Hastie, Tibshrani & Friedman) Bölüm 3'ü okuduktan sonra, bir kovaryans yapısı göz önüne alındığında, bu sorunun başlığında alıntılanan ünlü büzülme yöntemlerinin uygulanmasının mümkün olup olmadığını merak ettim, ) miktar ( y⃗ - Xβ⃗ )TV- 1( y⃗ - Xβ⃗ ) + λ f( β) , ( 1 ) …

11 lasso ridge-regression

3

Bir LASSO modelinde

Lambda'mı çapraz doğrulama ile belirlediğimde, tüm katsayılar sıfır olur. Ancak literatürden bazı öngörücülerin sonuçları kesinlikle etkilemesi gerektiğine dair bazı ipuçları var. İstenildiği kadar çok azlık olması için lambda'yı keyfi olarak seçmek saçma mıdır? Bir cox modeli için 135'ten en iyi 10'u tahmin etmek istiyorum ve ne yazık ki efekt boyutları …

11 lasso

4

Koordinat inişiyle kement uyumu: açık kaynaklı uygulamalar? [kapalı]

Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. Geçen yıl kapalı . Koordinat inişine göre doğrusal regresyon için kement düzenleme yollarını hesaplayabilen herhangi bir dilde - hangi açık kaynaklı uygulamalar var? Şimdiye kadar …

11 regression lasso regularization

4

LASSO ile özellik seçimi için veri hazırlamak amacıyla eksik değerlerle nasıl başa çıkılır?

Benim durumum: küçük örneklem büyüklüğü: 116 ikili sonuç değişkeni Açıklayıcı değişkenlerin uzun listesi: 44 açıklayıcı değişkenler başımın tepesinden gelmedi; onların seçimi literatüre dayanıyordu. örnekteki çoğu durum ve değişkenlerin çoğu eksik değerlere sahiptir. Seçilen özellik seçimine yaklaşım: LASSO R'nin glmnet paketi, görünüşe göre veri kümemdeki eksik değerlerin varlığı nedeniyle glmnet rutinini …

11 r spss lasso data-imputation

1

LASSO, eş doğrusal öngörücüler arasından nasıl seçim yapar?

Bir GLM LASSO modelinin yüksek derecede korelasyonlu olanlardan oluşan bir gruptan belirli bir yordayıcıyı neden seçtiğini ve neden en iyi alt küme özellik seçiminden farklı olduğunu sezgisel bir cevap arıyorum. Tibshirani 1996'daki Şekil 2'de gösterilen LASSO'nun geometrisinden, LASSO'nun yordayıcıyı daha büyük varyansla seçtiğine inanıyorum. Şimdi bir lojistik regresyon modeli için …

11 feature-selection lasso

2

Yumuşak eşikleme ile Kement cezalandırması

Şimdiye kadar yüksek boyutlu veri kümeleriyle cezalandırılmış çok değişkenli analizde anladığımı özetlemeye çalışıyorum ve hala yumuşak eşikleme ile Kement (veya ) doğru bir tanımını elde mücadele ediyorum .L1L1L_1 Daha kesin olarak, genomik veriler ( tek nükleotid polimorfizmleri dahil olmak üzere 2 bloklu veri yapısını analiz etmek için seyrek PLS regresyonunu …

11 multivariate-analysis lasso feature-selection genetics

2

Can

Eğer , can‖ β * ‖ 2 artış zamanλartar?β∗=argminβ∥y−Xβ∥22+λ∥β∥1β∗=argminβ‖y−Xβ‖22+λ‖β‖1\beta^*=\mathrm{arg\,min}_{\beta} \|y-X\beta\|^2_2+\lambda\|\beta\|_1∥β∗∥2‖β∗‖2\|\beta^*\|_2λλ\lambda Bunun mümkün olduğunu düşünüyorum. Her ne kadar zaman artmaz λ artar (benim geçirmez ), ‖ β * ‖ 2 artırabilir. Aşağıdaki şekilde bir olasılık gösterilmektedir. Zaman λ yükselirse, β * seyahatlerdir (doğrusal) P için Q , daha sonra ‖ β …

11 lasso

«lasso» etiketlenmiş sorular