«feature-selection» etiketlenmiş sorular

İleri modellemede kullanmak için bir özellik alt kümesi seçme yöntemleri ve ilkeleri

8
Otomatik model seçimi için algoritmalar
Otomatik model seçimi için bir algoritma uygulamak istiyorum. Kademeli bir regresyon yapmayı düşünüyorum ama her şey yapacaktır (ancak doğrusal regresyonlara dayanmalıdır). Benim sorunum bir metodoloji veya açık kaynaklı bir uygulama bulamamamdır (Java’da uyanıyorum). Aklımdaki metodoloji şöyle bir şey olurdu: Tüm faktörlerin korelasyon matrisini hesaplar birbiriyle düşük korelasyona sahip faktörleri seçmek …

3
Bir örnek: ikili sonuç için glmnet kullanarak LASSO regresyonu
Ben kullanımı ile serpmek başlıyorum glmnetile LASSO Regresyon ilgi benim sonuç dikotom olduğunu. Aşağıda küçük bir sahte veri çerçevesi oluşturdum: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
Özellik seçimi ve çapraz doğrulama
Son zamanlarda bu sitede (@Aniko, @Dikran Marsupial, @Erik) ve başka yerlerde çapraz onaylama ile ortaya çıkan aşırı teçhizat sorunu hakkında çok fazla şey okudum - (Smialowski ve diğerleri 2010 Bioinformatics, Hastie, istatistiksel öğrenmenin unsurları). Öneri, çapraz doğrulama (veya önyükleme gibi başka bir model tahmin metodu) kullanılarak yapılan model performans tahmininin …

6
Makine öğrenmesinde çapraz doğrulama yapılırken “son” model için özellik seçimi
Özellik seçimi ve makine öğrenmesi konusunda kafam biraz karıştı ve bana yardım edip edemeyeceğinizi merak ediyordum. İki gruba ayrılan ve 1000’lik özelliklere sahip bir mikro dizi veri setine sahibim. Amacım, teorik olarak bu örnekleri en iyi şekilde sınıflandırmak için diğer veri setlerine uygulayabileceğim bir imzayla az sayıda gen (özelliklerim) (10-20) …

3
Kement neden Değişken Seçim sağlıyor?
İstatistiksel Öğrenme Öğelerini okudum ve Lasso'nun neden değişken seçim sağladığını ve sırt regresyonunun neden olmadığını bilmek istiyorum. Her iki yöntem de artık kareler toplamını en aza indirir ve parametrelerinin olası değerleri üzerinde bir kısıtlamaya sahiptir . Kement için sınırlama iken, sırt için bazı için .| | β | | 1 …

6
Tahmini modelleme için değişken seçimi 2016'da gerçekten gerekli mi?
Bu soru, birkaç yıl önce CV'de sorulmuştu, 1) büyüklük sırasına göre daha iyi hesaplama teknolojisi (örneğin paralel hesaplama, HPC vb.) Ve 2) daha yeni teknikler, örneğin [3] ışığında bir röportaja benziyor. İlk olarak, bazı bağlamlar. Amacın hipotez testi değil, tahmini etkileme değil, görünmeyen test setindeki tahmin olduğunu varsayalım. Bu nedenle, …

9
Kementin regresyon için değişken seçimi için kullanılmasının dezavantajları nelerdir?
Bildiğim kadarıyla değişken seçimi için Kement kullanımı, korelasyonlu girdiler sorununu ele alıyor. Ayrıca, En Az Açı Regresyonu ile eşdeğer olduğundan, hesaplamalı olarak yavaş değildir. Bununla birlikte, birçok insan (örneğin biyo-istatistik yapmayı bildiğim insanlar) hala adım adım veya stagewise değişken seçimini desteklemektedir. Kementin elverişsiz kılan kullanımının herhangi bir pratik dezavantajı var …


2
Değişken seçimin daha kesin bir tartışması
Arka fon Tıpta klinik araştırma yapıyorum ve birkaç istatistik dersi aldım. Doğrusal / lojistik regresyon kullanarak bir makale yayınlamamıştım ve değişken seçimini doğru yapmak istiyorum. Yorumlanabilirlik önemlidir, bu nedenle fantezi makine öğrenme teknikleri yoktur. Değişken seçim anlayışımı özetledim - birileri herhangi bir yanılgıya ışık tutabilir mi? Buna iki (1) benzer …

3
Özellik seçimi için temel bileşen analizi (PCA) kullanma
Özellik seçimi konusunda yeniyim ve özellik seçimi yapmak için PCA'yı nasıl kullanacağınızı merak ediyordum. PCA, bilgi vermeyen giriş değişkenlerini filtrelemek için kullanabileceğiniz her giriş değişkeni için göreceli bir puan hesaplar mı? Temel olarak, verilerdeki orijinal özellikleri varyansa veya içerdiği bilgi miktarına göre sipariş edebilmek istiyorum.



5
SVM özellik ağırlıkları nasıl yorumlanır?
Doğrusal bir SVM yerleştirerek verilen değişken ağırlıkları yorumlamaya çalışıyorum. (Ben scikit-learn kullanıyorum ): from sklearn import svm svm = svm.SVC(kernel='linear') svm.fit(features, labels) svm.coef_ Belgelerde, bu ağırlıkların nasıl hesaplandığını veya yorumlandığını gösteren hiçbir şey bulamıyorum. Kilo işaretinin dersle ilgisi var mı?

5
Değişken seçimi için R 'de larass (veya glmnet) paketinden LASSO kullanımı
Bu soru biraz basit gelirse özür dilerim. R'da çoklu lineer regresyon modeli için LASSO değişken seçimini kullanmaya çalışıyorum, biri kategorik (15 soruna neden olur?) Olan 15 öngörücüm var. ve ayarlarımı yaptıktan sonra aşağıdaki komutları kullanıyorum:yxxxyyy model = lars(x, y) coef(model) Benim sorunum kullandığım zaman coef(model). Bu, her seferinde bir ekstra …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.