«feature-selection» etiketlenmiş sorular

İleri modellemede kullanmak için bir özellik alt kümesi seçme yöntemleri ve ilkeleri

5
Düzenleme algoritmaları kullanırken yine de özellik seçimi yapmamız gerekiyor mu?
İstatistiksel bir öğrenme algoritması çalıştırmadan önce özellik seçim yöntemlerini (Rastgele ormanlar önem değeri veya Tek değişkenli özellik seçim yöntemleri vb.) Kullanmayla ilgili bir sorum var. Aşırı kilo vermekten kaçındığımızı biliyoruz, ağırlık vektörleri üzerinde düzenleyici ceza verebiliriz. Eğer lineer regresyon yapmak istersem, o zaman L2 veya L1 hatta Elastik ağ regülasyon …


2
LASSO değişken seçiminden sonra OLS yapmak ne kadar mantıklı?
Son zamanlarda, uygulanan ekonometri literatüründe, özellik seçim problemleri ile uğraşırken, LASSO ve ardından seçilen değişkenleri kullanarak bir OLS regresyonu gerçekleştirmenin nadir olmadığını gördüm. Böyle bir prosedürün geçerliliğini nasıl nitelendirebileceğimizi merak ediyordum. Atlanan değişkenler gibi sorunlara neden olur mu? Daha etkili olduğunu veya sonuçların daha yorumlanabilir olduğunu gösteren kanıtlar var mı? …

1
Bu kement çiziminden ne sonuçlandırılır (glmnet)
Aşağıda, r'de DV ve diğerleri ile öngörücü değişkenler olarak mtcarsayarlanmış verileri kullanan varsayılan alfa (1, dolayısıyla kement) bulunan glmnet'in çizimi verilmiştir mpg. glmnet(as.matrix(mtcars[-1]), mtcars[,1]) Ne özellikle, farklı değişkenlere ilişkin bu taslaktan sonuca varabiliriz am, cylve wt(kırmızı, siyah ve açık mavi çizgiler)? Bir rapordaki çıktıyı yayınlanması için nasıl ifade ederiz? Aşağıdakileri …

2
Lojistik regresyonda kategorik öngörücünün önemi
Lojistik regresyonda kategorik değişkenler için z değerlerini yorumlamakta zorlanıyorum. Aşağıdaki örnekte 3 sınıflı bir kategorik değişkenim var ve z değerine göre CLASS2, diğerleri olmasa da alakalı olabilir. Ama şimdi bu ne anlama geliyor? Diğer sınıfları birleştirebileceğimi mi? Tüm değişkenin iyi bir öngörücü olmayabilir mi? Bu sadece bir örnektir ve buradaki …

1
“Özellik alanı” nedir?
"Feature space "'nin tanımı nedir? Örneğin, SVM'leri okurken "özellik alanına eşleme" hakkında okudum. CART hakkında okurken, "özellik alanına bölümleme" hakkında okudum. Neler olduğunu anlıyorum, özellikle de CART için, ama kaçırdığım bir tanım olduğunu düşünüyorum. "Özellik alanı" nın genel bir tanımı var mı? SVM çekirdekleri ve / veya CART hakkında bana …

2
LASSO, aynı sorunlardan adım adım geriliyor mu?
Kademeli algoritmik değişken seçim yöntemleri, regresyon modellerinde ( ve SE'leri, p -değerleri, F istatistikleri vb.) Her tahmini az veya çok eğilimli olan ve gerçek tahmin edicileri hariç tutma olasılığı yüksek olan modelleri seçme eğilimindedir oldukça olgun bir simülasyon literatürüne göre yanlış öngörücüler içerir.ββ\beta LASSO, değişkenleri seçmek için kullanıldığında aynı şekilde …


2
PCA, LASSO, elastik ağın hız, hesaplama giderleri
Hastie ve ark. "İstatistiksel Öğrenmenin Öğeleri" (2. bs.), Bölüm 3: Alt küme seçimi Büzülme yöntemleri Türetilmiş giriş yönlerini kullanan yöntemler (PCR, PLS) Karşılaştırma sadece biraz fikir vermek için çok kaba olabilir. Cevapların sorunun boyutuna ve bunun bilgisayar mimarisine nasıl uyduğuna bağlı olabileceğini düşünüyorum, bu yüzden somut bir örnek için 500 …


5
Cv.glmnet sonuçlarında değişkenlik
cv.glmnetÖngörüleri bulmak için kullanıyorum . Kullandığım kurulum aşağıdaki gibidir: lassoResults<-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda<-lassoResults$lambda.min results<-predict(lassoResults,s=bestlambda,type="coefficients") choicePred<-rownames(results)[which(results !=0)] Sonuçların tekrarlanabilir olduğundan emin olmak için I set.seed(1) . Sonuçlar oldukça değişkendir. Sonuçların ne kadar değişken olduğunu görmek için aynı kodu 100 koştum. 98/100 çalışmalarında her zaman belirli bir öngörücü seçildi (bazen sadece kendi başına); diğer …

3
Çok sınıflı bir sınıflandırıcı oluşturmak birkaç ikili sınıflayıcıdan daha mı iyidir?
URL'leri kategorilere ayırmam gerekiyor. Diyelim ki her URL'yi sıfırlamayı planladığım 15 kategorim var. 15 yollu sınıflandırıcı daha mı iyi? Burada 15 etiket var ve her veri noktası için özellikler oluşturmak. Ya da 15 ikili sınıflandırıcı oluşturup, diyelim: Film ya da Film Dışı ve bir sınıflayıcı oluşturmak için bu sınıflandırmalardan aldığım …

5
Lojistik regresyon için hangi özelliklerin en önemli olduğunu anlama
Verilerim üzerinde çok doğru olan bir lojistik regresyon sınıflandırıcısı oluşturdum. Şimdi neden bu kadar iyi çalıştığını daha iyi anlamak istiyorum. Özellikle, hangi özelliklerin en büyük katkıyı yaptığını (hangi özelliklerin en önemli olduğunu) sıralamak ve ideal olarak, her özelliğin genel modelin (veya bu damardaki bir şeyin) doğruluğuna ne kadar katkıda bulunduğunu …

3
Değişken seçimi için Kement kullandıktan sonra çıkarım
Göreceli olarak düşük boyutlu bir ortamda (n >> p) özellik seçimi için Kement kullanıyorum. Bir Kement modelini taktıktan sonra, sıfır olmayan katsayıları olan değişkenleri, cezasız bir modele uyacak şekilde kullanmak istiyorum. Bunu yapıyorum çünkü Lasso'nun bana veremeyeceği tarafsız tahminler istiyorum. Ayrıca tarafsız tahmin için p-değerleri ve güven aralıkları istiyorum. Bu …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.