«feature-selection» etiketlenmiş sorular

İleri modellemede kullanmak için bir özellik alt kümesi seçme yöntemleri ve ilkeleri

2
Sırt regresyonu neden LASSO'dan daha iyi yorumlanabilirlik sağlayamıyor?
Sırt regresyonu ve LASSO'nun artıları ve eksileri hakkında zaten bir fikrim var. LASSO için, L1 ceza süresi, bir özellik seçim yöntemi olarak görülebilen seyrek bir katsayı vektörü verecektir. Bununla birlikte, LASSO için bazı sınırlamalar vardır. Özelliklerin yüksek korelasyonu varsa, LASSO bunlardan sadece birini seçecektir. Ek olarak, > n olan problemler …

2
P değerine dayalı özellikler seçmek yanlış mıdır?
Özelliklerin nasıl seçileceği hakkında birkaç mesaj vardır . Yöntemlerden biri, t istatistiklerine dayalı özellik önemini açıklar. Standart özelliklere varImp(model)sahip doğrusal model üzerine uygulanan R'de , her model parametresi için t istatistik istatistiği kullanılır. Temel olarak, t istatistiklerine dayanarak bir özellik seçiyoruz, yani katsayının ne kadar kesin olduğu. Fakat katsayımın kesinliği …

1
Değişken seçimi ve Model seçimi
Değişken seçiminin model seçiminin bir parçası olduğunu anlıyorum. Peki, model seçimi tam olarak nelerden oluşur? Aşağıdakilerden daha fazla mı? 1) modeliniz için bir dağıtım seçin 2) açıklayıcı değişkenleri seçer,? Bunu soruyorum çünkü Burnham & Anderson: AIC vs BIC, model seçiminde AIC ve BIC hakkında konuştukları bir makale okuyorum . Bu …

5
Terim sıklığı / ters belge sıklığı (TF / IDF): ağırlıklandırma
1000 belgeyi ve içinde görünen tüm kelimeleri temsil eden bir veri setim var. Böylece satırlar belgeleri ve sütunlar kelimeleri temsil eder. Yani, örneğin, hücrede değer kez kelimenin açılımı belgede oluşur . Şimdi, tf / idf yöntemini kullanarak kelimelerin 'ağırlıklarını' bulmak zorundayım, ama aslında bunu nasıl yapacağımı bilmiyorum. Birisi bana yardım …

5
R'de hem regresyon hem de sınıflandırma yapan Özellik Seçim Paketleri
Kilitli . Bu soru ve cevapları kilitlidir çünkü soru konu dışıdır, ancak tarihsel önemi vardır. Şu anda yeni yanıtları veya etkileşimleri kabul etmiyor. R için çok yeniyim. Şu anda makine öğrenmeyi öğreniyorum. Çok üzgünüm, eğer bu soru çok basit görünüyorsa. R'de iyi bir özellik seçim paketi bulmaya çalışıyorum. Boruta paketinden …

2
Özellik sayısının artırılması neden performansı düşürüyor?
Neden özellik sayısının artırılmasının performansı düşürebileceğine dair bir sezgi kazanmaya çalışıyorum. Şu anda belirli özellikler arasında daha iyi iki değişkenli ancak daha fazla özelliğe bakarken daha kötü performans gösteren bir LDA sınıflandırıcı kullanıyorum. Sınıflandırma doğruluğum tabakalı 10 kat xval kullanılarak gerçekleştirilir. Bir sınıflandırıcının bu yüksek boyutlarda neler olduğuna dair bir …


1
R - serbestlik derecesinde PROC Mixed ve lme / lmer arasındaki farklar
Not: önceki sorumun yasal nedenlerle silinmesi gerektiğinden, bu soru bir gönderidir. Fonksiyonlu SAS PROC MIXED karşılaştırarak birlikte lmegelen nlmeR paketin, bazı çok kafa farklılıklar tökezledi. Daha spesifik olarak, farklı testlerdeki özgürlük dereceleri ve arasında farklılık gösterir PROC MIXEDve lmenedenini merak ettim. Aşağıdaki veri kümesinden başlayın (R kodu aşağıda verilmiştir): ind: …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
Bir regresyon modelinde değişkenleri nasıl seçersiniz?
Değişken seçimine geleneksel yaklaşım, yeni bir yanıtı öngörmeye en çok katkıda bulunan değişkenleri bulmaktır. Son zamanlarda buna bir alternatif öğrendim. Bir tedavinin etkisini belirleyen değişkenlerin modellenmesinde - örneğin bir farmasötik klinik testinde olduğu gibi - değişkenin niteliksel olarak etkileşime girdiği söylenirdiğer değişkenleri sabit bırakarak, bu değişkende bir değişiklik olması tedavinin …

2
Anlamsal anlamı koruyan alan-agnostik özellik mühendisliği?
Özellik mühendisliği genellikle makine öğrenimi için önemli bir bileşendir ( 2010'da KDD Kupası'nı kazanmak için yoğun olarak kullanılmıştır ). Ancak, çoğu mühendislik tekniğinin de altta yatan özelliklerin sezgisel anlamlarını yok etmek veya belirli bir alan adına ve hatta belirli türdeki özelliklere çok özeldir. Birincisinin klasik bir örneği temel bileşen analizi …

5
Küme analizi için değişken seçimi yapmak için PCA kullanabilir miyim?
Bir küme analizi yapabilmek için değişken sayısını azaltmalıyım. Değişkenlerim güçlü bir şekilde ilişkilidir, bu yüzden bir Faktör Analizi PCA (temel bileşen analizi) yapmayı düşündüm . Ancak, elde edilen puanları kullanırsam, kümelerim tam olarak doğru değildir (literatürdeki önceki sınıflandırmalara kıyasla). Soru: Her bileşen / faktör için en büyük yüke sahip değişkenleri …

4
Tekrar Ağırlıklı En Küçük Kareler (IRLS) Yöntemi LASSO Modeline Nasıl Uygulanır?
IRLS algoritmasını kullanarak bir lojistik regresyon programladım . Doğru özellikleri otomatik olarak seçmek için bir LASSO cezası uygulamak istiyorum . Her yinelemede aşağıdakiler çözülür: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} Let negatif olmayan reel sayı. The Elements bölümünde önerildiği gibi kesmeyi cezalandırmıyorum . İstatistiksel Öğrenme . Zaten sıfır katsayıları için aynen. Aksi takdirde, sağ …

4
Kementin özellik seçimi için kararsız olmasına ne neden olur?
Sıkıştırılmış algılama olarak, bir teoremi garantisi yoktur argmin∥c∥1subject to y=Xcargmin‖c‖1subject to y=Xc\text{argmin} \Vert c \Vert_1\\ \text{subject to } y = Xc benzersiz seyrek çözelti sahip ccc (daha fazla ayrıntı için ek). Kement için benzer bir teorem var mı? Böyle bir teorem varsa, sadece kementin stabilitesini garanti etmekle kalmaz, aynı zamanda …

2
Rasgele orman için özellik seçimi ve düzeltme işareti ile parametre ayarlama
Birkaç bin özellikli verilerim var ve bilgilendirici olmayanları kaldırmak için özyinelemeli özellik seçimi (RFE) yapmak istiyorum. Bunu caret ve RFE ile yapıyorum . Ancak, en iyi regresyon uyumunu elde etmek istiyorsam (örneğin rastgele orman), ne zaman parametre ayarlamayı ( mtryRF için) yapmalıyım diye düşünmeye başladım. Yani, anladığım kadarıyla, caret trenleri …

1
Lineer fonksiyon yaklaşımı ile ağırlıkların Q-değerlerine nasıl sığacağı
Pekiştirme öğrenmesinde doğrusal fonksiyon yaklaşımı genellikle büyük durum uzayları olduğunda kullanılır. (Arama tabloları mümkün olmadığında.) Lineer fonksiyon yaklaşımı ile S -S-Q- değeri formu, Q ( s , a ) = w1f1( s , a ) + w2f2( s , a ) + ⋯ ,S(s,bir)=w1f1(s,bir)+w2f2(s,bir)+⋯,Q(s,a) = w_1 f_1(s,a) + w_2 f_2(s,a) …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.