«feature-selection» etiketlenmiş sorular

İleri modellemede kullanmak için bir özellik alt kümesi seçme yöntemleri ve ilkeleri

2
Rastgele Ormanlarla özellik seçimi
Çoğunlukla yüksek derecede korelasyonlu ve çok gürültülü (örneğin teknik göstergeler) çoğunlukla finansal değişkenlere (120 özellik, 4k örnek) sahip bir veri setim var, bu yüzden model eğitimi (ikili sınıflandırma) ile daha sonra kullanmak üzere maksimum 20-30'u seçmek istiyorum - artış azalış). Özellik sıralaması için rastgele ormanlar kullanmayı düşünüyordum. Bunları tekrar tekrar …

4
Düşük sınıflandırma doğruluğu, sonra ne yapmalı?
Yani, ML alanında bir acemi oldum ve biraz sınıflandırma yapmaya çalışıyorum. Amacım bir spor etkinliğinin sonucunu tahmin etmektir. Bazı tarihsel veriler topladım ve şimdi bir sınıflandırıcı yetiştirmeye çalıştım. Yaklaşık 1200 örnek aldım, bunlardan 0.2 tanesi test amaçlı olarak ayırdım, diğerleri farklı sınıflandırıcılar ile ızgara aramasına (çapraz doğrulama dahil) koydum. Şu …

1
Ki-kare özellik seçimi tam olarak nasıl çalışır?
Her özellik sınıfı çifti için ki-kare istatistiği değerinin hesaplandığını ve bir eşikle karşılaştırıldığını biliyorum . Yine de biraz kafam karıştı. Varsa özellikleri ve k sınıfları, bir yapı ihtimal tablosu nasıl yapar? Hangi özelliklerin ve hangilerinin kaldırılacağına nasıl karar verilir?mmmkkk Herhangi bir açıklama çok takdir edilecektir. Şimdiden teşekkürler

1
Bir lmer modeli için hangi çoklu karşılaştırma yöntemi kullanılır: lsmeans veya glht?
Bir veri setini bir sabit efekt (durum) ve iki rastgele efekt (katılımcı konu tasarımı ve çifti nedeniyle katılımcı) ile karışık efektler modeli kullanarak analiz ediyorum. Model ile oluşturulan lme4paket: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Sonra, bu modelin sabit etki (durum) olmadan modele karşı bir olasılık oranı testi yaptım ve önemli bir farkım var. Veri …

2
“F regresyonuna” ve değerlerine dayalı özellik seçimi arasındaki fark nedir?
Özelliklerin F-regressionetiketle ilişkilendirilmesi ile aynı özellikleri kullanarak karşılaştırmak ve değerini gözlemlemek mi?R2R2R^2 Sık sık meslektaşlarımın F regressionmakine öğrenme kanalında bir özellik seçimi için kullandığını gördüm sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` Bazıları bana söyle - neden sadece etiket / bağımlı değişkenle ilişkilendirmekle aynı sonuçları veriyor? F_regressionÖzellik seçiminde kullanmanın avantajı bana açık değil . İşte …

4
Metin Madenciliği: Metinleri (örn. Haber makaleleri) yapay zeka ile nasıl kümeleyebilirim?
Pong oynamak, el yazısı rakamları ve diğer şeyleri sınıflandırmak gibi farklı görevler için bazı sinir ağları (MLP (tam bağlantılı), Elman (tekrarlayan)) inşa ettim ... Ek olarak, ilk basamaklı sinir ağlarını oluşturmaya çalıştım, örneğin çok basamaklı el yazısı notları sınıflandırmak için, ancak metinleri analiz etmek ve kümelemek için tamamen yeniyim, örneğin, …

1
Gini azalması ve çocuk düğümlerinin Gini safsızlığı
Rastgele orman için Gini özelliği önem ölçüsü üzerinde çalışıyorum. Bu nedenle, düğüm safsızlığında Gini azalmasını hesaplamam gerekiyor. İşte böyle yapıyorum, bu tanımla çatışmaya yol açıyor, bir yerde yanlış olmam gerektiğini gösteriyor ... :) Bir ikili ağaç için ve sol ve sağ çocukların olasılıkları göz önüne alındığında, düğümünün Gini safsızlığını hesaplayabilirim …

2
LASSO / LARS ve genel - özel (GETS) yöntemi
Merak ediyorum, LASSO ve LARS model seçim yöntemleri, temelde sadece adım adım ileri seçimin varyasyonları olsa da (bu yüzden yol bağımlılığından muzdarip) neden bu kadar popüler? Benzer şekilde, model seçimi için General to Specific (GETS) yöntemleri, adım adım regresyon probleminden muzdarip olmadıkları için neden LARS / LASSO'dan daha iyi olsalar …

5
Makine öğrenimi tekniklerinin küçük örnek klinik çalışmalarda uygulanması
Bir sınıflandırma bağlamında ilginç öngörücüler izole etmek olduğunda küçük örnek klinik çalışmalarda Rastgele Ormanlar veya cezalandırılmış regresyon (L1 veya L2 cezası veya bunların bir kombinasyonu ile) gibi makine öğrenme tekniklerini uygulamak hakkında ne düşünüyorsunuz? Model seçimi ile ilgili bir soru değil, değişken etki / önem için en uygun tahminlerin nasıl …

3
Doğrusal sınıflandırıcılar için, daha büyük katsayılar daha önemli özellikler ima ediyor mu?
Makine öğrenimi üzerinde çalışan bir yazılım mühendisiyim. Anladığım kadarıyla, doğrusal regresyon (OLS gibi) ve doğrusal sınıflandırma (lojistik regresyon ve SVM gibi), eğitimli katsayılar ve özellik değişkenleri arasındaki iç ürüne dayalı bir tahmin yapar :w⃗ w→\vec{w}x⃗ x→\vec{x} y^= f( w⃗ ⋅ x⃗ ) = f( ∑benwbenxben)y^=f(w→⋅x→)=f(∑iwixi) \hat{y} = f(\vec{w} \cdot \vec{x}) …

2
Sürekli ve ikili verileri doğrusal SVM ile mi karıştırıyorsunuz?
Bu yüzden SVM'lerle oynuyorum ve bunun iyi bir şey olup olmadığını merak ediyorum: Ben sürekli özellikleri (0-1) bir dizi ve ben kukla değişkenlere dönüştürdü kategorik özellikleri bir dizi var. Bu özel durumda, kukla değişkente ölçüm tarihini kodlarım: Veri aldığım 3 dönem var ve onlar için 3 özellik numarası ayırdım: 20: …

5
Sadece eğitim veri kümesinde keşifsel veri analizi yapmak daha mı iyi?
Veri kümesinde keşifsel veri analizi (EDA) yapıyorum. Sonra bağımlı bir değişkeni tahmin etmek için bazı özellikleri seçeceğim. Soru şu: EDA'yı sadece eğitim veri setimde yapmalı mıyım? Ya da eğitim ve test veri setlerine birlikte katılmalı mıyım, sonra da ikisi üzerinde EDA mı yapmalı ve bu analize dayalı özellikleri mi seçmeliyim?

4
Makine öğrenme kanalında Özellik Seçimi ve Hiperparametre optimizasyonu nasıl sipariş edilmelidir?
Amacım sensör sinyallerini sınıflandırmak. Çözümümün şimdiye kadarki kavramı: i) Ham sinyalden mühendislik özellikleri ii) ReliefF ve kümeleme yaklaşımı ile ilgili özellikleri seçme iii) NN, Random Forest ve SVM uygulayın Ancak bir ikilemde sıkışıp kaldım. İi) ve iii) 'de, ReliefF için k-En Yakın Neigbours veya sensör sinyalinin değerlendirildiği pencere uzunluğu veya …

3
Bayes değişken seçimi - gerçekten işe yarıyor mu?
Güzel bir blog yazısı ve bağlantılı makaleleri takip ederek Bayes değişken seçimi ile oynayabileceğimi düşündüm . Ben yazdım programı içinde rjags (Oldukça çaylak değilim) ve getirilen fiyat verilerinin onun getirilerini (örneğin paladyum fiyatları) ve yüksek oranda SP500 gibi (korelasyon gereken başka şeyleri açıklamak olası değildir bazı şeylerle birlikte, Exxon Mobil …

1
İleri aşamalı regresyon algoritması nedir?
Belki de sadece yorgunum, ama İleri Stagewise Regresyon algoritmasını anlamaya çalışırken sorun yaşıyorum. Gönderen "İstatistiksel Öğrenme Elements" sayfa 60: İleri-aşamalı regresyon (FS), ileri-aşamalı regresyondan daha da kısıtlıdır. Bu, [ortalama] y değerine eşit bir kesişme ve başlangıçta hepsi 0 olan, katsayıları olan ortalanmış tahmin edicilerle ileri-adım regresyon gibi başlar. Her adımda …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.