«feature-selection» etiketlenmiş sorular

İleri modellemede kullanmak için bir özellik alt kümesi seçme yöntemleri ve ilkeleri

1
GAM vs LOESS vs spline
Bağlam : Bu yüzden ben kullanıyorum, parametrik görünmeyen bir ScatterPlot bir çizgi çizmek istiyorum geom_smooth()içinde ggplotde R. geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.Genelleştirilmiş katkı modelleri için GAM …

1
Rastgele Orman'da neden özelliklerin rastgele bir alt kümesi, ağaç düzeyinde değil düğüm düzeyinde seçiliyor?
Benim sorum: Rasgele orman, neden ağaç düzeyinde değil de her ağaçtaki düğüm düzeyinde bölünmeye yönelik özelliklerin rastgele alt kümelerini ele alıyor ? Arka plan: Bu bir tarih sorusu. Tin Kam Ho , 1998'de her ağacın büyümesi için kullanılacak bir özellik alt kümesini rastgele seçerek "karar ormanları" oluşturma üzerine bu makaleyi …

1
Derin Sinir Ağlarında Duyarlılık Analizi
Zaten cevaplanan bir sorudan sonra ( Tek Katmanlı ileri beslemeli ağdan ağırlık önemini ayıklama ) Sinir ağlarındaki girdilerin alaka düzeyi hakkında çıkarım arıyorum. İlgilenilen çıkış düğümünden katmanlar arasında geriye doğru gidilerek girdi önemini yeniden yapılandırmanın zor veya zaman alıcı olabileceği derin bir ağ göz önüne alındığında, sinir ağı için duyarlılık …

1
Bayes kement vs başak ve levha
Soru: Değişken seçimi için öncekini diğerine göre kullanmanın avantajları / dezavantajları nelerdir? I olasılığını olduğunu varsayalım: ı yerleştirmek için her iki önsel biri: veya: w i ∼ π δ 0 + ( 1 - π ) N ( 0 , 100 )y∼ N( Xw , σ2ben)y∼N(Xw,σ2I)y\sim\mathcal{N}(Xw,\sigma^2I)w i ∼ exp ( …

3
Sinir ağları neden özellik seçimine / mühendisliğine ihtiyaç duyar?
Özellikle kaggle yarışmaları bağlamında, modelin performansının özellik seçimi / mühendisliği ile ilgili olduğunu fark ettim. Daha geleneksel / eski okul ML algoritmalarıyla uğraşırken bunun neden olduğunu tam olarak anlayabilsem de, derin sinir ağlarını kullanırken neden böyle olacağını anlamıyorum. Derin Öğrenme kitabından alıntı: Derin öğrenme, temsili öğrenmedeki bu merkezi problemi, daha …

2
Kement ile karşılaştırıldığında neden en iyi altküme seçimi tercih edilmiyor?
İstatistiksel öğrenme kitabının Unsurları'nda en iyi altküme seçimini okuyorum. 3 tahmin edicim , 2 3 = 8 altkümesi oluştururum:x1,x2,x3x1,x2,x3x_1,x_2,x_323=823=82^3=8 Tahmini olmayan alt küme öngörücü ile alt küme x1x1x_1 öngörücülü alt küme x2x2x_2 öngörücülü alt küme x3x3x_3 öngörücülü alt küme x1,x2x1,x2x_1,x_2 öngörücülü alt küme x1,x3x1,x3x_1,x_3 öngörücülü alt küme x2,x3x2,x3x_2,x_3 öngörücülü alt …

2
Değişken seçiminde çelişkili yaklaşımlar: AIC, p değerleri veya her ikisi mi?
Anladığım kadarıyla, p-değerlerine (en azından regresyon bağlamında) dayalı değişken seçim çok kusurlu. AIC'ye (veya benzeri) dayalı değişken seçimin de benzer nedenlerle bazıları tarafından kusurlu olduğu düşünülmektedir, ancak bu biraz belirsiz görünmektedir (örneğin soruma ve bu konudaki bazı bağlantılara bakın: "Kademeli model seçimi" tam olarak nedir? ). Ancak, modelinizdeki en iyi …


2
P> n ise, kement en fazla n değişken seçer
Elastik ağ için motivasyonlardan biri LASSO'nun aşağıdaki sınırlamasıydı: Gelen durumda, çünkü dışbükey optimizasyon problemine doğasının kement en fazla seçer n değişkenler ondan önce doymuş bileşikler,. Bu, değişken seçim yöntemi için sınırlayıcı bir özellik gibi görünmektedir. Ayrıca, katsayıların L1-normuna bağlı belirli bir değerden daha küçük olmadığı sürece, kement iyi tanımlanmamıştır.p>np>np > …



1
LLE (yerel doğrusal gömme) algoritmasının adımlarını açıklar?
LLE için algoritmanın arkasındaki temel prensibin üç adımdan oluştuğunu anlıyorum. Her veri noktasının mahallesini k-nn gibi bir metrik ile bulmak. Her komşu için, komşunun veri noktası üzerindeki etkisini gösteren ağırlıkları bulun. Hesaplanan ağırlıklara dayalı olarak verilerin düşük boyutlu gömülmesini oluşturun. Ancak 2. ve 3. adımların matematiksel açıklaması okuduğum tüm ders …


2
Etkileşim modellerinde en iyi özellikleri bulma
Özellik değerlerine sahip proteinler listem var. Örnek bir tablo şöyle görünür: ...............Feature1...Feature2...Feature3...Feature4 Protein1 Protein2 Protein3 Protein4 Satırlar proteinlerdir ve sütunlar özelliklerdir. Ayrıca etkileşime giren proteinler listem var; Örneğin Protein3, Protein4 Protein1, Protein2 Protein4, Protein1 Sorun : Bir ön analiz için protein etkileşimlerinde hangi özelliklerin en çok katkıda bulunduğunu bilmek istiyorum. …

3
Kümeleme olasılık dağılımları - yöntemler ve metrikler?
Bazı veri noktaları var, her biri 5 vektör kümelenmiş ayrık sonuç içeren vektörler, her vektörün sonuçları farklı bir dağılımla üretildi (belirli bir tür emin değilim, en iyi tahminim Weibull, şekil parametresi gücün üstelinde bir yerde değişiyor) (1'den 0'a, kabaca).) Her bir veri noktasını 5 bileşen dağılımlarının özelliklerine göre gruplara koymak …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.