«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.

2
Test setinin dağılımı ile eğitim seti arasındaki fark nasıl ele alınır?
Makine öğrenmesi ya da parametre tahmininin temel varsayımlarından biri, görünmeyen verilerin eğitim seti ile aynı dağıtımdan geldiğidir. Bununla birlikte, bazı pratik durumlarda, test setinin dağılımı eğitim setinden neredeyse farklı olacaktır. Ürün tanımlarını yaklaşık 17.000 sınıfa sınıflandırmaya çalışan büyük ölçekli bir çok sınıflandırma problemi için söyleyin. Eğitim seti, eğrilmiş bir sınıf …

2
Makine öğrenmesi teknikleri “yaklaşım algoritmaları” mı?
Son zamanlarda cstheory stackexchange üzerinde ML benzeri bir soru vardı ve Powell'ın yöntemini, gradyan inişini, genetik algoritmaları veya diğer "yaklaşım algoritmalarını" öneren bir cevap verdim . Bir yorumda, birisi bana bu yöntemlerin "yaklaşım algoritmaları" olmadığını ve "yaklaşım algoritmaları" olmadığını ve çoğu zaman teorik olarak en uygun duruma gelmediğini söyledi (çünkü …

3
Prediktif modelleme yarışmaları için siteler
Kaggle , TunedIt ve CrowdAnalytix ile ilgili tahminli modelleme yarışmalarına katılıyorum . Bu sitelerin istatistik / makine öğrenimi için "alıştırma yapmak" için iyi bir yol olduğunu düşünüyorum. Bilmem gereken başka siteler var mı? Ev sahibinin rakiplerin sunumlarından kâr elde etmek istediği yarışmalar hakkında ne düşünüyorsunuz? / edit: İşte daha eksiksiz …

5
Sınıflandırma ağaçlarına alternatifler, daha iyi tahmine dayalı (örneğin: CV) performans?
Daha iyi tahmin gücü sağlayabilecek Sınıflandırma Ağaçlarına bir alternatif arıyorum. Ele aldığım verilerin hem açıklayıcı hem de açıklanmış değişkenler için faktörleri var. Bu bağlamda rastgele ormanlara ve sinir ağlarına rastladığımı hatırlıyorum, daha önce hiç denememiş olmama rağmen, böyle bir modelleme görevi için başka iyi bir aday var mı (açıkça R'de)?

1
Xgboost algoritmasında min_child_weight açıklaması
Min_child_weight parametresinin xgboost içindeki tanımı şöyledir: Bir çocukta ihtiyaç duyulan minimum örnek ağırlığı (kendir) toplamı. Ağaç bölüm adımı, örneğin ağırlık toplamının min_child_weight değerinden daha az olduğu bir yaprak düğümüyle sonuçlanırsa, oluşturma işlemi daha fazla bölümlendirme yapacaktır. Doğrusal regresyon modunda, bu sadece her düğümde olması gereken minimum örnek sayısına karşılık gelir. …



1
Tek etkin kodlamayı kullanırken sütunlardan birini düşürme
Anladığım kadarıyla, makine öğreniminde, veri kümenizin aynı bilgileri etkili bir şekilde kodladıkları için yüksek derecede ilişkili özelliklere sahip olması bir sorun olabilir. Son zamanlarda birisi, kategorik bir değişken üzerinde tek-sıcak kodlama yaptığınızda, ilişkili özelliklerle sonuçlandığınızı, bu yüzden bunlardan birini "referans" olarak bırakmanız gerektiğini belirtti. Örneğin, cinsiyeti iki değişken olarak kodlamak …

1
Sinir ağlarının maliyet fonksiyonu neden dışbükey değildir?
Burada da benzer bir iş parçacığı var ( Sinir ağının maliyet işlevi dışbükey değil mi? ) Fakat buradaki cevaplardaki noktaları anlayamadım ve bunun tekrar sorulma nedeninin bazı sorunları netleştireceğini umuyorum: I karesi alınmış farkı maliyet fonksiyonunun toplamı kullanıyorum için, sonuçta formun şey optimize am y eğitim aşaması esnasında gerçek etiket …

1
ResNet atlama aracılığıyla gradyan geri yayılımı bağlantıları atla
Degradelerin ResNet modülleri / atlama bağlantıları kullanarak bir sinir ağı üzerinden nasıl yayıldığını merak ediyorum. ResNet hakkında birkaç soru gördüm (örneğin , atlama katmanı bağlantılarına sahip sinir ağı ) ancak bu, özellikle eğitim sırasında degradelerin geri yayılması hakkında sorular soruyor. Temel mimari burada: Görüntü Tanıma için Kalıntı Ağları Çalışması adlı …

3
Gizli katman nöronları olarak Relmo vs Sigmoid Softmax
Tensorflow tarafından yalnızca bir gizli katmana sahip basit bir Sinir Ağı ile oynuyordum ve sonra gizli katman için farklı aktivasyonlar denedim: relu sigmoid Softmax (peki, genellikle softmax son katmanda kullanılır ..) Relu en iyi tren doğruluğunu ve doğrulama doğruluğunu verir. Bunu nasıl açıklayacağımdan emin değilim. Relu’nun gradyan-yok oluşu gibi seyreklik …

4
Bu grafiğin adı yanlış ve gerçek pozitif oranları gösteren nedir ve nasıl üretilir?
Aşağıdaki resim, doğru pozitif oranlara karşı sürekli olarak yanlış pozitif oranların bir eğrisini göstermektedir: Ancak, hemen alamadığım, bu oranların nasıl hesaplandığı. Bir veri kümesine bir yöntem uygulanırsa, belirli bir FP hızına ve belirli bir FN hızına sahiptir. Bu, her yöntemin eğri yerine tek bir noktaya sahip olması gerektiği anlamına gelmiyor …

1
Uygun puanlama kuralları arasında seçim yapma
Uygun puanlama kurallarıyla ilgili çoğu kaynak, log kaybı, Brier puanı veya küresel puanlama gibi farklı puanlama kurallarından bahseder. Ancak, genellikle aralarındaki farklar hakkında çok fazla rehberlik yapmazlar. (Sergi A: Vikipedi .) Logaritmik skoru maksimize eden modelin seçilmesi, logaritmik skorlamanın kullanılması için iyi bir argüman gibi görünen maksimum olabilirlik modelinin seçilmesine …

2
“Bayesian Akıl Yürütme ve Makine Öğrenimi” sonrası sonraki adımlar
Şu anda David Barber tarafından "Bayesian Reasoning and Machine Learning" den geçiyorum ve temelleri öğrenmek için oldukça iyi yazılmış ve ilgi çekici bir kitap. Bu yüzden bunu zaten yapmış olan birine bir soru. Barber'daki kavramların çoğunda makul bir yeterliliğe sahip olduktan sonra okumam gereken bir sonraki kitap seti hangileridir?


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.