«machine-learning» etiketlenmiş sorular

Metodlar ve ilkeler "deneyim ile otomatik olarak gelişen bilgisayar sistemleri."


5
Yapay sinir ağlarında “ölen ReLU” sorunu nedir?
Stanford kursuna atıfta bulunan Görsel Tanıma Konvolüsyonel Sinir Ağları ile ilgili notlara bakınız. “Maalesef, ReLU üniteleri eğitim sırasında kırılgan olabilir ve“ ölebilir ”. Örneğin, bir ReLU nöronundan akan büyük bir gradyan ağırlığın, nöronun herhangi bir veri noktasında tekrar aktive olmayacağı şekilde güncellenmesine neden olabilir. gerçekleşirse, ünite boyunca akan gradyan sonsuza …

5
Yapay sinir ağlarında çapraz entropi hata fonksiyonu
Olarak ML başlayanlar için MNIST bunlar çapraz entropi tanımlar Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log⁡(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) ı y ' iyiyiy_i , sınıfı için öngörülen olasılık değeridir ve , bu sınıf için gerçek olasılıktır.iiiy′iyi′y_i' Soru 1 ( ) 0 olması sorun değil mi? Bu elbette çok kötü bir sınıflandırıcıya sahip …

15
Makine öğrenmesi için Python vs R
Daha yeni akademik amaçlı bir makine öğrenme uygulaması geliştirmeye başladım . Şu anda R kullanıyorum ve kendimi eğitiyorum. Ancak birçok yerde Python'u kullanan insanlar gördüm . Akademi ve endüstride insanlar ne kullanıyor ve tavsiye nedir?

8
Bir öğrenme oranı seçme
Şu anda, SGDgeri yayılım kullanan sinir ağları için , Stokastik Degrade İnişini uygulamak için çalışıyorum ve amacını anladığım sırada, öğrenme oranı için nasıl değer seçileceği konusunda bazı sorularım var. Öğrenme oranı, iniş oranını belirttiği için hata gradyanının şekliyle ilişkili midir? Eğer öyleyse, bu bilgiyi bir değer hakkında kararınızı bildirmek için …



5
Maliyet fonksiyonları neden kare hatasını kullanıyor?
Makine öğrenmeye yeni başlıyorum ve şimdiye dek tek değişkenli doğrusal regresyon ile uğraşıyorum. Bir hipotez olduğunu öğrendim: hθ( x ) = θ0+ θ1xhθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1x ve parametreleri için iyi değerleri bulmak için, hesaplanan sonuç ile test verilerimizin gerçek sonucu arasındaki farkı en aza indirmek istiyoruz. Yani çıkardıkθ 1θ0θ0\theta_0θ1θ1\theta_1 hθ( x( i )) …


8
Veri bilimci vs makine öğrenim mühendisi
Varsa, bir "veri bilimcisi" ile "makine öğrenim mühendisi" arasındaki farklar nelerdir? Geçen yıl boyunca “makine öğrenim mühendisi” iş ilanlarında çok fazla yer almaya başladı. Bu, özellikle “veri bilimcisi” teriminin ortaya çıktığı yer olan San Francisco'da belirgindir. Bir noktada "veri bilimcisi" "istatistikçiyi" ele geçirdi ve aynı şeyin şimdi "veri bilimcisine" yavaş …

3
AUC'nin standart doğruluk vs avantajları
Eğri altındaki alana (AUC) bakmaya başlamıştım ve faydası hakkında biraz kafam karıştı. AUC, bana ilk açıklandığında büyük bir performans ölçüsü gibi görünüyordu, ancak araştırmamda, yüksek standart doğruluk ölçümleri ve düşük AUC ile 'şanslı' modelleri yakalamanın en iyi yol olduğunu, avantajının çoğunlukla marjinal olduğunu iddia ettim. . Öyleyse, modelleri doğrulamak için …

6
karar ağacı / rastgele ormandaki özellikler olarak karakter dizileri
Karar ağacı / rastgele orman uygulamasında bazı problemler yaşıyorum. Sayı gibi karakter dizileri (ülke adı gibi) özellikli bir soruna uymaya çalışıyorum. Şimdi, kütüphane, scikit-learn sadece sayı olarak parametre alır, fakat önemli miktarda bilgi taşıdıkları gibi dizeleri de enjekte etmek istiyorum. Böyle bir senaryoyu nasıl idare ederim? Python'da karma gibi bazı …

8
Python'da açık kaynaklı Anomali Tespiti
Sorun Arka Planı: BT izleme alanında bulunanlara benzer günlük dosyaları içeren bir proje üzerinde çalışıyorum (BT alanını en iyi anladığım kadarıyla). Bu günlük dosyaları, yüzlerce / binlerce sıradaki çeşitli parametreler halinde düzenlenmiş zaman serisi verileridir. Her parametre sayısaldır (kayan nokta) ve her zaman noktası için önemsiz / hata olmayan bir …

9
Sklearn'de Tren / Test / Validasyon Seti
Sklearn ile bir veri matrisini ve ilgili etiket vektörünü rastgele bir X_train, X_test, X_val, y_train, y_test, y_val öğesine nasıl bölebilirim? Bildiğim kadarıyla sklearn.cross_validation.train_test_split, sadece ikiye bölme yeteneğine sahip, üçte değil ...

3
RNN vs CNN yüksek seviyede
Tekrarlayan Sinir Ağları (RNN) ve çeşitleri ve Konvolüsyonel Sinir Ağları (CNN) ve çeşitleri hakkında düşünüyordum. Bu iki noktanın söylemesi adil olur mu: Bir bileşeni (görüntü gibi) alt bileşenlere (görüntüdeki nesnenin, örneğin görüntüdeki nesnenin anahatları gibi) parçalamak için CNN'leri kullanın. Alt bileşenlerin birleşimini oluşturmak için RNN'leri kullanın (resim yazısı, metin oluşturma, …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.