İstatistikler ve Büyük Veri machine-learning

1

Her işlem için bir çıktı birimi olduğunda Sinir Ağları ile Q-öğrenme ne kadar etkilidir?

Arka plan: Güçlendirme öğrenme görevimde Sinir Ağı Q-değeri yaklaşımını kullanıyorum. Yaklaşım, bu soruda açıklananla tamamen aynıdır , ancak sorunun kendisi farklıdır. Bu yaklaşımda çıktıların sayısı, gerçekleştirebileceğimiz eylemlerin sayısıdır. Ve basit bir deyişle, algoritma aşağıdaki gibidir: A eylemini yapın, ödülü keşfedin, NN'den tüm olası eylemler için Q değerlerini tahmin etmesini isteyin, …

9 machine-learning neural-networks reinforcement-learning q-learning

2

Sinir ağının güvenini tahmin etme

Sınıflandırma veya regresyon gerçekleştirmek için derin bir sinir ağı eğitmek istediğimi, ancak tahminin ne kadar emin olacağını bilmek istiyorum. Bunu nasıl başarabilirim? Benim fikrim, yukarıdaki nöral metrelerdeki tahmin performansına dayanarak, her eğitim verisi için çapraz entropiyi hesaplamaktır. Daha sonra, her bir referans noktasını girdi olarak alacak olan regresyon için ikinci …

9 machine-learning neural-networks

1

ReLU nöronları için Giriş Normalizasyonu

Göre LeCun ve arkadaşları (1998) tarafından "Etkin Backprop" bunların ikinci türev en aralığında yaklaşık 0 ve yalan merkezli şekilde tüm girdilerin normalleştirmek için iyi bir uygulamadır. Örneğin, "Tanh" işlevi için [-0.5,0.5] kullanırdık. Bu, Hessian daha istikrarlı hale geldiğinden geri yayılmanın ilerlemesine yardımcı olmak içindir. Bununla birlikte, max (0, x) olan …

9 machine-learning neural-networks normalization deep-learning multidimensional-scaling

2

Uygulamada derin öğrenmenin darboğazı

Çok sayıda derin öğrenme belgesini okuduktan sonra, bir tür kaba duygu, normalden daha iyi performans elde etmek için ağın eğitilmesinde çok sayıda hile olması. Bir endüstri uygulaması perspektifinden bakıldığında, google veya facebook gibi büyük teknoloji şirketlerindeki seçkin araştırma grupları dışında bu tür numaralar geliştirmek çok zordur. O zaman pratikte derin …

9 machine-learning deep-learning deep-belief-networks

1

Kontür

I regresyon genel kurulumu, sürekli bir fonksiyon kabul , bir ailesinden seçilen bir verilen verilere uygun ( küp gibi herhangi bir boşluk veya aslında makul bir topolojik boşluk olabilir) bazı doğal kriterlere göre.hθ:X→Rnhθ:X→Rnh_\theta:X\to \mathbb R^n{hθ}θ{hθ}θ\{h_\theta\}_\theta(xi,yi)∈X×Rn,i=1,…,k(xi,yi)∈X×Rn,i=1,…,k(x_i,y_i)\in X\times \mathbb R^n, i=1,\ldots, kXXX[0,1]m[0,1]m[0,1]^m Bir kontur ilgilendiği regresyon orada uygulamalardır bir bir noktada için …

9 regression machine-learning multiple-regression

1

Lasso için düz alt gradyan yöntemleri yerine neden proksimal gradyan inişi?

Lasso'yu vanilya alt gradyan yöntemleri ile çözmeyi düşünüyordum. Ama Proksimal degrade iniş kullanmayı öneren insanları okudum. Birisi neden Kement için vanilya alt gradyan yöntemleri yerine proksimal GD'nin kullanıldığını vurgulayabilir mi?

9 machine-learning optimization lasso gradient-descent

1

Bu otomatik kodlayıcı ağının işlevi düzgün şekilde yapılamıyor (evrişimli ve makspool katmanlarla)

Otomatik kodlayıcı ağları normal sınıflandırıcı MLP ağlarından çok daha karmaşık görünmektedir. Lasagne kullanarak yapılan birkaç denemeden sonra , yeniden yapılandırılmış çıktıda elde ettiğim her şey, en iyi şekilde , giriş basamağının gerçekte ne olduğunu ayırt etmeden MNIST veritabanının tüm görüntülerinin bulanık bir ortalamasına benzeyen bir şeydir . Seçtiğim ağ yapısı …

9 machine-learning neural-networks dimensionality-reduction unsupervised-learning autoencoders

2

SVM'leri kullanırken neden özellikleri ölçeklendirmem gerekiyor?

Scikit-learn'daki StandardScaler nesnesinin belgelerine göre : Örneğin, bir öğrenme algoritmasının objektif işlevinde kullanılan birçok öğe (Destek Vektör Makinelerinin RBF çekirdeği veya doğrusal modellerin L1 ve L2 düzenleyicileri gibi) tüm özelliklerin 0 etrafında ortalandığını ve aynı sırayla varyansa sahip olduğunu varsayar. Bir özellik, diğerlerinden daha büyük büyüklük sıralarına sahip bir varyansa …

9 machine-learning svm standard-deviation mean references

1

Güçlendirilmiş regresyon ağaçlarının (BRT), genelleştirilmiş hızlandırılmış modellerin (GBM) ve gradyan güçlendirme makinesinin (GBM) mutabakatı

Sorular: Arttırılmış regresyon ağaçları (BRT) ve genelleştirilmiş arttırılmış modeller (GBM) arasındaki farklar nelerdir? Bunlar birbirinin yerine kullanılabilir mi? Biri diğerinin belirli bir şekli mi? Ridgeway neden Friedman'ın daha önce "Gradient Boosting Machine" (GBM) olarak önerdiğini tanımlamak için "Genelleştirilmiş Artırılmış Regresyon Modelleri" (GBM) ifadesini kullandı? Bu iki kısaltma aynıdır, aynı şeyi …

9 machine-learning boosting gbm

2

Artırma için çantadan çıkma hatası tahmini?

Rastgele Orman'da her ağaç, verilerin benzersiz bir takviye örneğine paralel olarak büyütülür. Her takviye örneğinin benzersiz gözlemlerin yaklaşık% 63'ünü içermesi beklendiğinden, bu, ağacın test edilmesi için kullanılabilecek gözlemlerin yaklaşık% 37'sini dışarıda bırakır. Şimdi, Stokastik Degrade benzer bir tahmini var gibi görünüyor :OOBerrorOOBerrorOOB_{error} Bag.fraction 0 değerinden daha büyük olarak ayarlanırsa (0,5 …

9 machine-learning cross-validation data-mining random-forest boosting

1

Sürekli değişken için optimum ayrıklaştırma nasıl bulunur ve değerlendirilir

Sürekli değişken ve ikili hedef değişken (0 ve 1) ile bir veri kümesi var. Sürekli değişkenleri (lojistik regresyon için) hedef değişkene göre ayırmak ve her aralıktaki gözlem sıklığının dengelenmesi gerekir. Chi Merge, karar ağaçları gibi makine öğrenme algoritmalarını denedim. Chi merge bana her aralıkta çok dengesiz sayılarla aralıklar verdi (3 …

9 r machine-learning chi-squared discrete-data supervised-learning

2

CART ağaçları tahmin ediciler arasındaki etkileşimleri yakalar mı?

Bu makale , CART'ta, her adımda tek bir ortak değişken üzerinde ikili bir bölünme gerçekleştirildiğinden, tüm bölünmelerin dik olduğunu ve bu nedenle ortak değişkenler arasındaki etkileşimlerin dikkate alınmadığını iddia etmektedir. Bununla birlikte, birçok ciddi referans, aksine, bir ağacın hiyerarşik yapısının, öngörücüler arasındaki etkileşimlerin otomatik olarak modellenmesini (örneğin, bu makale ve …

9 machine-learning classification data-mining cart

1

Otomatik kodlayıcıda ve evrişimli sinir ağında öğrenilen filtreler arasındaki farklar nelerdir?

CNN'de, evrişimsel katmanda özellik haritası üretmek için filtreleri öğreneceğiz. Otomatik kodlayıcıda, her katmanın tek gizli birimi filtre olarak kabul edilebilir. Bu iki ağda öğrenilen filtreler arasındaki fark nedir?

9 machine-learning neural-networks conv-neural-network autoencoders

3

ImageNet: İlk beş hata ne anlama geliyor?

ImageNet Yarışması için değerlendirme yöntemlerinden biri (1000 kategori resmi sınıflandırın) ilk 5 hatasıdır, bu ne anlama gelir? Bkz. Http://www.image-net.org/challenges/LSVRC/

9 machine-learning classification computer-vision

2

Manifold varsayımının doğru olduğunu nasıl kanıtlayabilirim?

Makine öğrenmesinde, genellikle bir veri kümesinin düzgün bir düşük boyutlu manifoldda (manifold varsayımı) olduğu varsayılır, ancak belirli koşulların karşılandığını varsaymanın herhangi bir yolu vardır, o zaman veri kümesi gerçekten (yaklaşık olarak) üretilir boyutlu pürüzsüz bir manifolddan? Örneğin, bir veri sekansı verilen burada (farklı açılarla ön görüntü sırasını ki) ve karşılık …

9 machine-learning dimensionality-reduction manifold-learning

«machine-learning» etiketlenmiş sorular