«dropout» etiketlenmiş sorular

5
Evrişimli sinir ağlarında aşırı uyum. Bırakma yardımcı olmuyor
Biraz konnets ile oynuyorum. Özellikle, kedi veya köpek (her biri 12500) olarak etiketlenmiş 25000 görüntüden oluşan kaggle cats---dogs veri kümesini kullanıyorum. Test setimde yaklaşık% 85 sınıflandırma doğruluğu elde etmeyi başardım, ancak% 90 doğruluk elde etme hedefi belirledim. Benim asıl sorunum aşırı uymak. Her nasılsa her zaman olur (normalde 8-10 döneminden …

5
Bir bırakma katmanı eklemek, bırakmanın modeldeki bazı nöronları bastırdığı düşünüldüğünde neden derin / makine öğrenme performansını iyileştirir?
Bazı nöronların çıkarılması daha iyi bir model ile sonuçlanıyorsa, neden daha az katman ve daha az nöron içeren daha basit bir sinir ağı kullanmıyorsunuz? Neden başlangıçta daha büyük, daha karmaşık bir model oluşturmalı ve daha sonra parçalarını bastırmalısınız?

3
Python için kullanıma hazır iyi dil modelleri var mı?
Ben bir uygulama prototip ve bazı oluşturulan cümleler üzerinde şaşkınlık hesaplamak için bir dil modeline ihtiyacım var. Python'da kolayca kullanabileceğim eğitimli bir dil modeli var mı? Gibi basit bir şey model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

2
Hangi LSTM katmanlarında bırakma?
LSTMBırakma ile çok katmanlı bir katman kullanmak , tüm Gizli katmanların yanı sıra Yoğun katmanların çıktısına bırakma yapılması önerilir mi? Hinton'un makalesinde (Bırakmayı önerdi), sadece Yoğun katmanlara Bırakmayı koydu, ancak gizli iç katmanlar kıvrımlıydı. Açıkçası, kendi modelimi test edebilirim, ama bu konuda bir fikir birliği olup olmadığını merak ettim?

1
DropOut evrişimsel katmanlarla tam olarak nasıl çalışır?
Bırakma ( kağıt , açıklama ) bazı nöronların çıkışını sıfıra ayarlar. Bir MLP için, Iris çiçeği veri kümesi için aşağıdaki mimariye sahip olabilirsiniz : 4 : 50 (tanh) : dropout (0.5) : 20 (tanh) : 3 (softmax) Şu şekilde çalışır: softmax(W3⋅tanh(W2⋅mask(D,tanh(W1⋅input_vector)))softmax(W3⋅tanh⁡(W2⋅mask(D,tanh⁡(W1⋅input_vector)))softmax(W_3 \cdot \tanh(W_2 \cdot \text{mask}(D, \tanh(W_1 \cdot input\_vector))) ile , …
10 dropout 

2
Ayrılmayı ve diğer düzenlemeleri inceleyen çalışmalar var mı?
Tercihen farklı alanlarda (veya en azından farklı veri kümelerinde) nöral ağlar için düzenleme yöntemlerinin farklılıklarını gösteren yayınlanmış makaleler var mı? Soruyorum çünkü şu anda çoğu insanın bilgisayar görüşünde düzenlileştirme için sadece bırakma hissi verdiğini hissediyorum. Farklı düzenleme yöntemleri kullanmak için bir neden olup olmadığını kontrol etmek istiyorum.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.