Derin öğrenme ne zaman aşırıya kaçar?


15

Örneğin, e-postaları spam olarak sınıflandırmak için - zaman / doğruluk açısından - başka bir makine öğrenimi algoritması yerine derin öğrenme (mümkünse) uygulamak faydalı mıdır? Derin öğrenme, saf Bayes gibi diğer makine öğrenme algoritmalarını gereksiz kılacak mı?

Yanıtlar:


13

Her şey Yatırım Getirisi ile ilgili . DL "yapmaya değer" ise, aşırıya kaçmaz.

DL kullanmanın maliyeti (bilgisayar döngüleri, depolama, eğitim süresi) kabul edilebilirse ve onu eğitmek için mevcut veriler bolsa ve alternatif algoritmalara göre marjinal avantaj değerliyse, DL bir kazançtır.

Ancak, önerdiğiniz gibi, sorununuz alternatif yöntemlere uygunsa, özellikle regresyon veya naif Bayes gibi klasik yöntemlerle iyi eşleşen bir sinyal sunuyorsa veya sorununuz, karar sınırının nerede olduğu hakkında açıklama yapılmasını gerektiriyorsa (ör. karar ağaçları) veya verilerinizde DL (özellikle CNN'ler) için ihtiyaç duyulan sürekli degradeler yoksa veya verileriniz periyodik olarak yeniden eğitim gerektiren (özellikle öngörülemeyen aralıklarla) zaman içinde değişiyorsa, DL muhtemelen sizin için bir uyumsuzluktur.


12

Derin öğrenme güçlüdür ancak bayesden daha üstün bir yöntem değildir . Yapmak için tasarlandıkları şeyde iyi çalışırlar:

Derin öğrenmeyi kullanın:

  • Hesaplama maliyeti örnekleme maliyetinden çok daha ucuzdur (örneğin: doğal dil işleme)
  • Yüksek derecede doğrusal olmayan bir sorununuz varsa
  • Özellik mühendisliğini basitleştirmek istiyorsanız
  • Önceden dağıtımınız yoksa (örneğin: ağırlıkları rasgele Gauss'a ayarlamak). Ya da öyle ama karmaşıklığı önemsemiyorsun.
  • Hız için doğruluk istiyorsanız (derin öğrenme yavaştır)

Saf bayesian kullanın:

  • Kullanmak istediğiniz önceden dağıtımınız varsa
  • Modelinizi hızlı ve kolay bir şekilde güncellemek istiyorsanız (özellikle birlikte modeller)
  • Kendi olasılık fonksiyonunuz varsa ve modelin tam olarak nasıl çalıştığını "kontrol etmek" istiyorsanız
  • Hiyerarşik modelleri modellemek istiyorsanız
  • Parametreleri değiştirmek istemiyorsanız
  • Daha hızlı bir model istiyorsanız, hem eğitimde hem de uygulamada
  • Bağımsızlık varsayımı yapmak istiyorsanız
  • Aşırı takmayı önlemek istiyorsanız (bu çok basit bir model)
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.