«deep-learning» etiketlenmiş sorular

Temelde derin sinir ağları ile yapılan verilerin hiyerarşik temsillerini öğrenmeyle ilgili makine öğrenimi alanı.

2
Ankraj Daha Hızlı RCNN
Ankraj hakkında konuşurken Daha Hızlı RCNN belgesinde, "referans kutuları piramitleri" kullanarak ne anlama geliyorlar ve bu nasıl yapılır? Bu sadece W * H * k bağlantı noktalarının her birinde bir sınırlama kutusunun üretildiği anlamına mı geliyor? Burada W = genişlik, H = yükseklik ve k = en boy oranı * …

1
SVM'ler = Şablon Eşleştirme nasıl?
SVM'leri okudum ve bir optimizasyon problemi çözdüklerini ve maksimum marj fikrinin çok makul olduğunu öğrendim. Şimdi, çekirdekleri kullanarak, doğrusal olmayan ayırma sınırlarını bile bulabilirler ki bu harikaydı. Şimdiye kadar, SVM'lerin (özel bir çekirdek makinesi) ve çekirdek makinelerinin sinir ağlarıyla nasıl ilişkili olduğu hakkında hiçbir fikrim yok mu? Yorumlarına düşünün Yann …

1
L2 ile RNN Düzenlemesi öğrenmeyi durdurur
Dengesiz bir olayı tespit etmek için Çift Yönlü RNN kullanıyorum. Pozitif sınıf, negatif sınıftan 100 kat daha azdır. Düzenleme kullanımı olmamasına rağmen tren setinde% 100, doğrulama setinde% 30 doğruluk elde edebilirim. L2 regülasyonunu açtım ve sonuç, daha uzun öğrenme yerine tren setinde sadece% 30 doğruluk ve doğrulama setinde% 100 doğruluk. …

2
DNN eğitiminin CPU ve GPU bellek gereksinimlerini tahmin etme
Diyelim ki derinlemesine bir öğrenme model mimarisi ve seçilen bir mini-parti boyutu var. Bu modeli eğitmek için beklenen bellek gereksinimlerini nasıl elde edebilirim? Örnek olarak, boyut 1000 girişi, 100 boyut 4 tam bağlantılı gizli katmanı ve boyut 10 ek çıkış katmanı olan (tekrarlayan olmayan) bir modeli düşünün. Mini seri boyutu …

1
Derin öğrenme için ne kadar veri var?
Derin öğrenmeyi (özellikle CNN'leri) ve aşırı sığmayı önlemek için genellikle çok fazla veriyi nasıl gerektirdiğini öğreniyorum. Bununla birlikte, bir modelin kapasitesi ne kadar yüksekse, fazla takmayı önlemek için o kadar fazla veriye ihtiyaç duyulduğu söylendi. Bu nedenle, sorum şu: Neden sadece derin bir sinir ağında katman başına katman / düğüm …

3
Dengesiz Sinir Ağları (CNN) ile dengesiz bir veri seti nasıl sınıflandırılır?
İkili sınıflandırma görevinde dengesiz bir veri setim var, burada pozitifler negatiflere karşı% 0.3'e karşı% 99.7. Pozitif ve negatifler arasındaki boşluk çok büyük. Bir CNN'yi MNIST probleminde kullanılan yapı ile eğittiğimde, test sonucu yüksek bir Yanlış Negatif Oran gösterir. Ayrıca, eğitim hatası eğrisi başlangıçta birkaç dönemde hızla düşer, ancak sonraki dönemlerde …


2
Bayeslilerin test setlerine ihtiyaç duymadığı doğru mu?
Kısa bir süre önce Eric J. Ma tarafından bu konuşmayı izledim ve Radford Neal'dan alıntı yaptığı blog girişini kontrol ettim, Bayesian modellerin abartılamadığını (ancak overfit edebileceklerini ) ve bunları kullanırken, onları doğrulamak için test setlerine ihtiyacımız yok ( Bana tırnak işaretleri yerine parametreleri ayarlamak için doğrulama kümesi kullanarak konuşmak gibi …

1
Hangi derin öğrenme modeli, birbirini dışlamayan kategorileri sınıflandırabilir
Örnekler: İş tanımında bir cümle var: "İngiltere'de Java kıdemli mühendisi". Derin bir öğrenme modelini 2 kategori olarak tahmin etmek istiyorum: English ve IT jobs. Geleneksel sınıflandırma modeli kullanırsam, sadece softmaxson katmanda işlevli 1 etiket tahmin edebilir . Bu nedenle, her iki kategoride "Evet" / "Hayır" ı tahmin etmek için 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
Cox tehlike modeli hayatta kalma eğrisini nasıl yorumlayabilirim?
Cox orantılı tehlike modelinden sağkalım eğrisini nasıl yorumluyorsunuz? Bu oyuncak örneğinde, verilerdeki agedeğişken üzerinde bir cox orantılı tehlike modelimiz olduğunu kidneyve hayatta kalma eğrisini oluşturduğumuzu varsayalım . library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Örneğin, zamanında hangi ifade doğrudur? ya da her ikisi de yanlış mı?200200200 Bildirim 1:% …

4
Sinir ağını regresyon için eğitmek her zaman ortalamayı öngörür
Ben görev bir görüntüde bir kutu (x, y) konumunu tahmin etmektir regresyon için basit bir evrişimsel sinir ağı, örneğin: Ağın çıktısında biri x, diğeri y için olmak üzere iki düğüm vardır. Ağın geri kalanı standart bir evrişimli sinir ağıdır. Kayıp, kutunun öngörülen konumu ile yer gerçeği konumu arasındaki standart ortalama …

3
Derin öğrenme kullanarak özellik seçimi?
Her bir modelin önemini derin model kullanarak hesaplamak istiyorum. Ancak derin öğrenme - derin özellik seçimi kullanarak özellik seçimi hakkında yalnızca bir makale buldum . İlk gizli katmandan önce, her bir özelliğe doğrudan bağlı bir düğüm katmanı eklerler. Derin inanç ağının (DBN) da bu tür işler için kullanılabileceğini duydum. Ama …

1
ReLU nöronları için Giriş Normalizasyonu
Göre LeCun ve arkadaşları (1998) tarafından "Etkin Backprop" bunların ikinci türev en aralığında yaklaşık 0 ve yalan merkezli şekilde tüm girdilerin normalleştirmek için iyi bir uygulamadır. Örneğin, "Tanh" işlevi için [-0.5,0.5] kullanırdık. Bu, Hessian daha istikrarlı hale geldiğinden geri yayılmanın ilerlemesine yardımcı olmak içindir. Bununla birlikte, max (0, x) olan …


2
Uygulamada derin öğrenmenin darboğazı
Çok sayıda derin öğrenme belgesini okuduktan sonra, bir tür kaba duygu, normalden daha iyi performans elde etmek için ağın eğitilmesinde çok sayıda hile olması. Bir endüstri uygulaması perspektifinden bakıldığında, google veya facebook gibi büyük teknoloji şirketlerindeki seçkin araştırma grupları dışında bu tür numaralar geliştirmek çok zordur. O zaman pratikte derin …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.