«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.

3
(Derin) sinir ağlarının açıkça başka yöntemlerden daha iyi performans gösteremediği denetimli öğrenme sorunu var mı?
İnsanların SVM ve Çekirdekler üzerine çok çaba sarf ettiğini ve Makine Öğreniminde bir başlangıç ​​olarak oldukça ilginç göründüğünü gördüm. Ancak, (her zaman) (Yapay Sinir Ağı) açısından neredeyse her zaman daha iyi bir çözüm bulmamızı beklersek, bu dönemde başka yöntemler denemenin anlamı nedir? İşte bu konudaki kısıtlarım. Sadece Denetimli Öğrenmeyi düşünüyoruz; …


5
SVM, her seferinde bir örnek öğrenme akışını yapabilir mi?
Bir akış veri setim var, örnekler birer birer hazır. Onlar üzerinde çok sınıflandırma yapmam gerekiyor. Öğrenme sürecine bir eğitim örneği beslediğimde, örneği atmam gerekiyor. Aynı zamanda, etiketlenmemiş veriler üzerinde öngörüde bulunmak için en son modeli kullanıyorum. Bildiğim kadarıyla bir sinir ağı, örnekleri birer birer besleyerek ve örnek üzerinde ileriye doğru …

1
Yükseltme için göreceli değişken önemi
Göreceli değişken öneminin aşırı genel / basit olmayan Gradient Boostted Trees içinde nasıl hesaplandığına dair bir açıklama arıyorum: Ölçümler, bir değişkenin bölünme için seçilme sayısına dayanır, her bölünmenin sonucu olarak karenin iyileştirilmesiyle ağırlıklandırılır ve tüm ağaçların ortalaması alınır . [ Elith ve diğ. 2008, Regresyon ağaçlarının güçlendirilmesi için bir çalışma …

3
Gizli Markov modelleri ve koşullu rasgele alanlar arasındaki sezgisel fark
HMM'lerin (Gizli Markov Modelleri) üretken modeller olduğunu ve CRF'nin ayırt edici modeller olduğunu anlıyorum. Ayrıca CRF'lerin (Koşullu Rastgele Alanlar) nasıl tasarlandığını ve kullanıldığını da biliyorum. Anlamadığım şey, bunların HMM'lerden farklı olmaları mı? HMM durumunda, sadece bir sonraki durumumuzu önceki düğümde, mevcut düğümde ve geçiş olasılığına göre modelleyebildiğimizi okudum, ancak CRF'ler …

4
Tanh neden bir aktivasyon işlevi olarak neredeyse her zaman sigmoidlerden daha iyidir?
Andrew Ng'un Yapay Sinir Ağları ve Coursera'daki Derin Öğrenme kursunda kullanmanın neredeyse her zaman kullanmanın tercih edildiğini söylüyor .tanhtanhtanhsigmoidsigmoidsigmoid O verir nedeni çıkışları kullanarak olmasıdır daha etrafında 0 ziyade merkezi 'ın 0.5, ve bu 'biraz daha kolay bit sonraki katman için öğrenme yapar'.tanhtanhtanhsigmoidsigmoidsigmoid Aktivasyonun çıkış hızını merkezlemek neden öğreniyor? Sanırım …

4
Dereceyi düşürmek yerine neden polinom regresyonunda düzenlileştirme kullanılmalı?
Örneğin, regresyon yaparken, seçilecek iki hiper parametresi genellikle fonksiyonun kapasitesidir (örneğin bir polinomun en büyük üssü) ve düzenlileştirme miktarıdır. Kafam karıştı, neden sadece düşük kapasiteli bir işlev seçmiyor ve ardından herhangi bir düzenlemeyi yok sayıyorsunuz? Bu şekilde, fazla giymeyecek. Düzenlemeyle birlikte yüksek kapasiteli bir işleve sahipsem, düşük kapasiteli bir işleve …

1
Geçici Ağda Link Anomalisi Tespiti
Trend konularını tahmin etmek için link anomalisi tespitini kullanan bu makaleyle karşılaştım ve inanılmaz derecede ilgi çekici buldum: “Sosyal Bağlantılarda Yeni Gelişen Konuları Link Anomalisi Tespiti ile Keşfetmek” . Farklı bir veri setinde çoğaltmayı çok isterdim, ama onları nasıl kullanacaklarını bilecek yöntemlere yeterince aşina değilim. Diyelim ki altı aylık bir …




1
CNN regresyon mimarileri?
Girişin bir görüntü olduğu ve etiketin 80 ile 350 arasında sürekli bir değer olduğu bir regresyon problemi üzerinde çalışıyorum. Bir reaksiyon gerçekleştikten sonra görüntüler bazı kimyasallara sahip. Ortaya çıkan renk, geride kalan başka bir kimyasal maddenin konsantrasyonunu gösterir ve modelin çıktısı budur - o kimyasal maddenin konsantrasyonu. Görüntüler döndürülebilir, çevrilebilir, …

2
OLS doğrusal regresyonunda maliyet fonksiyonu
Andrew Ng tarafından Coursera'da makine öğrenmesi hakkında verilen lineer regresyon dersiyle biraz kafam karıştı. Orada, karelerin toplamını en aza indiren bir maliyet işlevi verdi: 12m∑i=1m(hθ(X(i))−Y(i))212m∑i=1m(hθ(X(i))−Y(i))2 \frac{1}{2m} \sum _{i=1}^m \left(h_\theta(X^{(i)})-Y^{(i)}\right)^2 nereden geldiğini anlıyorum . Bence öyle yaptı ki, kare teriminde türev gerçekleştirdiğinde, kare terimdeki 2, yarı ile iptal edecektir. Ama nereden …

2
“Derin öğrenme” ile çok seviyeli / hiyerarşik modelleme arasındaki fark nedir?
"Derin öğrenme" çok düzeyli / hiyerarşik modelleme için başka bir terim midir? İkincisine öncekinden çok daha aşinayım, ancak söyleyebileceğim kadarıyla, temel fark tanımlarında değil, uygulama alanlarında nasıl kullanıldığı ve değerlendirildiği. Tipik bir "derin öğrenme" uygulamasındaki düğümlerin sayısı daha büyüktür ve genel bir hiyerarşik form kullanır, oysa çok seviyeli modelleme uygulamaları …

7
Doğrulama doğruluğu neden dalgalanıyor?
MRI verilerini kullanarak kansere yanıtı tahmin etmek için dört katmanlı bir CNN'im var. Doğrusal olmamaları tanıtmak için ReLU aktivasyonlarını kullanıyorum. Trenin doğruluğu ve kaybı monoton bir şekilde artar ve düşer. Ancak, test doğruluğum çılgınca dalgalanmaya başlar. Öğrenme oranını değiştirmeyi, katman sayısını azaltmayı denedim. Ancak, dalgalanmaları durdurmaz. Bu cevabı bile okudum …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.