«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.

5
Çekirdek SVM: Daha yüksek boyutlu bir özellik alanına eşlemenin sezgisel bir şekilde anlaşılmasını ve bunun doğrusal ayırmayı nasıl mümkün kıldığını anlamak istiyorum
Çekirdek SVM'lerin arkasındaki sezgiyi anlamaya çalışıyorum. Şimdi, doğrusal SVM'nin nasıl çalıştığını anlıyorum, böylece verileri olabildiğince bölen bir karar satırı hazırlanıyor. Verileri daha yüksek boyutlu bir alana taşıma arkasındaki ilkeyi ve bunun bu yeni alanda doğrusal bir karar çizgisi bulmayı nasıl kolaylaştırabileceğini de anlıyorum. Anlamadığım şey, veri noktalarını bu yeni alana …

1
Araştırmada yüksek doğrulama doğruluğu ancak düşük test doğruluğu varsa ne olur?
Makine öğrenimi araştırmalarında doğrulama hakkında özel bir sorum var. Bildiğimiz gibi, makine öğrenme rejimi araştırmacılardan modellerini eğitim verileri üzerinde eğitmelerini, doğrulama seti ile aday modeller arasından seçim yapmalarını ve test setinde doğruluğunu bildirmelerini ister. Çok titiz bir çalışmada, test seti sadece bir kez kullanılabilir. Bununla birlikte, asla araştırma senaryosu olamaz, …

1
CNN'ler yok olan gradyan problemini nasıl önler
Konvansiyonel sinir ağları hakkında çok şey okudum ve yok olan gradyan probleminden nasıl kaçındıklarını merak ediyordum. Derin inanç ağlarının tek seviyeli otomatik kodlayıcıları veya diğer önceden eğitilmiş sığ ağları biriktirdiğini biliyorum ve bu nedenle bu sorunu önleyebilirim ama CNN'lerde nasıl önlendiğini bilmiyorum. Wikipedia'ya göre : "yukarıda belirtilen" kaybolan gradyan sorununa …

4
Bir evrişimli sinir ağı için ne kadar veriye ihtiyacınız var?
Yaklaşık 1.000.000 parametreye sahip olan evrişimli bir sinir ağım (CNN) varsa, kaç tane eğitim verisine ihtiyaç duyulur (stokastik degrade iniş yaptığımı varsayalım)? Temel kural var mı? Ek notlar: Stokastik gradyan inişi gerçekleştirdiğimde (örneğin, 1 yineleme için 64 yama), ~ 10000 yinelemeden sonra, sınıflandırıcının doğruluğu kaba bir sabit değere ulaşabilir). Bu, …

4
Gizli özelliklerin anlamı?
Tavsiye sistemleri için matris çarpanlara ayırma modellerini anlamaya çalışıyorum ve her zaman 'gizli özellikleri' okuyorum, ama bu ne anlama geliyor? Bir özelliğin bir eğitim veri kümesi için ne anlama geldiğini biliyorum, ancak gizli özellikler fikrini anlayamıyorum. Konuyla ilgili bulabildiğim her makale çok sığ. Düzenle: en azından beni fikri açıklayan bazı …

3
Çevrimiçi öğrenmede düzenlileştirme ve özellik ölçeklendirme?
Diyelim ki lojistik regresyon sınıflandırıcım var. Normal toplu öğrenmede, aşırı sığmayı önlemek ve ağırlıkları küçük tutmak için düzenli bir terim olurdu. Ayrıca özelliklerimi normalleştirip ölçeklendirirdim. Çevrimiçi öğrenme ortamında sürekli bir veri akışı alıyorum. Her örnekle degrade iniş güncellemesi yapıyorum ve sonra atıyorum. Çevrimiçi öğrenmede özellik ölçeklendirme ve düzenleme terimini kullanmam …


7
Borsa tahmininde hangi makine öğrenme algoritması kullanılabilir?
Alternatif olarak döviz piyasalarını tahmin etmek. Bunun oldukça karmaşık olabileceğini biliyorum, bu yüzden bir giriş olarak, bazı doğruluklara sahip basit bir tahmin algoritması arıyorum. (Dört ay süren bir yüksek lisans üniversite projesi için) Çok katmanlı bir sinir ağının yararlı olabileceğini okudum. Bunun hakkında bir fikrin var mı? Ayrıca, sosyal medyanın …

5
Bir dizi girdi için hangi istatistiksel sınıflandırma algoritması doğru / yanlış tahmin edebilir?
Bir dizi girdi verildiğinde, bu dizinin istenen belirli bir özelliğe sahip olup olmadığını belirlemem gerekir. Özellik yalnızca doğru veya yanlış olabilir, yani bir dizinin ait olabileceği yalnızca iki olası sınıf vardır. Dizi ve özellik arasındaki kesin ilişki belirsizdir, ancak bunun çok tutarlı olduğuna ve istatistiksel sınıflandırmaya uygun olması gerektiğine inanıyorum. …

1
Neden tek bir ReLU bir ReLU öğrenemez?
Bir takip gelince Benim sinir ağı bile Öklid mesafe öğrenemez Hatta daha ve tek relu için (rastgele ağırlığı) tek relu eğitmek çalıştı basitleştirilmiş. Bu, en basit ağdır ve yine de birleşemediği zamanın yarısıdır. İlk tahmin hedefle aynı yönde ise, hızlı bir şekilde öğrenir ve doğru 1 ağırlığına yaklaşır: İlk tahmin …

3
Kullback-Leibler (KL) diverjansının maksimum değeri nedir
Python kodumda KL sapmasını kullanacağım ve bu öğreticiyi aldım . Bu derste KL ıraksama uygulamak oldukça basittir. kl = (model * np.log(model/actual)).sum() Anlıyorum gibi, olasılık dağılımı modelve actual<= 1 olmalıdır. Benim sorum, k'nin maksimum bağlı / maksimum değeri nedir? Kodumda maksimum sınır için olduğu gibi kl mesafesinin maksimum değerini bilmeliyim.

3
Makine öğreniminde veri eksikliği problemini çözme yöntemleri
Makine öğrenme algoritmalarını kullanarak tahminlerde bulunmak istediğimiz herhangi bir veritabanı, bazı özellikler için eksik değerler bulacaktır. Bu sorunu ele almak, eksik değerlere sahip satırları karakteristiklerin ortalama değerleriyle dolana kadar hariç tutmak için birkaç yaklaşım vardır. Temelde bağımlı değişken (Y) eksik değerleri olan sütunların her biri ancak tablonun satırları ile olacak …

2
Makine öğreniminde Bayes Hatası nedir?
http://www.deeplearningbook.org/contents/ml.html Sayfa 116, bayes hatasını aşağıdaki gibi açıklar İdeal model, verileri üreten gerçek olasılık dağılımını bilen bir kahin. Böyle bir model bile birçok problemde hala hataya neden olacaktır, çünkü dağıtımda hala gürültü olabilir. Denetimli öğrenme durumunda, x'den y'ye eşleme doğal olarak stokastik olabilir veya y, x'e dahil olanların yanı sıra …

2
Hassas hatırlama eğrisinde "taban çizgisi" nedir
Hassas hatırlama eğrisini anlamaya çalışıyorum, hassasiyet ve hatırlamanın ne olduğunu anlıyorum ama anlamadığım şey "temel" değer. Bu bağlantıyı okuyordum https://classeval.wordpress.com/introduction/introduction-to-the-precision-recall-plot/ ve "Mükemmel bir sınıflandırıcının bir Hassas-Geri Çağırma eğrisi" bölümünde gösterildiği gibi taban kısmını anlamıyorum, ne işe yarar? ve bunu nasıl hesaplıyoruz? Sadece seçtiğimiz rastgele bir başlangıç ​​noktası mı? Örneğin, retweet,status_countvb …

2
Sinir ağlarında toplu öğrenme yönteminde ağırlıklar nasıl güncellenir?
Birisi bana toplu iş yöntemini kullanarak nasıl bir sinir ağı kurmam gerektiğini söyleyebilir mi? Toplu modda, eğitim setindeki tüm numuneler için, ağdaki her nöron için hata, delta ve dolayısıyla delta ağırlıklarını hesapladığımızı ve sonra ağırlıkları hemen güncellemek yerine, biriktirdiğimizi ve daha sonra bir sonraki dönemde ağırlıkları güncelliyoruz. Ben de bir …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.