«machine-learning» etiketlenmiş sorular

Metodlar ve ilkeler "deneyim ile otomatik olarak gelişen bilgisayar sistemleri."

6
Denetimli öğrenmede, neden ilişkilendirilmiş özelliklere sahip olmak kötü?
Bir yerlerde, fazla korelasyon gösteren özelliklere sahip olmamız durumunda, bu modeli daha da kötüleştirebileceğinden birini kaldırmak zorunda olduğumuzu okudum. İlişkili özelliklerin aynı bilgileri getirdikleri anlamına geldiği açıktır, bu nedenle bunlardan birini kaldırmak mantıklıdır. Fakat bunun neden modeli daha da kötüleştirdiğini anlayamıyorum.

6
Çapraz entropi kaybı açıklaması
Diyelim ki sınıflandırma için bir NN yapıyorum. Son katman, softmax aktivasyonuna sahip bir Yoğun katmandır. Sınıflandırmam gereken beş farklı sınıfım var. Tek bir eğitim örneğin varsayalım, true labelolduğu [1 0 0 0 0]tahminlerin olmak iken [0.1 0.5 0.1 0.1 0.2]. Bu örnek için çapraz entropi kaybını nasıl hesaplardım?

1
Keras'ın “Yoğun” ile “TimeDistributedDense” arasındaki fark
Hala arasındaki fark hakkında karıştı Denseve TimeDistributedDensebir Keraszaten bazı benzer sorular soruldu bulunmasına rağmen burada ve burada . İnsanlar çok tartışıyorlar ancak ortak olarak kabul edilmiş sonuçlar yok. Ve yine de, burada , fchollet şunu belirtti: TimeDistributedDenseDense3B tensörün her zaman adımına aynı (tam olarak bağlı) işlemi uygular. Tam olarak aralarındaki …



3
Softmax sınıflandırıcısında normalizasyonu yapmak için neden exp fonksiyonunu kullanmalısınız?
Neden standart normalleştirme yerine softmax kullanılır? Bu sorunun en üst cevabının yorum alanında, @Kilian Batzner da beni şaşırtan 2 soru sordu. Sayısal faydalar dışında kimse açıklama yapmıyor gibi görünüyor. Çapraz Entropi Kaybı kullanma nedenlerini anlıyorum, ancak bunun softmax ile ilişkisi nedir? "Softmax işlevi tahminler ile gerçekler arasındaki çapraz entropiyi en …


7
Makine öğrenme görevleri için veriler neden karıştırılmalıdır?
Makine öğrenim görevlerinde verileri karıştırmak ve normalleştirmek normaldir. Normalleştirmenin amacı açıktır (aynı özellik değer aralığına sahip için). Ancak, çok fazla mücadele ettikten sonra, verileri karıştırmak için değerli bir sebep bulamadım. Bu yazı okudum var burada biz verileri karıştırmak gerektiğinde tartışan, ama biz verileri karıştırmak neden belli değil mi. Dahası, parti …

2
Zemin Gerçeği Nedir?
Makine Öğrenmesi bağlamında, Zemin Gerçeği kavramının çok fazla kullanıldığını gördüm . Çok şey aradım ve Wikipedia'da şu tanımı buldum : Makine öğrenmesinde "temel gerçek" terimi, eğitim setinin denetimli öğrenme teknikleri için sınıflandırılmasının doğruluğunu ifade eder. Bu, araştırma modellerini kanıtlamak veya yanlışlamak için istatistiksel modellerde kullanılır. "Temel gerçeğe uygunluk" terimi, bu …

1
Xgboost neden GradientBoostingClassifier'ı sklearn'den çok daha hızlı?
100 sayısal özellikli 50k örneklerin üzerinde bir degrade yükseltme modeli yetiştirmeye çalışıyorum. XGBClassifieriken benim makinede 43 saniye içinde kolları 500 ağaçları, GradientBoostingClassifierkolları sadece 10 ağaç (!) 1 dakika ve 2 saniye :( Ben rahatsız etmedi o saat sürer olarak 500 ağaç büyümeye çalışan. Aynı kullanıyorum learning_rateve max_depthayarları , aşağıya bakınız. …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

4
Yüksek derecede dengesiz veri setlerinin eğitimi için hızlı rehber
Eğitim setinde yaklaşık 1000 pozitif ve 10000 negatif örnek ile bir sınıflandırma problemim var. Yani bu veri seti oldukça dengesiz. Düz rastgele ormanlar sadece tüm test örneklerini çoğunluk sınıfı olarak işaretlemeye çalışıyor. Alt örnekleme ve ağırlıklı rastgele ormanlarla ilgili bazı iyi cevaplar burada verilmiştir: Çok taraflı veri kümeleriyle bir Ağaç …

4
Rastgele Orman ne zaman SVM ve ne zaman kullanılır?
Tüm bir kullanmak Random Forestüzerinde SVMtam tersi ve yardımcısı? Bunu anlıyorum cross-validationve model karşılaştırması, bir model seçmenin önemli bir yönüdür, ancak burada iki yöntemin genel kuralları ve sezgisel özellikleri hakkında daha fazla bilgi edinmek istiyorum. Birisi lütfen sınıflandırıcıların inceliklerini, güçlü yönlerini ve zayıflıklarını, ayrıca her birine en uygun olan sorunları …

4
Özgeçmiş verilerine dayanarak iş sınıflandırmasını yapmak için hangi algoritmaları kullanmalıyım?
Not: R'de her şeyi yapıyorum. Sorun şöyle devam ediyor: Temel olarak, özgeçmişlerin bir listesi (CV) var. Bazı adaylar daha önce iş tecrübesine sahip olacak, bazıları ise işe yaramayacak. Buradaki amaç: Özgeçmişlerindeki metinlere dayanarak, onları farklı iş sektörlerine göre sınıflandırmak istiyorum. Özellikle adayların herhangi bir deneyime sahip olmadığı / öğrenci olmadığı …

4
Yeni gözlemler mevcutsa, bir model yeniden eğitilmeli mi?
Bu yüzden, bu konuda herhangi bir literatür bulamamıştım, ancak düşünce vermeye değer bir şey gibi görünüyor: Yeni gözlemler mevcutsa model eğitimi ve optimizasyondaki en iyi uygulamalar nelerdir? Tahminler bozulmaya başlamadan önce bir modelin yeniden eğitim süresi / sıklığını belirlemenin bir yolu var mı? Parametreler toplanmış veriler için yeniden optimize edilmişse …

6
Model hiperparametreleri ve model parametreleri arasındaki fark nedir?
Model hiperparametresi ve model parametresi gibi terimlerin önceden netleştirilmeden ağ üzerinde değişmeli olarak kullanıldığını fark ettim . Bunun yanlış olduğunu ve açıklama gerektirdiğini düşünüyorum. Bir makine öğrenim modeli, bir SVM / NN / NB tabanlı sınıflandırıcı veya görüntü tanıyıcı, yalnızca akla ilk gelen şeyleri düşünün. Nelerdir hyperparameters ve parametreler modelin? …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.