Hangi durumlarda bir Karar ağacı ve diğer durumlarda bir KNN kullanmak daha iyidir? Neden belirli durumlarda bunlardan birini kullanıyorsunuz? Peki ya diğer durumlarda? (İşleyişine bakarak algoritmaya değil) Bununla ilgili bazı açıklamalar veya referanslar var mı?
Quora resmi veri kümesinde yinelenen soruları tahmin etmek için bir LSTM modeli oluşturdum. Test etiketleri 0 veya 1'dir. 1 soru çiftinin çift olduğunu gösterir. Kullanarak modeli oluşturduktan sonra model.fit, ben kullanarak modelin test model.predictdeney verileri üzerinde. Çıktı aşağıdaki gibi bir değer dizisidir: [ 0.00514298] [ 0.15161049] [ 0.27588326] [ 0.00236167] …
Dengesiz veri kümemde rastgele bir orman modeli çalıştırmak için Python kullanıyorum (hedef değişken ikili bir sınıftı). Eğitim ve test veri kümesini böldüğümde, katmanlı örnekleme (gösterilen kod gibi) kullanıp kullanmama konusunda mücadele ettim. Şimdiye kadar, projemde tabakalı vakanın daha yüksek bir model performansına yol açacağını gözlemledim. Ancak, modelimi, hedef sınıfın mevcut …
Bir grup öğrenicinin mümkün olan en iyi model sonuçlarına yol açtığı aksiyomatik hale gelmiş gibi görünüyor ve örneğin, tek modellerin Kaggle gibi yarışmalar kazanması çok daha nadir hale geliyor. Toplulukların neden bu kadar lanet etkili olduğuna dair teorik bir açıklama var mı?
Bir web sitesinden ürün satın alan bir kullanıcı veri setim var. Sahip olduğum özellikler kullanıcı kimliği, kullanıcının bölge (eyalet), ürün kategorisi kimliği, ürünün anahtar kelime kimliği, web sitesinin anahtar kelime kimliği ve ürünün harcanan satış tutarıdır. Amaç, "erkek genç oyuncu" veya "evde anne kalmak" gibi kullanıcıların kimliğini belirlemek için bir …
Ruby için nispeten eksiksiz (denetimli ve denetimsiz öğrenme için çok çeşitli algoritmalar dahil), sağlam bir şekilde test edilmiş ve iyi belgelenmiş makine öğrenimi kütüphaneleri var mı? İnanılmaz belgeleriyle Python'un scikit-öğrenmesini seviyorum , ancak bir müşteri kodu aşina oldukları için Ruby'de yazmayı tercih ediyor. İdeal olarak, seyrek matrisler ve öğrenciler gibi …
Aşağıdaki özelliklere sahip bir veri kümem var: 2.821 pozitif 193.176 numune ile eğitim veri seti 673 pozitif 82.887 örnek ile Veri Kümesini test et 10 özelliği vardır. İkili bir sınıflandırma yapmak istiyorum (0 veya 1). Karşılaştığım sorun, verilerin çok dengesiz olması. Normalleştirme ve bazı özellik mühendisliği ile birlikte verileri ölçekledikten …
Oldukça önyargılı bir ikili veri setim var - Negatif sınıfın pozitif sınıftan 1000 kat daha fazla örneği var. Bu veriler üzerinde bir Ağaç Topluluğu (Ekstra Rastgele Ağaçlar veya Rastgele Orman gibi) eğitmek istiyorum, ancak pozitif sınıfın yeterli örneklerini içeren eğitim veri kümeleri oluşturmak zor. Pozitif ve negatif örneklerin sayısını normalleştirmek …
Tüm "büyük veri" bileşenlerinin gerçek dünya kullanım durumunda nasıl oynandığını anlamaya çalışıyorum, örneğin hadoop, monogodb / nosql, fırtına, kafka, ... Bunun için kullanılan çok çeşitli araçlar olduğunu biliyorum farklı türlerde, ancak uygulamalardaki etkileşimleri hakkında daha fazla bilgi edinmek istiyorum, örneğin bir uygulama için düşünme makinesi öğrenmesi, webapp, çevrimiçi mağaza. Ziyaretçiler …
Sis koşullarındaki (3 sınıf) görüntüleri sınıflandırmak için evrişimli bir sinir ağı eğitimi alıyorum. Bununla birlikte, yaklaşık 150.000 görüntünün her biri için, görüntülerin sınıflarını tahmin etmede yardımcı olabilecek dört meteorolojik değişkenim var. Meteorolojik değişkenleri (örneğin sıcaklık, rüzgar hızı) mevcut CNN yapısına nasıl ekleyebileceğimi merak ediyordum, böylece sınıflandırmada yardımcı olabilirdi. Zaten aklıma …
İnternetteki Imagenet sınıfları için birçok kaynaktan birine bakarsam, insanlarla ilgili tek bir sınıf bulamıyorum (ve hayır, hasatçı hasat yapan biri değil, ama bir baba uzun bacakları, bir çeşit örümcek :-). Bu nasıl mümkün olabilir? Ben en azından bir tahmin az olurdu personhatta bir şey daha spesifik gibi sınıf ve man, …
İstatistik veya ileri matematik bilgisi olmayan bir Bilgisayar Bilimleri mühendisiyim. Raschka ve Mirjalili'nin Python Machine Learning kitabını inceliyorum, ancak Machine Learning'in matematiğini anlamaya çalıştığımda, bir arkadaşımın bana İstatistiksel Öğrenmenin Unsurlarını önerdiği harika kitabı anlayamadım . Makine Öğrenimi için daha kolay istatistik ve matematik kitapları biliyor musunuz? Eğer yapmazsan nasıl hareket …
Bu soruya küçük bir alt sorum var . Maksimum havuzlama katmanı boyunca geri yayılırken, gradyanın, max olarak seçilen bir önceki katmandaki nöronun tüm gradyanı alacağı şekilde geri yönlendirildiğini anlıyorum. % 100 emin olmadığım bir sonraki katmandaki degrade havuz katmanına nasıl yönlendirilir. İlk soru, aşağıdaki görüntü gibi, tamamen bağlı bir katmana …
Makine öğrenimine yeni başlıyorum ve bir durumla karşı karşıyayım. IPinYou veri kümesi ile bir Gerçek Zamanlı Teklif sorunu üzerinde çalışıyorum ve bir tıklama tahmini yapmaya çalışıyorum. Mesele şu ki, bildiğiniz gibi, veri kümesi çok dengesiz: 1 olumlu örnek (tıklama) için yaklaşık 1300 negatif örnek (tıklama yok). Bu benim işim: Verileri …