«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.

2
Doğrusal bir regresyon modelinin katsayılarını bulmak için gradyan inişine ihtiyacımız var mı?
Coursera materyalini kullanarak makine öğrenmeyi öğrenmeye çalışıyordum . Bu derste Andrew Ng, hata fonksiyonunu (maliyet fonksiyonu) en aza indirecek doğrusal regresyon modelinin katsayılarını bulmak için gradyan iniş algoritması kullanır. Doğrusal regresyon için degrade inişe ihtiyacımız var mı? Görünüşe göre hata fonksiyonunu analitik olarak farklılaştırabilir ve katsayıları çözmek için sıfıra ayarlayabilirim; …

2
R'de rastgele bir orman sınıflandırmasında bir dizi yordayıcının göreceli önemi
Değişkenlerin kümelerinin randomForestR'deki bir sınıflandırma modeline göre göreceli önemini belirlemek isterim . importanceİşlev, MeanDecreaseGiniher bir yordayıcı için metrik sağlar - bunu bir kümedeki her yordayıcı arasında toplamak kadar basit midir? Örneğin: # Assumes df has variables a1, a2, b1, b2, and outcome rf <- randomForest(outcome ~ ., data=df) importance(rf) # …

2
libsvm veri formatı [kapalı]
Destek vektör sınıflandırması için libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) aracını kullanıyorum . Ancak, girdi verilerinin formatı hakkında kafam karıştı. README'den: Eğitim ve test veri dosyasının formatı şudur: <label> <index1>:<value1> <index2>:<value2> ... . . . Her satır bir örnek içerir ve '\ n' karakteriyle sonlanır. Sınıflandırma için, <label>sınıf etiketini gösteren bir tamsayıdır …

3
Özellik mühendisliğinin faydası: Neden mevcut özelliklere dayanarak yeni özellikler yarattınız?
İnsanların bir makine öğrenmesi problemindeki mevcut özelliklere dayanarak yeni özellikler yarattığını sık sık görüyorum. Örneğin, burada: https://triangleinequality.wordpress.com/2013/09/08/basic-feature-engineering-with-the-titanic-data/ insanlar bir kişinin ailesinin boyutunu yeni bir özellik olarak kabul etmişlerdir. Mevcut özellikleri olan kardeşlerin, kız kardeşlerin ve ebeveynlerin sayısı. Ama bunun anlamı ne? İlişkili yeni özelliklerin yaratılmasının neden faydalı olduğunu anlamıyorum. Bunu …

2
Denetimli öğrenme, denetimsiz öğrenme ve güçlendirici öğrenme: İş akışı temelleri
Denetimli öğrenme 1) İnsan, girdi ve çıktı verilerine dayalı bir sınıflandırıcı oluşturur. 2) Bu sınıflandırıcı bir veri eğitim seti ile eğitilmiştir. 3) Bu sınıflandırıcı bir veri test seti ile test edilmiştir. 4) Çıktı tatmin edici ise dağıtım "Bu verileri nasıl sınıflandıracağımı biliyorum, sıralamanız için yalnızca size (sınıflandırıcı) ihtiyacım var." Yöntem …

7
Çıkarım vs tahmin?
Makine öğrenmesi bağlamında "çıkarım" ve "tahmin" arasındaki farklar nelerdir ? Bir acemi olarak, biz hissediyorum sonucuna rastgele değişkenler ve tahmin modeli parametreleri. Benim bu anlayış doğru mu? Eğer değilse, tam olarak farklar nelerdir ve hangisini kullanmalıyım? Ayrıca, hangisi “öğren” in eş anlamlısıdır?

2
Konvolüsyonel sinir ağları: Merkezi nöronlar çıktıda aşırı temsil edilmiyor mu?
[Bu soru aynı zamanda yığın taşmasına da yollandı ] Kısaca soru Konvolüsyonel sinir ağları üzerinde çalışıyorum ve bu ağların her giriş nöronuna (piksel / parametre) eşit şekilde davranmadığına inanıyorum. Bazı giriş görüntülerine evrişim uygulayan derin bir ağa (birçok katman) sahip olduğumuzu hayal edin. Görüntünün "ortasındaki" nöronların, daha derin katman nöronlarına …

8
Veri madenciliği ve makine öğrenmesi için hangi matematik dersleri hazırlamayı önerirsiniz?
Veri madenciliği ve makine öğrenmesini öğrenmek için kendi kendine yönlendirilen bir matematik müfredatını oluşturmaya çalışıyorum. Bu, Andrew Ng'un makine öğrenme dersini Coursera'da başlatıp ilerlemeden önce matematik becerilerimi geliştirmek için gerekli olduğumu hissetmekle motive oluyor . Bir süre önce üniversiteden mezun oldum, bu yüzden cebirim ve istatistiklerim (özellikle siyaset bilimi / …


4
Dizeleri ayrıştırmak için makine öğrenme teknikleri?
Çok fazla adres dizgim var: 1600 Pennsylvania Ave, Washington, DC 20500 USA Onları bileşenlerine göre ayrıştırmak istiyorum: street: 1600 Pennsylvania Ave city: Washington province: DC postcode: 20500 country: USA Ancak elbette veriler kirli: birçok ülkede birçok dilde geliyor, farklı şekillerde yazılmış, yazım hataları var, eksik parçalar var, fazladan önemsiz şeyler …

4
Sınıf dengesizliği altında Precision-Recall eğrileri için optimizasyon
Birkaç belirleyiciye sahip olduğum (biri en bilgilendirici olan) bir sınıflandırma görevim var ve sınıflandırıcımı oluşturmak için MARS modelini kullanıyorum (herhangi bir basit modelle ilgileniyorum ve açıklama amacıyla glms kullanmak çok iyi). Şimdi eğitim verilerinde çok büyük bir sınıf dengesizliği var (her pozitif örnek için yaklaşık 2700 negatif örnek). Bilgi Edinme …

3
R, metin sınıflandırma görevlerine ne kadar iyi ölçeklenir? [kapalı]
R ile hız kazanmaya çalışıyorum. Sonunda metin sınıflandırma yapmak için R kütüphanelerini kullanmak istiyorum. Metin sınıflandırma söz konusu olduğunda, insanların R'nin ölçeklenebilirliği ile ilgili deneyimlerinin neler olduğunu merak ediyordum. Büyük boyutlu verilerle karşılaşmam muhtemel (~ 300k boyutları). Özellikle sınıflandırma algoritmaları olarak SVM ve Random Forest kullanmaya bakıyorum. R kütüphaneleri sorun …

6
Lojistik regresyon ve algılayıcı arasındaki fark nedir?
Andrew Ng'un Makine Öğrenimi ile ilgili ders notlarına bakıyorum . Notlar bize lojistik gerilemeyi ve ardından algılayıcısını tanıtıyor. Perceptron tarif edilirken, notlar sadece lojistik regresyon için kullanılan eşik fonksiyonunun tanımını değiştirdiğimizi söylüyor. Bunu yaptıktan sonra, sınıflandırma için Perceptron modelini kullanabiliriz. Öyleyse sorum şu - eğer bunun belirtilmesi gerekiyorsa ve Perceptron'u …


5
GBM'de etkileşim derinliği ne demektir?
R'de gbm'deki etkileşim derinliği parametresi ile ilgili bir sorum vardı. Bu, özür dilediğim noob bir soru olabilir, ancak bir ağaçtaki terminal düğümlerinin sayısını belirttiğine inandığım parametre, temel olarak X-yolunu gösterir. öngörücüler arasındaki etkileşim? Sadece bunun nasıl çalıştığını anlamaya çalışıyorum. Ek olarak, bu iki faktör değişkeninin tek bir faktörde birleştirilmesi haricinde, …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.