«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.


1
Test: Sınıflandırıcıya karar sınırını söyleyin
Aşağıdaki 6 karar sınırı verilmiştir. Karar sınırları violett çizgileridir. Noktalar ve çarpılar iki farklı veri kümesidir. Hangisinin bir olduğuna karar vermeliyiz: Doğrusal SVM Çekirdek SVM (2. sıra polinom çekirdeği) Algılayıcı Lojistik regresyon Sinir Ağı (10 düzeltilmiş doğrusal birim içeren 1 gizli katman) Sinir Ağı (10 tanh birimli 1 gizli katman) …

5
Lojistik regresyon için hangi özelliklerin en önemli olduğunu anlama
Verilerim üzerinde çok doğru olan bir lojistik regresyon sınıflandırıcısı oluşturdum. Şimdi neden bu kadar iyi çalıştığını daha iyi anlamak istiyorum. Özellikle, hangi özelliklerin en büyük katkıyı yaptığını (hangi özelliklerin en önemli olduğunu) sıralamak ve ideal olarak, her özelliğin genel modelin (veya bu damardaki bir şeyin) doğruluğuna ne kadar katkıda bulunduğunu …

1
Torbalamanın teorik garantileri nelerdir?
Şunu duydum (yaklaşık olarak): torbalama, bir kestirimci / kestirimci / öğrenme algoritmasının varyansını azaltmak için bir tekniktir. Ancak, bu ifadenin resmi matematiksel kanıtını hiç görmedim. Bunun neden matematiksel olarak doğru olduğunu bilen var mı? Bu kadar yaygın kabul gören / bilinen bir gerçek gibi görünüyor, buna doğrudan bir referans bekliyorum. …

3
PCA yapmadan önce neden başka bir standartlaştırma faktörüne değil de standart sapmaya bölünüyoruz?
Ham verileri neden standart sapmasına böldüğümüze dair aşağıdaki gerekçeyi (cs229 ders notlarından) okuyordum: açıklamanın ne dediğini anlasam da, standart sapmaya bölünmenin neden böyle bir hedefe ulaşacağı net değil. Herkesin aynı "ölçekte" olması gerektiğini söylüyor. Ancak, bu tamamen açık değil standart sapmaya bölünmenin neden bunu başardığı . Varyansla bölünmenin nesi yanlış? …

1
R kare değeri modelleri karşılaştırmak için uygun mu?
Otomobil seri ilan sitelerinde mevcut fiyatları ve özellikleri kullanarak, otomobil fiyatlarını tahmin etmek için en iyi modeli belirlemeye çalışıyorum. Bunun için scikit-öğrenim kütüphanesinden birkaç model ve pybrain ve neurolab'dan sinir ağı modelleri kullandım. Şu ana kadar kullanılan bir yaklaşım, bazı örneklerle veri sabit bir miktar (makine öğrenme algoritmaları) çalıştırmak ve …

1
Naive Bayes ne zaman SVM'den daha iyi performans gösterir?
Baktığım küçük bir metin sınıflandırma probleminde, Naive Bayes bir SVM'ye benzer veya daha yüksek bir performans sergiliyordu ve çok kafam karıştı. Bir algoritmanın diğerine karşı zaferine hangi faktörlerin karar verdiğini merak ediyordum. SVM'ler üzerinde Naive Bayes kullanmanın bir anlamı olmadığı durumlar var mı? Birisi buna ışık tutabilir mi?

4
Sinir ağlarında “serbestlik derecesi” ne demektir?
Bishop'un "Örüntü Sınıflandırma ve Makine Öğrenimi" kitabında, sinir ağları bağlamında düzenlileştirme tekniğini açıklar. Ancak, eğitim sürecinde, modelin karmaşıklığıyla birlikte serbestlik derecelerinin arttığını açıklayan bir paragraf anlamıyorum. İlgili teklif şudur: Bir ağın etkili karmaşıklığını kontrol etmenin bir yolu olarak düzenlileştirmeye bir alternatif, erken durdurma prosedürüdür. Doğrusal olmayan ağ modellerinin eğitimi, bir …

1
Haber hikayelerine dayanan bir suç endeksi ve siyasi istikrarsızlık endeksi oluşturmak istiyorum
Ülkemdeki yerel haber web sitelerini taradığım ve bir suç endeksi ve siyasi istikrarsızlık endeksi oluşturmak istediğim bu yan projem var. Projenin bilgi erişim kısmını zaten ele aldım. Benim planım: Denetimsiz konu çıkarımı. Yakın kopya tespiti. Denetimli sınıflandırma ve olay seviyesi (suç / politik - yüksek / orta / düşük). Python …

3
Sinir ağını borsada işlem yapmak için kullanma
Sinir ağları alanına daldım ve onlarla büyülendim. Sonunda borsalarda ticaret sistemlerini test etmek için bir uygulama çerçevesi geliştirdim ve şimdi ilk sinir ağımı buna uygulayacağım. Çok basit ve ilkel olan, sadece yeni başlayanlar için gerçek ticaret için tasarlanmamıştır. Sadece yaklaşımımın iyi bir yaklaşım olup olmadığını bilmek istiyorum. Ve eğer bir …

3
İstatistiksel anlamlılık için iki sınıflandırıcı doğruluk sonucunun t-testi ile karşılaştırılması
İki sınıflandırıcının doğruluğunu istatistiksel anlamlılık açısından karşılaştırmak istiyorum. Her iki sınıflandırıcı da aynı veri kümesinde çalıştırılır. Bu beni okuduğumdan bir örnek t-testi kullanmam gerektiğine inanıyor . Örneğin: Classifier 1: 51% accuracy Classifier 2: 64% accuracy Dataset size: 78,000 Kullanılacak doğru test bu mu? Öyleyse, sınıflandırıcı arasındaki doğruluk farkının önemli olup …


12
İstatistiksel veri analizine giriş için en iyi kitaplar?
Kilitli . Bu soru ve cevapları kilitlidir çünkü soru konu dışıdır, ancak tarihsel önemi vardır. Şu anda yeni yanıtları veya etkileşimleri kabul etmiyor. Bu kitabı aldım: Her Şey Nasıl Ölçülür: İşletmedeki Maddi Olmayan Maddelerin Değerini Bulma ve İlk Veri Analizi: Büyük Sayılar, İstatistikler ve İyi Kararlar için Öğrenci Kılavuzu Başka …

3
SVM dışında hangi algoritmaların özellik ölçeklendirmesi gerekir?
Birçok algoritma ile çalışıyorum: RandomForest, DecisionTrees, NaiveBayes, SVM (çekirdek = doğrusal ve rbf), KNN, LDA ve XGBoost. SVM dışında hepsi oldukça hızlıydı. O zaman daha hızlı çalışmak için özellik ölçeklendirmesi gerektiğini bilmeliyim. Sonra aynı şeyi diğer algoritmalar için de yapmam gerekip gerekmediğini merak etmeye başladım.

1
İç içe çapraz geçerlilikten sonra nihai model nasıl oluşturulur ve olasılık eşiği nasıl ayarlanır?
İlk olarak, burada , burada , burada , burada , burada uzun süredir tartışılan bir soru yayınlamaktan dolayı özür dilerizve eski bir konuyu yeniden ısıtmak için. @DikranMarsupial'ın bu konu hakkında yazılarda ve dergi gazetelerinde uzun bir süre yazdığını biliyorum, ama hala kafam karıştı ve buradaki benzer yazıların sayısına bakılırsa, hala …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.