«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.

3
Gizli Markov model eşiği
MFCC ve gizli markov modelleri kullanarak ses tanıma için bir konsept sistemi kanıtı geliştirdim. Sistemi bilinen sesler üzerinde test ettiğimde umut verici sonuçlar veriyor. Sistem, bilinmeyen bir ses girildiğinde en yakın eşleşme ile sonuç döndürür ve skor, onu tanımlamak için o kadar da farklı değildir, örneğin: 3 gizli markov modelini …


3
Bir okul çocuğuna istatistik ve makine öğrenimi hakkında ne söylenebilir?
Gelecek hafta evde yerel bir okuldan stajyerimiz olacak. Kısa stajının arkasındaki kavram, gerçek dünyanın nasıl çalıştığı ve belirli işlerin neyle uğraştığı, günlük çalışmanın nasıl göründüğü vb. Hakkında bir fikir edinmek. Şimdi merak ettim ki, böyle küçük bir çocuğa İstatistik ve Makine Öğrenimi hakkında ne söyleyebilir / gösterebilir / gösterebilir ki …

2
Kategorik özellikleri makine öğrenimi için sayılara kodlama
Yapay sinir ağları gibi birçok makine öğrenimi algoritması sayıları ele almayı beklemektedir. Yani, kategorik verileriniz olduğunda, dönüştürmeniz gerekir. Kategorik olarak, örneğin: Araba markaları: Audi, BMW, Chevrolet ... Kullanıcı kimlikleri: 1, 25, 26, 28 ... Kullanıcı kimlikleri sayı olsa da, bunlar yalnızca etiketlerdir ve yaş veya para toplamı gibi süreklilik açısından …

8
Makine öğrenimi için “sıcak algoritmalar” nelerdir?
Bu, makine öğrenmesini öğrenmeye başlayan birinden naif bir sorudur. Bu günlerde Marsland'dan "Makine Öğrenimi: Algoritmik bir bakış açısı" kitabını okuyorum. Bir tanıtım kitabı olarak yararlı buluyorum, ama şimdi şu anda en iyi sonuçları veren gelişmiş algoritmalara girmek istiyorum. Çoğunlukla biyoinformatikle ilgileniyorum: biyolojik ağların kümelenmesi ve biyolojik dizilerde örüntüler bulmak, özellikle …

1
Dengesiz sınıfları fazla / az örnekleme yaparken, doğruluğu en üst düzeye çıkarmak yanlış sınıflandırma maliyetlerini en aza indirmekten farklı mıdır?
Her şeyden önce, Veri Madenciliği kitaplarının Dengesiz Veri Kümeleri ile nasıl başa çıkılacağını açıklayan bazı ortak düzenleri tanımlamak istiyorum . Genellikle ana bölüm Dengesiz Veri Kümeleri olarak adlandırılır ve bu iki alt bölümü kapsar: Maliyete Duyarlı Sınıflandırma ve Örnekleme Teknikleri. Nadir bir sınıfla ilgili bir sorunla karşı karşıya kaldığınızda hem …

1
SVM'de hiper düzlemden uzaklığı yorumlama
SVM'leri sezgisel olarak anlama konusunda birkaç şüphem var. SVMLight veya LibSVM gibi standart bir araç kullanarak sınıflandırma için bir SVM modeli geliştirdiğimizi varsayalım. Test verilerini tahmin etmek için bu modeli kullandığımızda, model her test noktası için "alfa" değerlerine sahip bir dosya oluşturur. Alfa değeri pozitifse, test noktası Sınıf 1'e aittir, …

1
AdaBoost'u ne zaman kullanmak istersiniz?
AdaBoost sınıflandırıcısının işte defalarca belirtildiği gibi duyduğum gibi, nasıl çalıştığı ve ne zaman kullanılacağı konusunda daha iyi bir fikir edinmek istedim. Devam ettim ve Google'da bulduğum birkaç makaleyi ve öğreticiyi okudum, ancak sınıflandırıcının hala anlamada sorun yaşadığım yönleri var: Gördüğüm çoğu öğretici, AdaBoost'u birçok sınıflandırıcının en iyi ağırlıklı kombinasyonunu bulmaktan …

2
Makine öğrenimi için zaman serilerinin sıralanması
RJ Hyndman'ın çapraz doğrulama ve zaman serileri hakkındaki "Araştırma ipuçlarından" birini okuduktan sonra , burada formüle etmeye çalışacağım eski bir soruya geri döndüm. Fikir, sınıflandırma veya regresyon problemlerinde, verilerin sıralanmasının önemli olmadığı ve bu nedenle k -katlı çapraz validasyonun kullanılabileceğidir. Öte yandan, zaman serilerinde verilerin sıralanması büyük önem taşımaktadır. Tahmini …

2
Seçilen özellik sayısı azaldığında, rastgele orman OOB hata tahmini neden iyileşiyor?
1000 özellikli bilinen iki gruba ayrılan bir mikrodizi veri kümesine sınıflandırıcı olarak rastgele bir orman algoritması uyguluyorum. İlk çalıştırmadan sonra özelliklerin önemine bakıyorum ve 5, 10 ve 20 en önemli özellik ile ağaç algoritmasını tekrar çalıştırıyorum. Tüm özellikler için, ilk 10 ve 20'de OOB hata oranı tahmini% 1.19, burada ilk …


1
Caret glmnet vs cv.glmnet
Optimal bir lambda aramak için glmnetiçeride caretkullanma cv.glmnetve aynı görevi yapmak için kullanma karşılaştırmasında çok fazla karışıklık var gibi görünüyor . Birçok soru yöneltildi, örneğin: Sınıflandırma modeli train.glmnet mi cv.glmnet mi? Glmnet'i caret ile kullanmanın doğru yolu nedir? "Caret" kullanarak çapraz onaylama "glmnet" ancak sorunun tekrarlanabilirliğinden kaynaklanabilecek hiçbir cevap verilmemiştir. …

4
Makine öğrenimi algoritmaları için tahmin aralıkları
Aşağıda açıklanan sürecin geçerli / kabul edilebilir olup olmadığını ve herhangi bir gerekçe olup olmadığını bilmek istiyorum. Fikir: Denetimli öğrenme algoritmaları verilerle ilgili temel yapıları / dağılımları varsaymaz. Günün sonunda puan tahminleri çıkarırlar. Bir şekilde tahminlerin belirsizliğini ölçmeyi umuyorum. Şimdi, ML modeli oluşturma süreci doğası gereği rastgele (örneğin hiperparametre ayarı …


1
GAM vs LOESS vs spline
Bağlam : Bu yüzden ben kullanıyorum, parametrik görünmeyen bir ScatterPlot bir çizgi çizmek istiyorum geom_smooth()içinde ggplotde R. geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.Genelleştirilmiş katkı modelleri için GAM …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.