«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.

4
Genelleştirilmiş bir artırılmış regresyon modelinde ağaç sayısı nasıl seçilir?
GBM'deki ağaç sayısını seçmek için bir strateji var mı? Özellikle, ntreesiçinde argüman Rbireyin gbmfonksiyonu. Neden ntreesen yüksek değere ayarlamamanız gerektiğini anlamıyorum . Daha fazla sayıda ağacın birden fazla GBM'den elde edilen sonuçların değişkenliğini açıkça azalttığını fark ettim. Çok sayıda ağacın aşırı sığmaya yol açacağını düşünmüyorum. Düşüncesi olan var mı?

5
Sinir ağları için matematiksel altyapı
Bunun bu site için uygun olup olmadığından emin değilim, ancak bilgisayar bilimlerinde (uygulamalı matematikte BS) MSE'ye başlıyorum ve makine öğreniminde güçlü bir arka plan elde etmek istiyorum (büyük olasılıkla bir doktora yapacağım). Alt çıkarlarımdan biri sinir ağları. YSA'lar için iyi bir matematiksel altyapı nedir? Makine öğreniminin diğer alanlarında olduğu gibi, …


2
Bu modelng yaklaşımında aşırı uyum var mı
Kısa bir süre önce, takip ettiğim sürecin (bir yüksek lisans tezinin bileşeni) aşırı uyumlu olarak görülebileceği söylendi. Bunu daha iyi anlamak ve başkalarının hemfikir olup olmadığını görmek istiyorum. Makalenin bu bölümünün amacı ; Degrade Artırılmış Regresyon Ağaçlarının performansını Rastgele Ormanlara karşı bir veri setinde karşılaştırın. Seçilen son modelin (GBM veya …

1
Gauss Süreci ve Wishart dağılımı için kovaryans matrisi
Genelleştirilmiş Wishart Processes (GWP) hakkındaki bu makaleyi okuyorum . Kağıt, kareli üstel kovaryans fonksiyonunu kullanarak farklı rasgele değişkenler ( Gauss Süreci sonrasında ) arasındaki kovaryansları, yani . Daha sonra bu kovaryans matrisinin GWP'yi takip ettiğini söylüyor.K( x , x') = exp( - | ( x - x') |22 l2)K(x,x′)=exp⁡(−|(x−x′)|22l2)K(x,x') = …

2
Sınıflandırma problemlerinde sınıf ayrılabilirliğinin ölçüleri
Doğrusal ayrımcı öğrenicilerde sınıf ayrılığının iyi bir ölçüsünün bir örneği Fisher'in doğrusal ayrımcı oranıdır. Özellik kümelerinin hedef değişkenler arasında iyi bir sınıf ayrımı sağlayıp sağlamadığını belirlemek için başka yararlı metrikler var mı? Özellikle, hedef sınıfı ayırmayı en üst düzeye çıkarmak için iyi çok değişkenli girdi öznitelikleri bulmakla ilgileniyorum ve iyi …

3
Lojistik regresyonda değişkenlerin önemi
Muhtemelen daha önce yüzlerce kez çözülmüş bir sorunla uğraşıyorum, ancak cevabı nerede bulacağımdan emin değilim. Lojistik regresyon, verilen birçok özellik kullanılırken ve ikili kategorik değer tahmin etmeye çalışmak , ben tahmin özelliklerin bir alt kümesini seçerek ilgilenen am iyi. y yx1, . . . , xnx1,...,xnx_1,...,x_nyyyyyy Kullanılabilecek kemente benzer bir …


2
Regresyon amacıyla öngörücülerin boyutsallığını azaltmanın avantajı nedir?
Boyut küçültme regresyonu (DRR) veya denetimli boyut küçültme (SDR) tekniklerinin geleneksel regresyon tekniklerine (boyut küçültme olmadan) uygulamaları veya avantajları nelerdir? Bu teknik sınıfı, regresyon problemi için özellik setinin düşük boyutlu bir temsilini bulur. Bu tekniklerin örnekleri arasında Dilimli Ters Regresyon, Temel Hessian Yönleri, Dilimli Ortalama Varyans Tahmini, Çekirdek Dilimli Ters …

2
AI'nin Drosophila'sı şimdi ne?
1960'ların ortalarında, araştırmacılar satranca ünlü " AI Drosophila " olarak bahsettiler : meyve sineği gibi, satranç oyunu deneysel olarak erişilebilir ve nispeten basit bir problemdi, bu da önemli bilgileri daha karmaşık problemler üretti. Şimdi insanlar "satranç sadece bir arama problemidir" ve "satranç yöntemleri yapay zeka topluluğuna daha fazla ilgi göstermeyecek" …

1
2-sınıf modelleri çok-sınıflı problemlere genişletme
Adaboost'taki bu çalışma , 2 sınıf modellerin K sınıfı sorunlara genişletilmesi için bazı öneriler ve kodlar (sayfa 17) sunmaktadır. Bu kodu genelleştirmek istiyorum, böylece kolayca farklı 2 sınıf modelleri takabilir ve sonuçları karşılaştırabilirim. Çoğu sınıflandırma modeli bir formül arayüzüne ve bir predictyönteme sahip olduğundan, bunların bazıları nispeten kolay olmalıdır. Ne …

4
K-araçlarında optimal k'nin olmadığı durumlar var mı?
Bu en azından birkaç saattir aklımda. Ben k-ortalamalar algoritmasından ( kosinüs benzerlik metriği ile ) çıktı için optimal bir k bulmaya çalışıyordum, bu yüzden çarpıklığı kümelerin sayısının bir fonksiyonu olarak çizdim. Veri setim, 600 boyutlu bir alanda 800 belgeden oluşan bir koleksiyon. Anladığım kadarıyla, bu eğri üzerindeki diz noktasını veya …

3
Seyrek öngörücüler ve yanıtlar kullanan CART benzeri yöntemler için kullanılabilir kitaplık var mı?
R'deki gbm paketini kullanarak bazı büyük veri kümeleri ile çalışıyorum. Hem yordayıcı matrisim hem de yanıt vektörüm oldukça seyrek (yani çoğu giriş sıfır). Burada yapıldığı gibi, bu seyreklikten yararlanan bir algoritma kullanarak karar ağaçları oluşturmayı umuyordum ). Bu makalede, benim durumumda olduğu gibi, çoğu öğe birçok olası özellikten sadece birkaçına …

2
Gizli bir markov modelinde ilk geçiş olasılıklarının önemi
Bir Gizli Markov Modelinde geçiş olasılıklarına belirli başlangıç ​​değerleri vermenin faydaları nelerdir? Sonunda sistem onları öğrenecek, o halde rastgele olanlar dışında değer vermenin anlamı nedir? Altta yatan algoritma Baum – Welch gibi bir fark yaratıyor mu? Başlangıçtaki geçiş olasılıklarını çok doğru bir şekilde bilirsem ve asıl amacım, gizli durumdan gözlemlere …

2
Rasgele bir orman modelinden bir tahmin açıklamanın bir yolu var mı?
Diyelim ki rastgele bir ormana dayalı bir öngörme sınıflandırma modelim var (R'deki randomForest paketini kullanarak). Son kullanıcıların tahmin oluşturmak için bir öğe belirleyebilmesi ve bir sınıflandırma olasılığı ortaya çıkması için ayarlamak istiyorum. Şimdiye kadar, sorun değil. Ancak, değişken önem grafiği gibi bir şeyin çıktısını alabilmek yararlı olabilir, ancak tahmin edilen …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.