«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.


5
R'deki Rastgele Ormanlarla sınıflandırma için dengesiz sınıf büyüklüklerine göre nasıl ayarlanmalıdır?
Üzerinde çalıştığım bir proje için farklı sınıflandırma yöntemleri araştırıyorum ve Rastgele Ormanları denemekle ilgileniyorum. Ben ilerlerken kendimi eğitmeye çalışıyorum ve CV topluluğu tarafından sağlanan yardımları takdir ediyorum. Verilerimi eğitim / test setlerine ayırdım. R'deki rastgele ormanlarla yapılan deneylerden (randomForest paketini kullanarak), daha küçük sınıfım için yüksek yanlış sınıflandırma oranı ile …

2
Birden fazla çıkışı olan bir Rastgele Orman mümkün / pratik olabilir mi?
Rastgele Ormanlar (RF) rekabetçi bir veri modelleme / madencilik yöntemidir. Bir RF modelinin bir çıkışı vardır - çıkış / tahmin değişkeni. RF'lerle çoklu çıkışların modellenmesine yönelik naif yaklaşım, her çıkış değişkeni için bir RF oluşturmak olacaktır. Bu yüzden N bağımsız modelimiz var ve çıktı değişkenleri arasında korelasyon olduğunda, yedekli / …


4
Negatif kosinüs benzerliğini yorumlama
Benim sorum aptalca olabilir. Bu yüzden önceden özür dilerim. Stanford NLP grubu ( link ) tarafından önceden eğitilmiş GLOVE modelini kullanmaya çalışıyordum . Ancak, benzerlik sonuçlarımın bazı negatif sayılar gösterdiğini fark ettim. Bu, hemen sözcük-vektör veri dosyasına bakmamı istedi. Görünüşe göre, sözcük vektörlerindeki değerlerin negatif olmasına izin verildi. Bu neden …




2
Lojistik regresyon ortamında kare kayıp kullandığımda ne oluyor?
Bir oyuncak veri kümesi üzerinde ikili sınıflandırma yapmak için kare kaybı kullanmaya çalışıyorum. mtcarsVeri seti kullanıyorum , iletim tipini tahmin etmek için galon başına mil ve ağırlık kullanıyorum. Aşağıdaki grafik, farklı renkteki iki tür iletim tipi verisini ve farklı kayıp fonksiyonu tarafından oluşturulan karar sınırını göstermektedir. Kare kayıp burada temel …


5
Topluluk yöntemleri tüm bileşenlerini nasıl geride bırakıyor?
Topluluk öğrenimi konusunda biraz kafam karıştı. Özetle, k modellerini çalıştırır ve bu k modellerinin ortalamasını alır. K modellerinin ortalamasının kendi başına herhangi bir modelden daha iyi olacağı nasıl garanti edilebilir? Önyargının "yayıldığını" veya "ortalandığını" anlıyorum. Ancak, toplulukta iki model varsa (yani k = 2) ve biri diğerinden daha kötü ise …

1
Hangi Nedensellik Teorilerini Bilmeliyim?
Uygulamalı bir istatistikçi / ekonometri uzmanı olarak nedenselliğe hangi teorik yaklaşımları bilmeliyim? Biliyorum (çok az) Neyman – Rubin nedensel modeli (ve Roy , Haavelmo vb.) Pearl'ün Nedensellik Üzerine Çalışması Granger Nedensellik (daha az tedavi odaklı olsa da) Hangi kavramları özlüyorum ya da farkında olmam gerekir mi? İlgili: Makine öğrenmesinde nedenselliğin …

1
evrişimli sinir ağlarındaki özellik haritalarının sayısı
Evrişimli sinir ağını öğrenirken, aşağıdaki şekle ilişkin sorularım var. 1) Katman 1'deki C1'in 6 özellik haritası var, bu altı evrişimsel çekirdek olduğu anlamına mı geliyor? Her evrişimsel çekirdek, girdiye dayalı bir özellik haritası oluşturmak için kullanılır. 2) Katman 2'deki S1'in 6 özellik haritası, C2'nin 16 özellik haritası vardır. S1'deki 6 …

2
Uygun makine öğrenme algoritmasını seçmek için keşifsel veri analizi nasıl yapılır
Makine Öğrenmesi: Olasılıksal Bir Bakış (Kevin Murphy) ile makine öğrenimi üzerine çalışıyoruz. Metin her algoritmanın teorik temelini açıklarken, hangi durumda hangi algoritmanın daha iyi olduğunu ve ne zaman olduğunu, hangi durumda olduğumu nasıl söyleyeceğini söylemez. Örneğin, çekirdek seçimi için, verilerimin ne kadar karmaşık olduğunu ölçmek için keşifsel veri analizi yapmam …

3
ROC eğrisinin altındaki alan veya dengesiz veriler için PR eğrisinin altındaki alan?
Hangi performans ölçüsünün kullanılacağı, ROC eğrisinin altındaki alan (FPR'ın bir fonksiyonu olarak TPR) veya hassas hatırlama eğrisinin altındaki alan (hatırlama fonksiyonu olarak hassasiyet) hakkında bazı şüphelerim var. Verilerim dengesiz, yani negatif örneklerin sayısı pozitif örneklerden çok daha fazla. Ben weka çıktı tahmini kullanıyorum, bir örnek: inst#,actual,predicted,prediction 1,2:0,2:0,0.873 2,2:0,2:0,0.972 3,2:0,2:0,0.97 4,2:0,2:0,0.97 …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.