«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.

1
Uzak denetim: denetimli, yarı denetimli veya her ikisi mi?
"Uzaktan denetim", sınıflandırıcının zayıf etiketlenmiş eğitim seti (eğitim verileri sezgisel yöntemlere / kurallara göre otomatik olarak etiketlenir) verildiğinde öğrenildiği bir öğrenme programıdır. Etiketli verileri sezgisel / otomatik olarak etiketlenmişse, hem denetimli öğrenme hem de yarı denetimli öğrenmenin böyle bir "uzaktan denetim" içerebileceğini düşünüyorum. Ancak, bu sayfada , "uzaktan denetim", "yarı-denetimli …

1
Xgboost'ta overfit hakkında tartışma
Kurulumum şu şekildedir: "Uygulamalı Öngörücü Modelleme" kılavuz ilkelerini takip ediyorum. Böylece ilişkili özellikleri filtreledim ve aşağıdakilerle sonuçlandım: Eğitim setinde 4900 veri noktası ve test setinde 1600 veri noktası. 26 özelliğim var ve hedef sürekli bir değişken. caretPaketi kullanarak modelleri eğitmek için 5 kat çapraz geçerlilik uygularım . Bir MARS modeli …

1
Negatif örnekleme word2vec'de nasıl çalışır?
Word2vec bağlamında negatif örnekleme kavramını anlamaya çalışıyorum. [Negatif] örnekleme fikrini sindiremiyorum. Örneğin Mikolov gazetelerinde olumsuz örnekleme beklentisi şu şekilde formüle edilmiştir: günlükσ( ⟨ W , c ⟩ ) + k ⋅ ecN-∼ PD[ logσ( - ⟨ w , CN-⟩ ) ] .log⁡σ(⟨w,c⟩)+k⋅EcN∼PD[log⁡σ(−⟨w,cN⟩)].\log \sigma(\langle w,c\rangle ) + k \cdot \mathbb E_{c_N\sim …

3
Karar kütüğü doğrusal bir model midir?
Karar kütüğü, sadece bir bölünmüş bir karar ağacıdır. Ayrıca parçalı bir işlev olarak da yazılabilir. Örneğin, bir vektör olduğunu ve ilk bileşeni olduğunu varsayalım , regresyon ayarında bazı kararlar olabilirxxxx1x1x_1xxx f(x)={35x1≤2x1>2f(x)={3x1≤25x1>2f(x)= \begin{cases} 3& x_1\leq 2 \\ 5 & x_1 > 2 \\ \end{cases} Ama doğrusal bir model mi? nerede olarak …

5
Temel makine öğrenme algoritmalarını öğrenmek için bazı iyi veri kümeleri nelerdir ve neden?
Makine öğrenimi konusunda yeniyim ve farklı makine öğrenme algoritmaları (Karar Ağaçları, Yükseltme, SVM ve Sinir Ağları) arasındaki farkları karşılaştırabildiğim ve karşılaştırdığım bazı veri kümeleri arıyorum. Bu tür veri kümelerini nerede bulabilirim? Veri kümesini düşünürken nelere dikkat etmeliyim? Bazı iyi veri kümelerine işaret edebilir ve ayrıca onları iyi bir veri kümesi …

2
Destekleme: öğrenme oranına neden bir düzenleme parametresi denir?
Öğrenme oranı parametresi ( ) Gradyan küçülür -typically her yeni baz model seri olarak bağlanır sığ tree katkısını Arttırılması de. Daha küçük adımlarda olduğu gibi anlaşılabilir olan test seti doğruluğunu önemli ölçüde arttırdığı gösterilmiştir, kayıp fonksiyonunun minimumuna daha hassas bir şekilde ulaşılabilir. ν∈ [ 0 , 1 ]ν∈[0,1]\nu \in [0,1] …


2
“Lojistik Regresyon” adı ne anlama geliyor?
Buradan Lojistik Regresyon uygulamasını kontrol ediyorum . Bu makaleyi okuduktan sonra, önemli olan sigmoid fonksiyonunu belirlemek için en iyi katsayıları bulmak gibi görünüyor. Bu yöntemin neden "Lojistik Regresyon" olarak adlandırıldığını merak ediyorum. Logaritmik fonksiyon ile mi ilgili? Belki de daha iyi anlamak için bazı tarihsel arka plan bilgilerine ihtiyacım var.


1
Öngörülü Modelleme - Karma modellemeyi önemsemeli miyiz?
Tahminli modelleme için kendimizi rastgele etkiler ve gözlemlerin bağımsız olmaması (tekrarlanan önlemler) gibi istatistiksel kavramlarla ilgilenmemiz gerekir mi? Örneğin.... Çeşitli özelliklere ve satın alma bayrağına sahip 5 doğrudan posta kampanyasından (bir yıl boyunca meydana gelen) verilerim var. İdeal olarak, kampanya sırasında müşteri özelliklerine göre verilen satın alma için bir model …

2
“En Yakın Komşu” bugün ne zaman anlamlı?
1999 yılında Beyer ve ark. sorulduğunda, ne zaman "Yakın Komşu" anlamlıdır? 1999'dan bu yana mesafe düzlüğünün NN araştırması üzerindeki etkisini analiz etmenin ve görselleştirmenin daha iyi yolları var mı? [Belirli bir] veri kümesi 1-NN problemine anlamlı cevaplar veriyor mu? 10-NN sorunu mu? 100-NN sorunu mu? Uzmanlar bugün bu soruya nasıl …


6
Parametreleri tahmin etmek için 'temel' makine öğrenimi fikri nedir?
Parametreleri tahmin etmek için 'temel' istatistik fikri maksimum olasılıktır . Makine öğreniminde buna karşılık gelen fikrin ne olduğunu merak ediyorum. Sn 1. Parametreleri tahmin etmek için makine öğrenmesindeki 'temel' fikrin 'Kayıp Fonksiyonları' olduğunu söylemek adil olur mu? [Not: Makine öğrenimi algoritmalarının genellikle bir kayıp fonksiyonunu ve dolayısıyla yukarıdaki soruyu optimize …

6
Veri kümesi örneğinde hiperparametre ayarı kötü bir fikir midir?
Ben 140000 örnek bir veri kümesi ve bunun için bir ikili sınıflandırma (SVM, Lojistik Regresyon, Rastgele Orman vb.) Çoğu durumda, Izgara veya Rastgele arama kullanarak tüm veri kümesinde hiperparametre ayarı çok masraflıdır. Aşağıdaki tekniği kullanmaya başladım Veri kümemdeki alt örnek Hiperparametreleri ayarlamak için elde edilen fraksiyonu kullanın Veri kümesinin tamamını …

11
Lojistik regresyona neden bir makine öğrenme algoritması denir?
Doğru bir şekilde anladıysam, bir makine öğrenme algoritmasında, model deneyimlerinden öğrenmelidir, yani model yeni vakalar için yanlış tahmin verdiğinde, yeni gözlemlere adapte olmalı ve zamanla model giderek daha iyi hale geliyor . Lojistik regresyonun bu özelliği olduğunu görmüyorum. Peki neden hala bir makine öğrenme algoritması olarak kabul ediliyor? “Öğrenme” anlamında …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.