«classification» etiketlenmiş sorular

İstatistiksel sınıflandırma, alt popülasyonunun kimliğinin bilinmediği yeni gözlemlerin ait olduğu alt popülasyonu, alt popülasyonu bilinen gözlemleri içeren veri içeren bir eğitim seti temelinde tanımlama sorunudur. Bu nedenle bu sınıflandırmalar istatistiklerle incelenebilen değişken bir davranış gösterecektir.

3
Sınıflandırmada farklı kayıp fonksiyonlarını seçmenin etkileri yaklaşık 0-1 kayıptır.
Bazı objektif fonksiyonların optimize edilmesinin daha kolay, bazılarının ise zor olduğunu biliyoruz. Ve kullanmak istediğimiz ancak kullanması zor olan birçok kayıp fonksiyonu var, örneğin 0-1 kayıp. Yani işi yapmak için bazı proxy kaybı işlevlerini buluyoruz . Örneğin, 0-1 kaybını "yaklaşık" yapmak için menteşe kaybı veya lojistik kaybı kullanıyoruz. Ardından arsa …

5
PCA'nın bir sınıflandırıcının sonuçlarını kötüleştirmesine ne sebep olabilir?
En iyi özellik kombinasyonlarını bulmak için ileriye doğru seçim yaptığım yüzlerce özellik ile birlikte çapraz doğrulama yaptığım bir sınıflandırıcı var. Bunu, PCA ile aynı deneyleri çalıştırmayla karşılaştırıyorum, burada potansiyel özellikleri alıyorum, SVD uyguladım, orijinal sinyalleri yeni koordinat alanına dönüştürüyorum ve ileri seçim en iyi özelliklerini kullanıyorum .kkk Sezgim, PCA'nın, sonuçları …

1
Çapraz doğrulama, doğrulama kümesi için uygun bir alternatif midir?
Metin sınıflandırmasında yaklaşık 800 örnekli bir eğitim setim ve yaklaşık 150 örnekli bir test setim var. Test seti hiç kullanılmamış ve sonuna kadar kullanılmayı bekliyor. Sınıflayıcıları ve özellikleri ayarlarken ve ayarlarken 10 kat çapraz doğrulama ile tüm 800 örnek eğitim setini kullanıyorum. Bu, ayrı bir doğrulama setine sahip olmadığım anlamına …

4
CART kullanırken “değişken önemi” nasıl ölçülür / derecelendirilir? (özellikle R'den {rpart} kullanarak)
Rpart (R) kullanarak bir CART modeli (özellikle sınıflandırma ağacı) oluştururken, modele tanıtılan çeşitli değişkenlerin önemini bilmek genellikle ilginçtir. Dolayısıyla benim sorum şu: Bir CART modelinde katılımcı değişkenlerin değişken önem derecesini sıralamak / ölçmek için hangi ortak önlemler var? Ve bu nasıl R kullanılarak hesaplanabilir (örneğin, rpart paketini kullanırken) Mesela, işte …

7
Naive Bayes'te test setinde bilinmeyen kelimeler varken neden Laplace yumuşatma ile uğraşıyorsunuz?
Bugün Naive Bayes Sınıflandırması'nı okuyordum. Parametre Tahmini başlığı altında, 1 yumuşatma ile birlikte okudum : yapalımccc (örneğin, pozitif veya negatif olarak) bir sınıfını ifade ve izin www bir belirteç ya da kelime bakın. İçin maksimum olabilirlik tahmin P(w|c)P(w|c)P(w|c) olduğucount(w,c)count(c)=counts w in class ccounts of words in class c.count(w,c)count(c)=counts w in …

2
Uygun olmayan bir puanlama kuralının kullanılması ne zaman uygundur?
Merkle & Steyvers (2013) yaz: Resmen uygun bir puanlama kuralı tanımlamak için izin Bernoulli deneme bir olasılık tahmini olmak gerçek bir başarı olasılığı ile . Doğru puanlama kuralları, ise beklenen değerleri en aza indiren metriklerdir .fffdddpppf= pf=pf = p Bunun iyi olduğunu biliyorum çünkü tahmincileri gerçek inançlarını dürüst bir şekilde …

1
One-vs-All ve One-vs-One svm içinde?
Bire bir-hepsi-bir ile bire-bir-bir SVM sınıflandırıcısı arasındaki fark nedir? One-vs-all, yeni görüntünün tüm türlerini / kategorilerini sınıflandırmak için bir sınıflandırıcı anlamına gelir ve one-vs-one yeni görüntünün tüm türlerini / kategorilerini farklı sınıflandırıcı ile sınıflandırır (her bir kategori özel sınıflandırıcı tarafından kullanılır) anlamına mı geliyor? Örneğin, yeni resim daire, dikdörtgen, üçgen, …

2
Diskriminant analizinin üç versiyonu: farklılıklar ve nasıl kullanılacağı
Herhangi biri farklılıkları açıklayabilir ve bu üç analizin nasıl kullanılacağına özel örnekler verebilir mi? LDA - Doğrusal Ayrımcı Analizi FDA - Fisher'in Diskriminant Analizi QDA - Kuadratik Diskriminant Analizi Her yeri aradım, ancak bu analizlerin nasıl kullanıldığını ve verilerin nasıl hesaplandığını görmek için gerçek değerlere sahip gerçek örnekler bulamadım, gerçek …

2
Sinir Ağı: İkili Sınıflandırma için 1 veya 2 çıkış nöronu kullanıyor musunuz?
İkili sınıflandırma yapmak istediğimi varsayalım (bir şey A veya B sınıfına aittir). Bunu bir sinir ağının çıkış katmanında yapmanın bazı olasılıkları vardır: 1 çıkış düğümü kullanın. Çıkış 0 (<0,5) A sınıfı kabul edilir ve 1 (> = 0,5) B sınıfı (sigmoid olması durumunda) kabul edilir. 2 çıkış düğümü kullanın. Giriş, …

4
Hem sürekli hem de kategorik özelliklerle öngörüde bulunmak
Bazı prediktif modelleme teknikleri, sürekli prediktörlerin kullanımı için daha fazla tasarlanmıştır, diğerleri ise kategorik veya ayrık değişkenlerin ele alınması için daha iyidir. Elbette bir tipi diğerine dönüştürme teknikleri var (ayrıklaştırma, yapay değişkenler, vs.). Ancak, her iki giriş türünü aynı anda, özelliklerin türünü değiştirmeden aynı anda ele almak üzere tasarlanmış öngörücü …

1
Sınıflandırma ve regresyonu birleştiren bir algoritma var mı?
Aynı zamanda sınıflandırma ve regresyon yapabilen herhangi bir algoritma olup olmadığını merak ediyorum. Örneğin, algoritmanın bir sınıflandırıcı öğrenmesine izin vermek istiyorum ve her bir etiketin içinde aynı zamanda sürekli bir hedef öğreniyor. Bu nedenle, her eğitim örneği için kategorik bir etikete ve sürekli bir değere sahiptir. Önce bir sınıflayıcıyı eğitebilirim, …

2
PCA ve LDA'yı birleştirmek mantıklı mı?
Örneğin bir Bayes sınıflandırıcısı aracılığıyla denetimli bir istatistiksel sınıflandırma görevi için bir veri setine sahip olduğumu varsayalım. Bu veri seti 20 özellikten oluşuyor ve Temel Bileşen Analizi (PCA) ve / veya Doğrusal Ayrımcı Analizi (LDA) gibi boyutsallık azaltma teknikleri ile onu 2 özelliğe çıkarmak istiyorum. Her iki teknik de verileri …

5
En önemli ana bileşenler, bağımlı değişken üzerindeki tahmin gücünü nasıl koruyabilir (hatta daha iyi tahminlere yol açabilir)?
Diyelim ki bir regresyon . Neden üst seçerek ilkesi bileşenleri , model üzerindeki öngörü gücünü korumak mu ?Y∼XY∼XY \sim XkkkXXXYYY Ben boyutluluk-azaltma / görüş özellikli seçme noktasında, eğer gelen anlıyoruz kovaryans matrisinin öz vektörleri olduğundan üst ile özdeğerler, ardından üst olan ana bileşenler maksimum varyans ile. Böylece, özelliklerin sayısını azaltabilir …


3
İlk denenecek en iyi beş sınıflayıcı
Gibi belirgin sınıflandırıcı özellikleri yanında hesaplamalı maliyet beklenen veri türü özellikleri / etiketleri ve veri setlerinin belirli boyut ve boyutlarına uygunluk, Yeni bir veri setinde önce denenecek ilk beş (veya 10, 20?) sınıflandırıcı hangisi hakkında henüz fazla bir şey bilmiyor (örneğin, bireysel özelliklerin anlambilimi ve korelasyonu)? Genellikle Naive Bayes, En …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.