«machine-learning» etiketlenmiş sorular

Makine öğrenimi algoritmaları eğitim verilerinin bir modelini oluşturur. "Makine öğrenimi" terimi belirsiz bir şekilde tanımlanmıştır; istatistiksel öğrenme, takviye öğrenme, gözetimsiz öğrenme vb. olarak da adlandırılır. DAİMA DAHA ÖZEL BİR ETİKET EKLE.


1
Makine öğrenimi için istatistik, başlayacak makaleler?
Bilgisayar programlama ve temel sayı teorisinde bir geçmişim var, ancak gerçek bir istatistik eğitimi yok ve son zamanlarda bir dizi tekniğin muhteşem dünyasının aslında istatistiksel bir dünya olduğunu "keşfettim". Matris çarpanlarına ayırma, matris tamamlama, yüksek boyutlu tensörler, düğünler, yoğunluk tahmini, Bayes çıkarsama, Markov bölümleri, özvektör hesaplaması, PageRank'ın tümü son derece …

1
Bir P (Y | X) modeli, P (X) 'nin iid olmayan örneklerinden ve P (Y | X)' nin iid örneklerinden stokastik eğim alçalması ile eğitilebilir mi?
Bazı veri setlerinde stokastik eğim alçalması ile parametreli bir model (örn. Olasılığı en üst düzeye çıkarmak için) eğitilirken, eğitim örneklerinin eğitim veri dağıtımından alındığı yaygın olarak kabul edilir. Dolayısıyla, bir ortak dağıtım modellemekse , her bir eğitim örneği bu dağıtımdan çıkarılmalıdır.( x i , y i )P(X,Y)P(X,Y)P(X,Y)(xi,yi)(xi,yi)(x_i,y_i) Amaç bunun yerine …


2
Düzenleme normu ve normu ampirik çalışması
gerçekleştirmek için birçok yöntem vardır - , ve normuna dayalı düzenlileştirme. Göre Friedman Hastie ve Tibsharani yani gerçek hedef fonksiyonu, kullanılan özel olarak, sinyal-gürültü oranı doğası ve örnek büyüklüğü: En iyi regularizer sorununa bağlı olarak değişir.L0L0L_0L1L1L_1L2L2L_2 Çeşitli düzenleme yöntemlerinin performansını ve performansını karşılaştıran ampirik araştırmalar var mı?

3
İstatistiksel anlamlılık kullanarak iki farklı modelin doğruluğu nasıl karşılaştırılır
Zaman serisi tahmini üzerinde çalışıyorum. İki veri ve . Üç tahmin modelim var: . Bu modellerin tümü, veri kümesi örnekler kullanılarak eğitilir ve performansları, veri kümesi örnekler kullanılarak ölçülür . Performans metriklerinin MSE (veya başka bir şey) olduğunu varsayalım. Veri kümesi için ölçülen modellerin MSE olan ve . Bir modelin …

3
Metin belgesi için özellik vektörü oluşturmak için bigram (N-gram) modeli kullanma ile ilgili
Metin madenciliği için geleneksel özellik yapım yaklaşımı, kelime torbası yaklaşımıdır ve belirli bir metin belgesini karakterize eden özellik vektörünü ayarlamak için tf-idf kullanılarak geliştirilebilir. Şu anda, özellik vektörü oluşturmak için bi-gram dil modeli veya (N-gram) kullanmaya çalışıyorum, ancak bunu nasıl yapacağımı tam olarak bilmiyorum? Sadece kelime torbası yaklaşımını izleyebilir miyiz, …

1
Fisher çekirdeklerinin ötesinde
Bir süre, olasılıklar modellerden çekirdekler inşa etmenin bir yolu gibi göründüğü için Fisher Çekirdekleri popüler olabilir gibi görünüyordu. Ancak, bunların pratikte nadiren kullanıldığını gördüm ve çok iyi çalışmazlar. Fisher Information'ın hesaplamasına güveniyorlar - alıntı yapmak Wikipedia: Fisher bilgisi, f'nin doğal logaritmasının with'sine göre ikinci türev beklentisinin negatifidir. Bilgi, curve'nın maksimum …

1
Çok büyük zaman serisi veri kümeleriyle başa çıkmak
Çok büyük bir veri kümesine erişimim var. Veriler, dört türden birinden müzikal alıntıları dinleyen insanların MEG kayıtlarından alınmıştır. Veriler aşağıdaki gibidir: 6 Konular 3 Deneysel tekrarlar (çağlar) Dönem başına 120 Deneme 275 MEG kanalından 500Hz'de (= 4000 örnek) deneme başına 8 saniye veri Yani burada her "örnek" [4000x275] boyutunda bir …

3
Büyük veri kümelerinden öğrenirken yaklaşımlar?
Temel olarak, büyük veri kümelerine karşı öğrenmenin iki yaygın yolu vardır (zaman / alan kısıtlamaları ile karşılaştığınızda): Hile :) - eğitim için sadece bir "yönetilebilir" alt kümesini kullanın. Doğruluk kaybı, azalan getiriler yasası nedeniyle ihmal edilebilir - modelin tahmini performansı, tüm eğitim verileri buna dahil edilmeden çok önce düzleşir. Paralel …

1
MFCC'ler bir geri alma sistemine müziği temsil etmek için en uygun yöntem midir?
Bir sinyal işleme tekniği, Mel frekans Cepstrum , genellikle bir makine öğrenme görevinde kullanılmak üzere bir müzik parçasından bilgi çıkarmak için kullanılır. Bu yöntem kısa vadeli bir güç spektrumu verir ve katsayılar girdi olarak kullanılır. Müzik erişim sistemlerini tasarlarken, bu katsayılar bir parçanın karakteristiği olarak kabul edilir (açıkçası mutlaka benzersiz …

8
Geçmiş satın alımlardan elde edilen verilerle sarf malzemesi kullanımını tahmin etmek için hangi algoritma kullanılabilir?
Sözde basit ama ilginç bir sorun olduğunu düşünerek, önceki alımlarımın tam geçmişi göz önüne alındığında, yakın gelecekte ihtiyaç duyacağım sarf malzemesini tahmin etmek için bazı kodlar yazmak istiyorum. Eminim bu tür bir problem daha genel ve iyi çalışılmış bir tanımlamaya sahiptir (birisi bunun ERP sistemlerindeki ve benzeri bazı kavramlarla ilişkili …

6
İki farklı Rastgele Orman modelinden R kare karşılaştırması
Ben örneklerde daha tahmin ediciler ile bir "geniş" veri kümesinde sürekli bir sonucu açıklamaya çalışmak için rastgele bir orman modeli geliştirmek için R randomForest paketi kullanıyorum. Özellikle, prosedürün önemli olduğunu düşündüğüm ~ 75 prediktör değişkenleri arasından seçim yapmasına izin veren bir RF modeli takıyorum. Ben kullanarak bu modelin ayrılmış bir …

2
AUC kullanmanın gerekçesi?
Özellikle makine öğrenimi literatürünün bilgisayar bilimi odaklı tarafında, AUC (alıcı operatör karakteristik eğrisinin altındaki alan) sınıflandırıcıları değerlendirmek için popüler bir kriterdir. AUC kullanımının gerekçeleri nelerdir? En iyi kararın en iyi AUC'ye sahip sınıflandırıcı olduğu belirli bir kayıp fonksiyonu var mı?

1
Model olasılığı null'dan önemli ölçüde yüksek olmadığında (GAM) regresyon katsayılarının önemi
R paketi gamlss kullanarak ve verilerin sıfır şişirilmiş beta dağılımı varsayarak GAM tabanlı bir regresyon çalıştırıyorum . Temelde bu yüzden benim modelinde sadece tek açıklayıcı değişken vardır: mymodel = gamlss(response ~ input, family=BEZI). Algoritma , açıklayıcı değişkenin ortalamaya ( ) etkisi için katsayısını ve için ilişkili p değerini verir :kkkμμ\muk(input)=0k(input)=0k(\text{input})=0 …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.