İstatistikler ve Büyük Veri predictive-models

5

Keşifsel veri analizi tamamen öngörülü modelleme yaparken önemli midir?

Makine öğrenme tekniklerini kullanarak yordayıcı bir model oluştururken, keşifsel veri analizi (EDA) yapmanın amacı nedir? Model oluşturma ve model oluşturma özelliklerine doğrudan atlamak uygun mudur? EDA'da tanımlayıcı istatistikler nasıl önemlidir?

23 machine-learning predictive-models descriptive-statistics eda

1

Nate Silver'ın Loess hakkında ne söylediğini açıklama

Geçenlerde sorduğum bir soruda , sevgisizlikle tahmin etmenin büyük bir "hayır-hayır" olduğu söylendi. Ancak, Nate Silver'ın FiveThirtyEight.com hakkındaki en son makalesinde, seçim tahminlerinde bulunmamak için loess kullanmayı tartıştı. Agresif ve muhafazakar tahminlerin ayrıntılarını loess ile tartışıyordu ama gelecek tahminlerini loess ile yapmanın geçerliliğini merak ediyorum? Bu tartışmayla ve sevgiyle benzer …

23 time-series forecasting predictive-models loess politics

3

Bir model için öngörülen olasılık kalibrasyonunun görselleştirilmesi

Her sınıf için her sınıf için bir olasılık üreten öngörücü bir modelim olduğunu varsayalım. Şimdi, sınıflandırma için bu olasılıkları kullanmak istersem böyle bir modeli değerlendirmenin pek çok yolu olduğunu kabul ediyorum (hassasiyet, hatırlama, vb.). Ayrıca, bir ROC eğrisinin ve altındaki alanın, modelin sınıflar arasında ne kadar iyi farklılaştığını belirlemek için …

23 data-visualization classification predictive-models binary-data calibration

3

Prediktif modelleme yarışmaları için siteler

Kaggle , TunedIt ve CrowdAnalytix ile ilgili tahminli modelleme yarışmalarına katılıyorum . Bu sitelerin istatistik / makine öğrenimi için "alıştırma yapmak" için iyi bir yol olduğunu düşünüyorum. Bilmem gereken başka siteler var mı? Ev sahibinin rakiplerin sunumlarından kâr elde etmek istediği yarışmalar hakkında ne düşünüyorsunuz? / edit: İşte daha eksiksiz …

23 machine-learning predictive-models

2

Üretici ve ayrımcı modeller (Bayes bağlamında)

Üretken ve ayırt edici (ayırt edici) modeller arasındaki farklar nelerdir (Bayesian öğrenmesi ve çıkarımı bağlamında)? ve tahmin, karar teorisi veya denetimsiz öğrenme ile ne ilgisi var?

22 bayesian predictive-models unsupervised-learning

3

Sonuç sadece eğitim durumundaki olumlu vakalarla nasıl tahmin edilir?

Sadelik adına, spam / spam olmayan e-postaların klasik örneği üzerinde çalışıyorum diyelim. 20.000 e-posta setim var. Bunlardan 2000'in spam olduğunu biliyorum ama spam olmayan e-postalardan hiçbir örneğim yok. Kalan 18000’in spam olup olmadığını tahmin etmek istiyorum. İdeal olarak, aradığım sonuç, e-postanın spam olma olasılığı (veya bir p değeri). Bu durumda …

21 machine-learning predictive-models unsupervised-learning supervised-learning semi-supervised

2

Genel veri setleri için veri büyütme teknikleri?

Birçok makine öğrenim uygulamasında, veri yükseltme yöntemleri daha iyi modeller oluşturmaya izin verdi. Örneğin, kedi ve köpek görüntüsünün eğitim setini alın . Döndürmek, yansıtmak, kontrastı ayarlamak, vb. İle orijinallerinden ek görüntüler elde etmek mümkündür.100100100 Görüntüler durumunda, veri arttırma nispeten basittir. Ancak, (örneğin) birinin örnek bir eğitim seti ve farklı şeyleri …

21 machine-learning predictive-models dataset independence data-augmentation

2

StackExchange soruları için “ilginçlik” işlevi

StackExchange siteleri için bir veri madenciliği paketi bir araya getirmeye çalışıyorum ve özellikle, "en ilginç" soruları belirlemeye çalışırken sıkışmış. Soru puanını kullanmak istiyorum, ancak görüşlerin sayısı nedeniyle önyargıyı kaldırıyorum, ancak buna titizlikle nasıl yaklaşacağımı bilmiyorum. İdeal dünyada, soruları hesaplayarak sıralayabilirim; burada , oyların toplamı ve , görüntülenme sayısıdır. Ne de …

20 data-mining predictive-models

2

Bayes düşünme hakkında aşırı düşünme

Geleneksel frekansçı istatistik alanındaki tahmin modellerini doğrulamak için yöntem ve yazılım geliştirmeye çok zaman ayırdım. Daha fazla Bayesci fikri hayata geçirirken ve öğretirken kucaklamak için bazı önemli farklılıklar görüyorum. Birincisi, Bayes öngörülü modelleme analistten aday özelliklerine göre özelleştirilebilen önceki dağılımlar hakkında çok düşünmesini ister ve bu öncelikler modeli kendilerine çeker …

20 bayesian cross-validation predictive-models validation regression-strategies

2

Destekleme: öğrenme oranına neden bir düzenleme parametresi denir?

Öğrenme oranı parametresi ( ) Gradyan küçülür -typically her yeni baz model seri olarak bağlanır sığ tree katkısını Arttırılması de. Daha küçük adımlarda olduğu gibi anlaşılabilir olan test seti doğruluğunu önemli ölçüde arttırdığı gösterilmiştir, kayıp fonksiyonunun minimumuna daha hassas bir şekilde ulaşılabilir. ν∈ [ 0 , 1 ]ν∈[0,1]\nu \in [0,1] …

19 machine-learning data-mining predictive-models boosting overfitting

1

Öngörülü Modelleme - Karma modellemeyi önemsemeli miyiz?

Tahminli modelleme için kendimizi rastgele etkiler ve gözlemlerin bağımsız olmaması (tekrarlanan önlemler) gibi istatistiksel kavramlarla ilgilenmemiz gerekir mi? Örneğin.... Çeşitli özelliklere ve satın alma bayrağına sahip 5 doğrudan posta kampanyasından (bir yıl boyunca meydana gelen) verilerim var. İdeal olarak, kampanya sırasında müşteri özelliklerine göre verilen satın alma için bir model …

19 machine-learning predictive-models repeated-measures assumptions

2

Önceki etkinliklerin zamanlarına bağlı olarak bir sonraki etkinliğin ne zaman gerçekleştiğini nasıl tahmin edebilirim?

Ben bir lise öğrencisiyim ve bir bilgisayar programlama projesi üzerinde çalışıyorum, ancak bir lise istatistik dersinin ötesinde istatistik ve modelleme verileri konusunda çok fazla deneyimim yok, bu yüzden kafam karıştı. Temel olarak, birisinin bir belgeyi yazdırmaya karar verdiği zamanlarda oldukça büyük bir listem var (herhangi bir istatistiksel test veya önlem …

19 probability modeling data-mining predictive-models

4

Doğrusal, üstel ve logaritmik fonksiyonlardan en uygun eğri uydurma fonksiyonunun belirlenmesi

Bağlam: Matematik Yığın Değişimi (Bir program oluşturabilir miyim) ile ilgili bir sorudan , birisinin bir dizi noktası vardır ve bu eğriye doğrusal, üstel veya logaritmik bir eğri sığdırmak ister. Genel yöntem, bunlardan birini (modeli belirten) seçerek başlamak ve daha sonra istatistiksel hesaplamalar yapmaktır.x - yx-yx-y Ancak asıl istenen, doğrusal, üstel …

18 regression predictive-models model-selection curve-fitting

3

Doğrusal bir modelde tahmin sınırları için bir formül elde etme (yani: tahmin aralıkları)

Aşağıdaki örneği ele alalım: set.seed(342) x1 <- runif(100) x2 <- runif(100) y <- x1+x2 + 2*x1*x2 + rnorm(100) fit <- lm(y~x1*x2) Bu, OLS regresyonu kullanarak x1 ve x2'ye dayalı bir y modeli oluşturur. Belirli bir x_vec için y'yi tahmin etmek istersek, yalnızca elde ettiğimiz formülü kullanabiliriz summary(fit). Ancak, ya y'nin …

18 r regression predictive-models prediction-interval

1

Aşamalı AIC - Bu konuyu çevreleyen tartışmalar var mı?

Bu sitede, p-değerlerine dayalı, AIC, BIC vb. Bu prosedürlerin neden değişkenlerin seçimi için genel olarak oldukça zayıf olduğunu anlıyorum. gung'un buradaki muhtemelen ünlü gönderisi nedenini açıkça göstermektedir; sonuçta, sadece veri taraması olan hipotezi ortaya koyduğumuz aynı veri kümesinde bir hipotezi doğrularız. Ayrıca, p-değerleri, çarpıklık ve uç değerler gibi büyük ölçüde …

17 forecasting predictive-models arima aic stepwise-regression

«predictive-models» etiketlenmiş sorular