«predictive-models» etiketlenmiş sorular

Öngörücü modeller, amacı belirli bir hipotezi test etmek veya bir olguyu mekanik olarak açıklamak olan modellerin aksine, birincil amacı bir sistemin diğer gözlemlerini en iyi şekilde tahmin etmek olan istatistiksel modellerdir. Bu nedenle, öngörücü modeller yorumlanabilirliğe daha az, performansa daha fazla vurgu yapmaktadır.


1
Nate Silver'ın Loess hakkında ne söylediğini açıklama
Geçenlerde sorduğum bir soruda , sevgisizlikle tahmin etmenin büyük bir "hayır-hayır" olduğu söylendi. Ancak, Nate Silver'ın FiveThirtyEight.com hakkındaki en son makalesinde, seçim tahminlerinde bulunmamak için loess kullanmayı tartıştı. Agresif ve muhafazakar tahminlerin ayrıntılarını loess ile tartışıyordu ama gelecek tahminlerini loess ile yapmanın geçerliliğini merak ediyorum? Bu tartışmayla ve sevgiyle benzer …

3
Bir model için öngörülen olasılık kalibrasyonunun görselleştirilmesi
Her sınıf için her sınıf için bir olasılık üreten öngörücü bir modelim olduğunu varsayalım. Şimdi, sınıflandırma için bu olasılıkları kullanmak istersem böyle bir modeli değerlendirmenin pek çok yolu olduğunu kabul ediyorum (hassasiyet, hatırlama, vb.). Ayrıca, bir ROC eğrisinin ve altındaki alanın, modelin sınıflar arasında ne kadar iyi farklılaştığını belirlemek için …

3
Prediktif modelleme yarışmaları için siteler
Kaggle , TunedIt ve CrowdAnalytix ile ilgili tahminli modelleme yarışmalarına katılıyorum . Bu sitelerin istatistik / makine öğrenimi için "alıştırma yapmak" için iyi bir yol olduğunu düşünüyorum. Bilmem gereken başka siteler var mı? Ev sahibinin rakiplerin sunumlarından kâr elde etmek istediği yarışmalar hakkında ne düşünüyorsunuz? / edit: İşte daha eksiksiz …


3
Sonuç sadece eğitim durumundaki olumlu vakalarla nasıl tahmin edilir?
Sadelik adına, spam / spam olmayan e-postaların klasik örneği üzerinde çalışıyorum diyelim. 20.000 e-posta setim var. Bunlardan 2000'in spam olduğunu biliyorum ama spam olmayan e-postalardan hiçbir örneğim yok. Kalan 18000’in spam olup olmadığını tahmin etmek istiyorum. İdeal olarak, aradığım sonuç, e-postanın spam olma olasılığı (veya bir p değeri). Bu durumda …

2
Genel veri setleri için veri büyütme teknikleri?
Birçok makine öğrenim uygulamasında, veri yükseltme yöntemleri daha iyi modeller oluşturmaya izin verdi. Örneğin, kedi ve köpek görüntüsünün eğitim setini alın . Döndürmek, yansıtmak, kontrastı ayarlamak, vb. İle orijinallerinden ek görüntüler elde etmek mümkündür.100100100 Görüntüler durumunda, veri arttırma nispeten basittir. Ancak, (örneğin) birinin örnek bir eğitim seti ve farklı şeyleri …

2
StackExchange soruları için “ilginçlik” işlevi
StackExchange siteleri için bir veri madenciliği paketi bir araya getirmeye çalışıyorum ve özellikle, "en ilginç" soruları belirlemeye çalışırken sıkışmış. Soru puanını kullanmak istiyorum, ancak görüşlerin sayısı nedeniyle önyargıyı kaldırıyorum, ancak buna titizlikle nasıl yaklaşacağımı bilmiyorum. İdeal dünyada, soruları hesaplayarak sıralayabilirim; burada , oyların toplamı ve , görüntülenme sayısıdır. Ne de …

2
Bayes düşünme hakkında aşırı düşünme
Geleneksel frekansçı istatistik alanındaki tahmin modellerini doğrulamak için yöntem ve yazılım geliştirmeye çok zaman ayırdım. Daha fazla Bayesci fikri hayata geçirirken ve öğretirken kucaklamak için bazı önemli farklılıklar görüyorum. Birincisi, Bayes öngörülü modelleme analistten aday özelliklerine göre özelleştirilebilen önceki dağılımlar hakkında çok düşünmesini ister ve bu öncelikler modeli kendilerine çeker …

2
Destekleme: öğrenme oranına neden bir düzenleme parametresi denir?
Öğrenme oranı parametresi ( ) Gradyan küçülür -typically her yeni baz model seri olarak bağlanır sığ tree katkısını Arttırılması de. Daha küçük adımlarda olduğu gibi anlaşılabilir olan test seti doğruluğunu önemli ölçüde arttırdığı gösterilmiştir, kayıp fonksiyonunun minimumuna daha hassas bir şekilde ulaşılabilir. ν∈ [ 0 , 1 ]ν∈[0,1]\nu \in [0,1] …

1
Öngörülü Modelleme - Karma modellemeyi önemsemeli miyiz?
Tahminli modelleme için kendimizi rastgele etkiler ve gözlemlerin bağımsız olmaması (tekrarlanan önlemler) gibi istatistiksel kavramlarla ilgilenmemiz gerekir mi? Örneğin.... Çeşitli özelliklere ve satın alma bayrağına sahip 5 doğrudan posta kampanyasından (bir yıl boyunca meydana gelen) verilerim var. İdeal olarak, kampanya sırasında müşteri özelliklerine göre verilen satın alma için bir model …

2
Önceki etkinliklerin zamanlarına bağlı olarak bir sonraki etkinliğin ne zaman gerçekleştiğini nasıl tahmin edebilirim?
Ben bir lise öğrencisiyim ve bir bilgisayar programlama projesi üzerinde çalışıyorum, ancak bir lise istatistik dersinin ötesinde istatistik ve modelleme verileri konusunda çok fazla deneyimim yok, bu yüzden kafam karıştı. Temel olarak, birisinin bir belgeyi yazdırmaya karar verdiği zamanlarda oldukça büyük bir listem var (herhangi bir istatistiksel test veya önlem …

4
Doğrusal, üstel ve logaritmik fonksiyonlardan en uygun eğri uydurma fonksiyonunun belirlenmesi
Bağlam: Matematik Yığın Değişimi (Bir program oluşturabilir miyim) ile ilgili bir sorudan , birisinin bir dizi noktası vardır ve bu eğriye doğrusal, üstel veya logaritmik bir eğri sığdırmak ister. Genel yöntem, bunlardan birini (modeli belirten) seçerek başlamak ve daha sonra istatistiksel hesaplamalar yapmaktır.x - yx-yx-y Ancak asıl istenen, doğrusal, üstel …

3
Doğrusal bir modelde tahmin sınırları için bir formül elde etme (yani: tahmin aralıkları)
Aşağıdaki örneği ele alalım: set.seed(342) x1 <- runif(100) x2 <- runif(100) y <- x1+x2 + 2*x1*x2 + rnorm(100) fit <- lm(y~x1*x2) Bu, OLS regresyonu kullanarak x1 ve x2'ye dayalı bir y modeli oluşturur. Belirli bir x_vec için y'yi tahmin etmek istersek, yalnızca elde ettiğimiz formülü kullanabiliriz summary(fit). Ancak, ya y'nin …

1
Aşamalı AIC - Bu konuyu çevreleyen tartışmalar var mı?
Bu sitede, p-değerlerine dayalı, AIC, BIC vb. Bu prosedürlerin neden değişkenlerin seçimi için genel olarak oldukça zayıf olduğunu anlıyorum. gung'un buradaki muhtemelen ünlü gönderisi nedenini açıkça göstermektedir; sonuçta, sadece veri taraması olan hipotezi ortaya koyduğumuz aynı veri kümesinde bir hipotezi doğrularız. Ayrıca, p-değerleri, çarpıklık ve uç değerler gibi büyük ölçüde …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.