«predictive-models» etiketlenmiş sorular

Öngörücü modeller, amacı belirli bir hipotezi test etmek veya bir olguyu mekanik olarak açıklamak olan modellerin aksine, birincil amacı bir sistemin diğer gözlemlerini en iyi şekilde tahmin etmek olan istatistiksel modellerdir. Bu nedenle, öngörücü modeller yorumlanabilirliğe daha az, performansa daha fazla vurgu yapmaktadır.

1
Olay olasılığını tahmin eden modelin doğruluğunu belirleme
Bir olayı a ve b olmak üzere iki sonucu modelleniyorum. A veya b'nin gerçekleşme olasılığını tahmin eden bir model oluşturdum (yani model, a'nın% 40 şansla olacağını ve b'nin% 60 şansla olacağını hesaplayacaktır). Modelden tahminler ile yapılan çalışmaların sonuçları hakkında büyük bir kaydım var. Modelin bu verileri ne kadar doğru kullandığını …

2
Bayesci çıkarımda, bazı terimler neden posterior öngörücüden düşmektedir?
Kevin Murphy'nin Konjugat Bayesci'nin Gauss dağılımını incelemesinde , posterior tahmin dağılımının p(x∣D)=∫p(x∣θ)p(θ∣D)dθp(x∣D)=∫p(x∣θ)p(θ∣D)dθ p(x \mid D) = \int p(x \mid \theta) p(\theta \mid D) d \theta burada , modelin uygun olduğu ve görünmeyen veriler olduğu verilerdir. Anlamadığım şey , integralde ilk dönemde bağımlılığın neden ortadan kalktığı. Temel olasılık kurallarını kullanarak şunu …

1
LASSO regresyon katsayılarının yorumu
Şu anda ~ 300 değişkenli ve 800 gözlemli bir veri kümesinde ikili sonuç için öngörücü bir model oluşturmaya çalışıyorum. Bu sitede adım adım gerileme ile ilgili sorunlar ve neden kullanmama hakkında çok şey okudum. LASSO regresyonunu ve özellik seçimi yeteneğini okudum ve "düzeltme" paketi ve "glmnet" kullanarak bunu uygulayabildim. Model …

3
Çarpık verilerle regresyon
Demografi ve hizmetten ziyaret sayılarını hesaplamaya çalışmak. Veriler çok eğri. histogramlar: qq grafikleri (sol günlüktür): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityve servicefaktör değişkenleridir. Tüm değişkenler için düşük bir p değeri *** elde ediyorum, ancak aynı zamanda .05 gibi düşük bir r kare elde ediyorum. Ne yapmalıyım? Üstel veya başka …

2
Karar Ağaçları ve Regresyon - Öngörülen değerler eğitim verisi aralığı dışında olabilir mi?
Karar ağaçları söz konusu olduğunda, öngörülen değer eğitim verisi aralığının dışında kalabilir mi? Örneğin, hedef değişkenin egzersiz veri kümesi aralığı 0-100 ise, modelimi oluşturup başka bir şeye uyguladığımda değerlerim -5 olabilir mi? veya 150? Karar ağacı gerilemesi anlayışımın hala kural tabanlı olduğu - sol / sağ ilerleme olduğu ve eğitim …

1
Netflix neden beş yıldızlı derecelendirme sisteminden benzer / beğenmeme sistemine geçiyor?
Netflix, önerilerini kullanıcının gönderdiği diğer filmler / şovlara dayandırırdı. Bu derecelendirme sisteminin beş yıldızı vardı. Artık Netflix, kullanıcıların filmleri / şovları beğenmesine / beğenmemesine (beğenmeme / beğenmeme) izin veriyor. Filmleri derecelendirmenin daha kolay olduğunu iddia ediyorlar. Bu 2 yönlü sınıflandırma, 5 yönlü sınıflandırma sisteminden istatistiksel olarak daha az öngörücü olmaz …

1
Hem sırt hem de kement ayrı olarak iyi performans gösterdiğinde ancak farklı katsayılar üretildiğinde sonuçlar nasıl yorumlanır
Hem Kement hem de Ridge ile bir regresyon modeli kullanıyorum (0-5 arasında değişen ayrı bir sonuç değişkenini tahmin etmek için). Modeli çalıştırmadan önce, kullandığım SelectKBestyöntemi scikit-learngelen özellik kümesi azaltmak için 250 ile 25 . İlk özellik seçimi olmadan, hem Kement hem de Ridge daha düşük doğruluk puanlarına neden olur [bu, …



1
Panel / boyuna veriler için tahmin değerlendirme metriği
Aylık düzeyde davranış tahminleri sağlayan birkaç farklı modeli değerlendirmek istiyorum. Veriler dengelenmiştir ve 100.000 ve 12. Sonuç belirli bir ayda bir konsere katılmaktadır, bu nedenle herhangi bir ayda insanların ~% 80'i için sıfırdır, ancak ağır kullanıcıların uzun bir sağ kuyruğu vardır. Tahminlerimin sonucun doğasına saygılı görünmüyor: kesirli konserler yaygın.n =n=n=T=T=T= …

2
Bu modelng yaklaşımında aşırı uyum var mı
Kısa bir süre önce, takip ettiğim sürecin (bir yüksek lisans tezinin bileşeni) aşırı uyumlu olarak görülebileceği söylendi. Bunu daha iyi anlamak ve başkalarının hemfikir olup olmadığını görmek istiyorum. Makalenin bu bölümünün amacı ; Degrade Artırılmış Regresyon Ağaçlarının performansını Rastgele Ormanlara karşı bir veri setinde karşılaştırın. Seçilen son modelin (GBM veya …


1
Zaman serisindeki fark için güven aralıkları
Bazı süreçlerin zaman serilerini simüle etmek için kullanılan stokastik bir modelim var. Bir parametreyi belirli bir değere değiştirmenin etkisi ile ilgileniyorum ve zaman serileri (örneğin model A ve model B) ve bir çeşit simülasyon tabanlı güven aralığı arasındaki farkı göstermek istiyorum. Sadece model A'dan bir grup simülasyon ve B modelinden …

1
Uzun bellek işlemlerini tahmin etme
Birlikte iki durum işlemi ile çalışıyorum içinde içinxtxtx_t{1,−1}{1,−1}\{1, -1\}t=1,2,…t=1,2,…t = 1, 2, \ldots Otokorelasyon fonksiyonu, uzun belleğe sahip bir işlemin göstergesidir, yani <1 üsüyle bir güç yasası bozulması gösterir. > library(fArma) > x<-fgnSim(10000,H=0.8) > x<-sign(x) > acf(x) Benim sorum: Sadece otokorelasyon fonksiyonu verilen serideki bir sonraki değeri en uygun şekilde …

2
Uzun Kısa Süreli Bellek (LSTM) tekrarlayan sinir ağının ardındaki sezgi nedir?
Tekrarlayan Sinir Ağının (RNN) arkasındaki fikir benim için açık. Bunu şu şekilde anlıyorum: Bir dizi gözlemimiz var ( ) (veya başka bir deyişle, çok değişkenli zaman serileri). Her bir tek gözlem bir olan boyutlu sayısal vektör. RNN-modeli içinde, bir sonraki gözlemin bir önceki gözlemin bir işlevi olduğunu ve gizli durumların …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.