«predictive-models» etiketlenmiş sorular

Öngörücü modeller, amacı belirli bir hipotezi test etmek veya bir olguyu mekanik olarak açıklamak olan modellerin aksine, birincil amacı bir sistemin diğer gözlemlerini en iyi şekilde tahmin etmek olan istatistiksel modellerdir. Bu nedenle, öngörücü modeller yorumlanabilirliğe daha az, performansa daha fazla vurgu yapmaktadır.




8
Mevcut bir değişken (ler) ile tanımlanmış bir korelasyon ile rastgele bir değişken oluşturun
Bir simülasyon çalışması için, mevcut bir değişkenine önceden tanımlanmış (popülasyon) bir korelasyon gösteren rastgele değişkenler oluşturmalıyım .YYY RPaketlere baktım copulave CDVinebelirli bir bağımlılık yapısına sahip rastgele çok değişkenli dağılımlar üretebiliyorum. Bununla birlikte, ortaya çıkan değişkenlerden birini mevcut bir değişkene sabitlemek mümkün değildir. Herhangi bir fikir ve mevcut fonksiyonlara bağlantılar takdir …

15
Açıklayıcı ve öngörücü modelleme üzerine pratik düşünceler
Nisan ayında, UMD Matematik Bölümü İstatistikleri grup seminer serisinde "Açıklamak veya Tahmin Etmek" adlı bir konuşmaya katıldım. Konuşma, UMD'nin Smith Business School'da ders veren Prof. Galit Shmueli tarafından verildi . Konuşması, "IS Araştırmalarında Tahmine Dayalı ve Açıklayıcı Modelleme" başlıklı bir makale ve "Açıklamak veya Tahmin Etmek İçin" başlıklı bir çalışma …

8
Test verilerinin eğitim verisine sızmadığından nasıl emin olabilirim?
Tahmin edici bir model inşa eden birisine sahip olduğumuzu varsayalım, ancak birinin uygun istatistiksel ya da makine öğrenmesi ilkeleri konusunda tam olarak bilgili olmadığını varsayalım. Belki o kişiye öğrenirken yardımcı oluyoruz veya belki de bu kişi kullanımı en az bilgiyi gerektiren bir çeşit yazılım paketi kullanıyor. Şimdi bu kişi, gerçek …


6
Lojistik lojistik regresyon alternatifleri
Lojistik regresyon ile aynı görevi yapan birçok algoritma istiyorum. Bu, bazı açıklayıcı değişken (X) ile ikili bir yanıt (Y) için bir tahmin verebilecek algoritmalar / modellerdir. Algoritmayı adlandırdıktan sonra, R'de nasıl uygulanacağını gösterirseniz sevinirim: İşte diğer modellerle güncellenebilecek bir kod: set.seed(55) n <- 100 x <- c(rnorm(n), 1+rnorm(n)) y <- …

5
Çoklu karşılaştırmalar için p değerlerini çoklu regresyonda ayarlamak iyi bir fikir midir?
Bir hizmet için talebin ilgili belirleyicilerini bulmaya çalışan bir sosyal bilim araştırmacısı / ekonometrikçi olduğunuzu varsayalım. Talebi tanımlayan 2 sonuca / bağımlı değişkene sahipsiniz (evet / hayır servisini ve durum sayısını kullanarak). Talebi teorik olarak açıklayabilecek 10 öngörücü / bağımsız değişkeniniz var (örneğin, yaş, cinsiyet, gelir, fiyat, ırk vb.). İki …

5
Makine Öğrenmesinde dengesiz veriler ne zaman bir problemdir?
Lojistik regresyon , SVM , karar ağaçları , torbalama ve benzeri pek çok başka soru kullanırken dengesiz veriler hakkında çoktan sorularımız vardı , bu da onu çok popüler bir konu haline getirdi! Maalesef, soruların her biri algoritmaya özgü görünüyor ve dengesiz verilerle ilgilenmek için genel bir kılavuz bulamadım. Dengesiz verilerle …

3
Kütle dönüştürülmüş yordayıcının ve / veya tepkinin yorumlanması
Merak ediyorum, yorumlamada sadece bağımlı, bağımsız veya bağımsız değişkenlerin mi yoksa sadece bağımsız değişkenlerin log dönüşümünde mi olduğunu fark eder mi? Durumunu düşünün log(DV) = Intercept + B1*IV + Error IV'ü yüzde artış olarak değerlendirebilirim, ancak sahip olduğumda bu nasıl değişir? log(DV) = Intercept + B1*log(IV) + Error veya sahipken …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

1
El ile hesaplanan , yeni verileri test etmek için randomForest () ile eşleşmiyor
Bunun oldukça özel bir Rsoru olduğunu biliyorum , ancak hatalı açıklanan oranındaki varyans oranını düşünüyorum . İşte gidiyor.R2R2R^2 RPaketi kullanmaya çalışıyorum randomForest. Bazı eğitim verilerim ve test verilerim var. Rastgele bir orman modeline uyduğumda, randomForestişlev test etmek için yeni test verileri girmenize olanak sağlar. Daha sonra bu yeni verilerde açıklanan …

3
Varyans
TL, DR: O görünür aksine tavsiye sık sık tekrarlanan, çapraz doğrulama (Loo-CV) terk-on Çıkış - olup,ile kat CV(kat sayısı) eşit(numara Eğitim gözlemlerinin) -Model / algoritma, veri seti veya her ikisinde debelirli bir stabilite koşuluvarsayarsak, en değişken değil,herhangi biriçinen az değişkenolan genelleme hatasının tahminlerini verir(hangisinden emin değilim) bu kararlılık durumunu gerçekten …

2
Doğrusal regresyonda standartlaştırılmış açıklayıcı değişkenlerin ne zaman ve nasıl kullanılacağı
Doğrusal regresyon ile ilgili 2 basit sorum var: Açıklayıcı değişkenleri ne zaman standart hale getirmeniz önerilir? Tahmin, standartlaştırılmış değerlerle yapıldıktan sonra, yeni değerlerle nasıl tahmin edilebilir (yeni değerleri nasıl standartlaştırmalı)? Bazı referanslar yardımcı olabilir.

5
“Kendi kendini yitiren” bir tahmin modeliyle nasıl baş edilir?
Bir ML uzmanının büyük bir perakendeciden, stok olaylarını tahmin etmek için bir model geliştirdikleri bir sunumunu izliyordum. Bir anlığına, zaman içinde modellerinin çok doğru olduğunu varsayalım, bir şekilde "kendi kendini yitirmez" olmaz mı? Yani, eğer model gerçekten iyi çalışıyorsa, o zaman stok olaylarını önceden tahmin edebilecek ve onlardan kaçınabilecek, sonuçta …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.