«prediction» etiketlenmiş sorular

İstatistiksel bir model kullanarak bilinmeyen rasgele büyüklüklerin tahmini.

1
Model ölçeklendirilmiş verilerle donatıldığında tahminler yapmak için yeni gözlemler nasıl ölçeklendirilir?
Doğrusal regresyon modelinde kullanılacak veri matrisini ölçeklendirme kavramını anlıyorum. Örneğin, R'de şunları kullanabilirsiniz: scaled.data <- scale(data, scale=TRUE) Tek sorum, çıktı değerlerini tahmin etmek istediğim yeni gözlemler için, bunlar nasıl doğru bir şekilde ölçeklendiriliyor? Olur scaled.new <- (new - mean(data)) / std(data)mu?

1
Karışık efekt modellerinde tahmin: rastgele efektlerle ne yapmalı?
Bu varsayımsal veri kümesini ele alalım: set.seed(12345) num.subjects <- 10 dose <- rep(c(1,10,50,100), num.subjects) subject <- rep(1:num.subjects, each=4) group <- rep(1:2, each=num.subjects/2*4) response <- dose*dose/10 * group + rnorm(length(dose), 50, 30) df <- data.frame(dose=dose, response=response, subject=subject, group=group) Kullanabileceğimiz lmerastgele bir etki modeli ile tepkisini modellemek için: require(nlme) model <- lme(response …


1
Fisher Kesin Testi ve Hipergeometrik Dağılım
Balıkçı testini daha iyi anlamak istedim, bu yüzden f ve m erkek ve kadına karşılık gelen ve n ve y "soda tüketimine" karşılık gelen aşağıdaki oyuncak örneğini tasarladım: > soda_gender f m n 0 5 y 5 0 Açıkçası, bu büyük bir basitleştirme, ama bağlamın önüne geçmesini istemedim. Burada sadece …

1
Caret paketi ile RandomForest FinalModel'i kullanmadan önce ön işleme gerek var mı?
10x10CV ile randomForest nesnesini eğitmek için düzeltme paketi kullanıyorum. library(caret) tc <- trainControl("repeatedcv", number=10, repeats=10, classProbs=TRUE, savePred=T) RFFit <- train(Defect ~., data=trainingSet, method="rf", trControl=tc, preProc=c("center", "scale")) Bundan sonra, rastgele bir testSet (yeni veri) üzerinde test RF.testSet$Prediction <- predict(RFFit, newdata=testSet) Karışıklık matrisi bana modelin o kadar da kötü olmadığını gösteriyor. confusionMatrix(data=RF.testSet$Prediction, …

1
Netflix neden beş yıldızlı derecelendirme sisteminden benzer / beğenmeme sistemine geçiyor?
Netflix, önerilerini kullanıcının gönderdiği diğer filmler / şovlara dayandırırdı. Bu derecelendirme sisteminin beş yıldızı vardı. Artık Netflix, kullanıcıların filmleri / şovları beğenmesine / beğenmemesine (beğenmeme / beğenmeme) izin veriyor. Filmleri derecelendirmenin daha kolay olduğunu iddia ediyorlar. Bu 2 yönlü sınıflandırma, 5 yönlü sınıflandırma sisteminden istatistiksel olarak daha az öngörücü olmaz …

1
Tahmin aralığı = güvenilir aralık?
Tahmin aralığının ve güvenilir aralığın aynı şeyi değerlendirip değerlendirmediğini merak ediyorum. Örneğin, doğrusal bir regresyon ile, takılan değerlerin tahmin aralığını tahmin ettiğinizde, değerinizin düşmesini beklediğiniz aralığın sınırlarını tahmin edersiniz. Bir güven aralığının tersine, ortalama değer gibi bir dağıtım parametresine değil, açıklanan değişkeninizin belirli bir X değeri için alabileceği değere ( …

1
R neuralnet - hesaplama sürekli bir cevap verir
Tahmin için R'nin neuralnetpaketini ( burada dokümantasyon ) kullanmaya çalışıyorum . İşte yapmaya çalıştığım şey: library(neuralnet) x <- cbind(runif(50, min=1, max=500), runif(50, min=1, max=500)) y <- x[, 1] * x[, 2] train <- data.frame(x, y) n <- names(train) f <- as.formula(paste('y ~', paste(n[!n %in% 'y'], collapse = ' + '))) …

1
ABC model seçimi
Edilmiş gösterilen Bayes faktörleri kullanılarak ABC modeli seçimi nedeniyle özet istatistikler kullanımından gelen bir hata varlığı önerilecek olmadığını. Bu makaledeki sonuç, Bayes faktörüne (Algoritma 2) yaklaşmak için popüler bir yöntemin davranışının incelenmesine dayanmaktadır. Bayes faktörlerinin model seçimini gerçekleştirmenin tek yolu olmadığı iyi bilinmektedir. İlgilenebilecek bir modelin tahmini performansı gibi başka …

2
Tahmin ve Tolerans Aralıkları
Tahmin ve hoşgörü aralıklarıyla ilgili birkaç sorum var. Önce tolerans aralıklarının tanımlanması üzerinde anlaşalım: Bize bir güven seviyesi, örneğin% 90, yakalanacak nüfusun yüzdesi,% 99 ve örnek büyüklüğü, 20 diyelim. Olasılık dağılımı biliniyor, normal diyoruz kolaylık sağlamak için. Şimdi, yukarıdaki üç sayı (% 90,% 99 ve 20) ve altta yatan dağılımın …

1
R / mgcv: te () ve ti () tensör ürünleri neden farklı yüzeyler üretir?
mgcvİçin paket Rtensör ürün etkileşimleri uydurma için iki işlevi vardır: te()ve ti(). İkisi arasındaki temel işbölümünü anlıyorum (doğrusal olmayan bir etkileşime uymak ve bu etkileşimi ana etkilere ve etkileşime ayırmak). Anlamadığım şey neden te(x1, x2)ve ti(x1) + ti(x2) + ti(x1, x2)(biraz) farklı sonuçlar üretebilir. MWE (uyarlanmıştır ?ti): require(mgcv) test1 <- …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
R'deki her tahmin için regresyondaki güven puanlarını (rastgele ormanlarla / XGBoost ile) nasıl hesaplayabilirim?
Rastgele Ormanlar veya Aşırı Gradient Boosting (XGBoost) gibi algoritmaları kullanırken, tahmin edilen her değer için bir güven puanı almanın bir yolu var mı (buna güven değeri veya olasılığı da diyebiliriz)? Diyelim ki bu güven puanı 0 ile 1 arasında değişiyor ve belirli bir tahminden ne kadar emin olduğumu gösteriyor . …

1
Mgcv gam'da rastgele efektlerle tahmin
Tek tek gemiler için basit rastgele efektleri modellemek için mgcv'de gam kullanarak toplam balık avını modellemekle ilgileniyorum (balıkçılıkta zamanla tekrarlanan yolculuklar yapıyorum). 98 denek var, bu yüzden rastgele efektleri modellemek için gamm yerine gam kullanacağımı düşündüm. Modelim: modelGOM <- gam(TotalFish ~ factor(SetYear) + factor(SetMonth) + factor(TimePeriod) + s(SST) + s(VesselID, …

2
Nedensel çıkarım ve tahmin arasındaki ilişki nedir?
Nedensel çıkarım ve tahmin (hem sınıflandırma hem de regresyon) arasındaki ilişkiler ve farklılıklar nelerdir? Tahmin bağlamında, öngörücü / girdi değişkenleri ve yanıt / çıktı değişkenleri vardır. Bu, girdi ve çıktı değişkenleri arasında nedensel bir ilişki olduğu anlamına mı geliyor? Öyleyse, tahmin nedensel çıkarımın bir parçası mı? Doğru anlarsam, nedensel çıkarım, …

2
Örnek dışı tahminleri iyileştirmeyen '' önemli değişken '' - nasıl yorumlanır?
Birçok kullanıcı için oldukça basit olacağını düşündüğüm bir sorum var. (İ) çeşitli açıklayıcı değişkenlerle yanıt değişkenimin ilişkisini araştırmak için doğrusal regresyon modelleri kullanıyorum ve (ii) açıklayıcı değişkenleri kullanarak yanıt değişkenimi tahmin ediyorum. Belirli bir açıklayıcı değişken X'in yanıt değişkenimi önemli ölçüde etkilediği görülmektedir. Bu açıklayıcı değişken X'in katma değerini yanıt …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.