«predictive-models» etiketlenmiş sorular

Öngörücü modeller, amacı belirli bir hipotezi test etmek veya bir olguyu mekanik olarak açıklamak olan modellerin aksine, birincil amacı bir sistemin diğer gözlemlerini en iyi şekilde tahmin etmek olan istatistiksel modellerdir. Bu nedenle, öngörücü modeller yorumlanabilirliğe daha az, performansa daha fazla vurgu yapmaktadır.

2
Bu sanat regresyon metodolojisi mi?
Kaggle yarışmalarını uzun zamandır takip ediyorum ve birçok kazanma stratejisinin "büyük üçler" den en az birini kullanmayı içerdiğini fark ettim: torbalama, güçlendirme ve istifleme. Regresyonlar için, mümkün olan en iyi regresyon modelini oluşturmak yerine, (Genelleştirilmiş) doğrusal regresyon, rasgele orman, KNN, NN ve SVM regresyon modelleri gibi çoklu regresyon modelleri oluşturmak …

1
Yükseltme için göreceli değişken önemi
Göreceli değişken öneminin aşırı genel / basit olmayan Gradient Boostted Trees içinde nasıl hesaplandığına dair bir açıklama arıyorum: Ölçümler, bir değişkenin bölünme için seçilme sayısına dayanır, her bölünmenin sonucu olarak karenin iyileştirilmesiyle ağırlıklandırılır ve tüm ağaçların ortalaması alınır . [ Elith ve diğ. 2008, Regresyon ağaçlarının güçlendirilmesi için bir çalışma …

6
Parsimony hala altın standart mı olmalı?
Sadece bir düşünce: Parsimonif modeller, model seçiminde her zaman varsayılan hedef olmuştur, ancak bu yaklaşım ne derece eskidir? Parlamentoya olan eğilimimizin bir abaki ve slayt kuralları (ya da daha ciddi olarak modern olmayan bilgisayarlar) zamanının bir kalıntısı olduğunu merak ediyorum. Günümüzün bilgi işlem gücü, giderek daha fazla tahminde bulunma yeteneği …

3
Sınıf dengesizliği probleminin kök nedeni nedir?
Son zamanlarda makine / istatistik öğreniminde "sınıf dengesizliği sorunu" hakkında çok fazla düşündüm ve neler olup bittiğini anlamadığım bir duyguyu daha da derinleştiriyorum. İlk önce, terimlerimi tanımlamama (veya tanımlamaya çalışmama) izin verin: Sınıf dengesizliği bir sorun makinesi / istatistiksel öğrenme 1 sınıflara 0 sınıfların oranı çok eğik olduğu zaman, bazı …

3
LASSO için gösterge / binary / kukla tahmin edicilerin ölülüp kurtarılmayacağı
LASSO (ve diğer model seçim prosedürleri) için tahmincileri yeniden düzenlemek çok önemlidir. Genel öneri ı takip sürekli değişkenler için bir 0 ortalama, 1 standart sapma normalleşmesini kullanmak için basitçe. Ama aptallarla ne ilgisi var? Örneğin , aynı (mükemmel) yaz okulundan bazı uygulamalı örnekler , muhtemelen aptallarla karşılaştırılabilir olması için sürekli …

2
Kademeli bir seçim yaptıktan sonra p değerleri neden yanıltıcıdır?
Örneğin doğrusal bir regresyon modeli düşünelim. Veri madenciliğinde, AIC kriterine göre kademeli bir seçim yaptıktan sonra, her gerçek regresyon katsayısının sıfır olduğunu belirten boş hipotezi test etmek için p değerlerine bakmak yanıltıcı olduğunu duydum. Modelde kalan tüm değişkenlerin sıfırdan farklı gerçek bir regresyon katsayısına sahip olduğu düşünülmeli. Biri bana nedenini …

1
Serbestlik dereceleri tam sayı olmayan bir sayı olabilir mi?
GAM kullandığımda, artık DF (kodun son satırı) olduğunu gösteriyor. Bu ne anlama geliyor? GAM örneğinin ötesine geçmek, Genel olarak, serbestlik derecelerinin sayısı tam sayı olmayan bir sayı olabilir mi?26,626,626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

9
Korelasyon nedensellik olmadan ne zaman faydalı olabilir?
Birçok istatistikçinin söylediği bir evcil hayvan "Korelasyon nedensellik anlamına gelmez" dir. Bu kesinlikle doğrudur, ancak DOES'in burada ima ettiği bir şey korelasyonun çok az değeri olduğu veya hiç olmadığıdır. Bu doğru mu? İki değişkenin birbiriyle ilişkili olduğunu bilmek işe yaramaz mı? Bunun böyle olduğunu hayal edemiyorum. Prediktif analizlere çok aşina …

4
Hem sürekli hem de kategorik özelliklerle öngörüde bulunmak
Bazı prediktif modelleme teknikleri, sürekli prediktörlerin kullanımı için daha fazla tasarlanmıştır, diğerleri ise kategorik veya ayrık değişkenlerin ele alınması için daha iyidir. Elbette bir tipi diğerine dönüştürme teknikleri var (ayrıklaştırma, yapay değişkenler, vs.). Ancak, her iki giriş türünü aynı anda, özelliklerin türünü değiştirmeden aynı anda ele almak üzere tasarlanmış öngörücü …

1
Sınıflandırma ve regresyonu birleştiren bir algoritma var mı?
Aynı zamanda sınıflandırma ve regresyon yapabilen herhangi bir algoritma olup olmadığını merak ediyorum. Örneğin, algoritmanın bir sınıflandırıcı öğrenmesine izin vermek istiyorum ve her bir etiketin içinde aynı zamanda sürekli bir hedef öğreniyor. Bu nedenle, her eğitim örneği için kategorik bir etikete ve sürekli bir değere sahiptir. Önce bir sınıflayıcıyı eğitebilirim, …

4
Aşırı örnekleme, yetersiz örnekleme ve SMOTE hangi sorunu çözüyor?
Yakın geçmişteki iyi alınan söz konusu Tim sorar dengesiz veriler gerçekten Makine Öğrenmesi bir sorun olduğunda ? Sorunun önermesi, sınıf dengesini ve dengesiz sınıflar sorununu tartışan bir çok makine öğrenimi literatürü olmasıdır . Fikir, pozitif ve negatif sınıf arasında bir dengesizliğe sahip veri kümelerinin, bazı makine öğrenimi sınıflandırma (buraya olasılıklı …

2
Karışık modeller öngörücü modeller olarak yararlı mıdır?
Tahmini modelleme açısından karma modellerin avantajları konusunda biraz kafam karıştı. Tahmini modeller genellikle daha önce bilinmeyen gözlemlerin değerlerini öngörmek anlamına geldiğinden, karışık bir modelin faydalı olmasının tek yolunun popülasyon düzeyinde tahminler sağlama yeteneği (rastgele etkiler eklemeden) anlamına geldiği açıktır. Ancak, sorun şu ana kadar ki deneyimlerime göre, karışık modellere dayalı …

3
Sınıflandırma performansını değerlendirmek için çapraz onaylama mı yoksa önyükleme mi?
Bir sınıflandırıcının belirli bir veri setindeki performansını değerlendirmek ve diğer sınıflayıcılarla karşılaştırmak için en uygun örnekleme yöntemi nedir? Çapraz onaylama standart bir uygulama gibi görünmektedir, ancak .632 önyükleme gibi yöntemlerin daha iyi bir seçim olduğunu okudum. Bir takip olarak: Performans ölçütü seçimi cevabı etkiler mi (doğruluk yerine AUC kullanırsam)? Nihai …

3
Sklearn karmaşa matrisini nasıl yorumlayabilirim?
Sınıflandırıcımın performansını kontrol etmek için karışıklık matrisi kullanıyorum . Scikit-Learn kullanıyorum, kafam biraz karıştı. Sonucu nasıl yorumlayabilirim from sklearn.metrics import confusion_matrix >>> y_true = [2, 0, 2, 2, 0, 1] >>> y_pred = [0, 0, 2, 2, 0, 2] >>> confusion_matrix(y_true, y_pred) array([[2, 0, 0], [0, 0, 1], [1, 0, …

2
Scikit-learn'deki ortalama mutlak yüzde hatası (MAPE) [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. 2 yıl önce kapandı . Python ve scikit-learn kullanarak tahminlerimizin Ortalama mutlak yüzde hatasını (MAPE) nasıl hesaplayabiliriz? Gönderen dokümanlar , biz bağlanımlar için sadece bu …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.