«predictive-models» etiketlenmiş sorular

Öngörücü modeller, amacı belirli bir hipotezi test etmek veya bir olguyu mekanik olarak açıklamak olan modellerin aksine, birincil amacı bir sistemin diğer gözlemlerini en iyi şekilde tahmin etmek olan istatistiksel modellerdir. Bu nedenle, öngörücü modeller yorumlanabilirliğe daha az, performansa daha fazla vurgu yapmaktadır.

2
Tahmin, istatistikçilerin kabiliyetini yargılamak için 'altın kriter' midir?
Geçen hafta Faraway'in R (1. baskı) ders kitabı doğrusal modellerini okuyordum . Faraway'in "İstatistiksel Strateji ve Model Belirsizliği" adlı bir bölümü vardı. O yapay bir çok karmaşık model kullanılarak bazı verileri oluşturduğunu (sayfa 158) açıklanan, sonra veriyi modellemek ve öğrencileri tahmin sonuçları karşılaştırmak için öğrencilerini istedi vs okuma sonuçları. Ne …

1
Ayrı modelleme / doğrulama kümeleri kullanarak bir regresyon modeli oluştururken, doğrulama verilerini “yeniden dolaşıma sokmak” uygun mudur?
Diyelim ki modelleme / doğrulama gözlemleri arasında 80/20 ayrımı var. Modelleme veri kümesine bir model sığdırıyorum ve doğrulama veri kümesinde gördüğüm hatadan rahatım. Gelecekteki gözlemleri puanlamak için modelimi sunmadan önce,% 100 verilerinde güncellenmiş parametre tahminleri almak için doğrulamayı modelleme verileriyle birleştirmek uygun mudur? Bununla ilgili iki bakış açısı duydum: Gerçekleştirdiğim …

2
Rastgele Orman Modelleri kullanılırken Değişkenleriniz Ne Zaman Günlüğe Kaydedilir / Artırılır?
Çeşitli özelliklere dayalı fiyatları tahmin etmek için Random Forests kullanarak regresyon yapıyorum. Kod Python'da Scikit-learn kullanılarak yazılır. Regresyon modeline uyması için değişkenleri kullanmadan önce exp/ kullanmadan dönüştürüp dönüştürmemeye nasıl karar verirsiniz log? Rastgele Orman gibi bir Topluluk yaklaşımı kullanırken gerekli mi?

2
Nadir olay tahmin modelleri için aşırı örnekleme ile torbalama
Aşağıdakilerin tanımlanıp tanımlanmadığını ve (her iki şekilde) çok dengesiz bir hedef değişkeni olan öngörülü bir modeli öğrenmek için makul bir yöntem gibi geldiğini bilen var mı? Genellikle veri madenciliğinin CRM uygulamalarında, olumlu olayın (başarı) çoğunluğa (negatif sınıf) göre çok nadir olduğu bir model ararız. Örneğin, yalnızca% 0,1'inin pozitif ilgi sınıfında …

2
P> 0.5 kesmesi neden lojistik regresyon için “optimal” değildir?
ÖNSÖZ: Bir kesme kullanmanın ya da kullanmamanın yararları ya da nasıl bir kesme seçmesi gerektiği umurumda değil. Benim sorum tamamen matematiksel ve meraktan kaynaklanıyor. Lojistik regresyon, A sınıfı ile B sınıfı arasındaki arka koşullu olasılığı modellemektedir ve posterior koşullu olasılıkların eşit olduğu bir hiper düzleme uymaktadır. Teorik olarak, 0.5 sınıflandırma …

2
Kuantil regresyon tahmini
Bazı modellerim için kantil regresyon kullanmakla ilgileniyorum, ancak bu metodolojiyi kullanarak neyi başarabileceğim konusunda bazı açıklamalar yapmak istiyorum. IV / DV ilişkisinin daha güçlü bir analizini elde edebileceğimi anlıyorum . Özellikle, daha karmaşık doğrusal olmayan modellere, hatta parçalı doğrusal regresyona başvurmadan modellerimin uyumluluğunu iyileştirmekle ilgileniyorum. Tahminlerde, öngörücülerin değerine bağlı olarak …

4
R'de bir nls modeli için doğru başlangıç ​​değerlerini elde etme
Aşağıdaki gibi bir veri kümesine basit bir güç yasası modeli sığdırmaya çalışıyorum: mydf: rev weeks 17906.4 1 5303.72 2 2700.58 3 1696.77 4 947.53 5 362.03 6 Amaç, güç hattını geçmek ve revgelecek haftalara yönelik vlaueları tahmin etmek için kullanmaktır . Bir grup araştırma beni nlsşu şekilde uyguladığım işleve götürdü …

2
Büzülme nedir?
Büzülme sözcüğü belirli çevrelerde çok fazla atılır. Ama büzülme nedir, net bir tanım yok gibi görünüyor. Bir zaman serim varsa (ya da herhangi bir sürecin herhangi bir gözlem koleksiyonuna sahipsem), serideki ampirik büzülmeyi ölçmenin farklı yolları nelerdir? Bahsetebileceğim farklı teorik büzülme türleri nelerdir? Büzülme öngörüye nasıl yardımcı olabilir? İnsanlar iyi …

2
Olasılık modellerini kalibre ederken optimum hazne genişliği nasıl seçilir?
Arka plan: Burada, bir sonucun gerçekleşme olasılığını tahmin eden modellerin nasıl kalibre edileceğine dair bazı harika sorular / cevaplar bulunmaktadır. Örneğin Brier puanı ve çözüm, belirsizlik ve güvenilirliğe ayrışması . Kalibrasyon grafikleri ve izotonik regresyon . Bu yöntemler genellikle öngörülen olasılıklar üzerinde bir binning yönteminin kullanılmasını gerektirir, böylece sonucun (0, …

1
Lojistik regresyonda uyum iyiliği testi; hangi 'uygun' testi yapmak istiyoruz?
Soruya ve cevaplarına atıfta bulunuyorum: Lojistik regresyondan geliştirilen modellerin tahmin yeteneği nasıl karşılaştırılır? @Clark Chong ve @Frank Harrell tarafından cevaplar / yorumlar. ve Hosmer-Lemeshow testinde serbestlik dereceleriχ2χ2\chi^2 ve yorumlar. Ben kağıt okuma var Medicine, Vol DW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, "lojistik regresyon modeli için iyilik-of-fit testlerin …

1
Çoklu doğrusallık ve spline regresyonu ile ilgili bir problem var mı?
Doğal (yani kısıtlı) kübik kamalar kullanıldığında, oluşturulan temel fonksiyonlar yüksek oranda eşbiçimlidir ve bir regresyonda kullanıldığında çok doğrusallık gösteren çok yüksek VIF (varyans enflasyon faktörü) istatistikleri üretiyor gibi görünmektedir. Tahmin amaçlı bir model söz konusu olduğunda, bu bir sorun mudur? Kama yapısının doğası nedeniyle her zaman böyle olacak gibi görünüyor. …

1
R - serbestlik derecesinde PROC Mixed ve lme / lmer arasındaki farklar
Not: önceki sorumun yasal nedenlerle silinmesi gerektiğinden, bu soru bir gönderidir. Fonksiyonlu SAS PROC MIXED karşılaştırarak birlikte lmegelen nlmeR paketin, bazı çok kafa farklılıklar tökezledi. Daha spesifik olarak, farklı testlerdeki özgürlük dereceleri ve arasında farklılık gösterir PROC MIXEDve lmenedenini merak ettim. Aşağıdaki veri kümesinden başlayın (R kodu aşağıda verilmiştir): ind: …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
Birden fazla hedefi veya sınıfı öngörüyor musunuz?
Birden fazla olayı tahmin etmeye çalıştığım bir tahmin modeli oluşturduğumu varsayalım (örneğin, hem bir paranın rulosu hem de bir madalyonun atımı). Bildiğim çoğu algoritma tek bir hedefle çalışır, bu yüzden bu tür şeylere standart bir yaklaşım olup olmadığını merak ediyorum. İki olası seçenek görüyorum. Belki de en naif yaklaşım, onlara …

2
Anlamsal anlamı koruyan alan-agnostik özellik mühendisliği?
Özellik mühendisliği genellikle makine öğrenimi için önemli bir bileşendir ( 2010'da KDD Kupası'nı kazanmak için yoğun olarak kullanılmıştır ). Ancak, çoğu mühendislik tekniğinin de altta yatan özelliklerin sezgisel anlamlarını yok etmek veya belirli bir alan adına ve hatta belirli türdeki özelliklere çok özeldir. Birincisinin klasik bir örneği temel bileşen analizi …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.