«fitting» etiketlenmiş sorular

Bazı istatistiksel modellerin belirli bir veri kümesine uyarlanması işlemi. Çoğunlukla bir bilgisayarda yapılır ve optimizasyon veya sayısal entegrasyon veya simülasyon gibi çeşitli sayısal yöntemler kullanılır.

3
R: Veri setinde NaN bulunmamasına rağmen “yabancı işlev çağrısı” na NaN / Inf atma Rastgele Orman [kapalı]
Bir veri kümesi üzerinde çapraz doğrulanmış rasgele bir orman çalıştırmak için şapka kullanıyorum. Y değişkeni bir faktördür. Veri setimde hiç NaN, Inf veya NA yok. Ancak rastgele orman çalıştırırken, alıyorum Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use …

6
Verilere sinüzoidal bir terim takın
Okuduğum rağmen bu yazı, hala nasıl kendi veri ve birisi bana yardımcı olabilir umuduyla bu uygulamak için hiçbir fikrim yok. Aşağıdaki verilere sahibim: y <- c(11.622967, 12.006081, 11.760928, 12.246830, 12.052126, 12.346154, 12.039262, 12.362163, 12.009269, 11.260743, 10.950483, 10.522091, 9.346292, 7.014578, 6.981853, 7.197708, 7.035624, 6.785289, 7.134426, 8.338514, 8.723832, 10.276473, 10.602792, 11.031908, 11.364901, …
26 r  regression  fitting 

1
Sayım verilerinde aykırı değerlerin algılanması
Birçok farklı sayım verisi seti için aykırı tespiti içeren, basitçe ileri düz bir problem olduğunu düşündüğüm bir şeye sahibim. Spesifik olarak, bir dizi sayım verisindeki bir veya daha fazla değerin, dağıtımdaki geri sayımlara göre beklenenden yüksek veya düşük olup olmadığını belirlemek istiyorum. Şaşırtma faktörü, 3.500 dağıtım için bunu yapmam gerektiği …

1
Analitik Jakobyan mevcut olduğunda, daha iyi tarafından Hessian yaklaştığı olan
Diyelim ki toplam kare artıklarını en aza indirdiğim bazı model parametrelerini hesaplıyorum ve hatalarımın Gaussian olduğunu varsayıyorum. Modelim analitik türevler ürettiğinden, optimize edicinin sonlu farklar kullanmasına gerek yoktur. Uyum tamamlandığında, takılan parametrelerin standart hatalarını hesaplamak istiyorum. Genel olarak, bu durumda, hata fonksiyonunun Hessianı kovaryans matrisi ile ilişkili olarak alınır: σ2H−1=Cσ2H−1=C …

1
Uydurma olasılık dağılımlarındaki MLE'ye karşı en küçük kareler
Okuduğum birkaç makaleye, kitaba ve makaleye dayanarak edindiğim izlenim, bir olasılık kümesi dağılımını bir veri kümesine yerleştirmenin önerilen yolunun, maksimum olasılık tahmini (MLE) kullanmak olmasıdır. Bununla birlikte, bir fizikçi olarak, daha sezgisel bir yol, modelin pdf'sini en az kareler kullanarak verilerin ampirik pdf'sine yerleştirmektir. O zaman neden MLE, olasılık dağılım …

2
Regresyon analizi ve eğri uydurma arasındaki fark
Herkes bana regresyon analizi ve eğri uydurma (doğrusal ve doğrusal olmayan) arasındaki gerçek farkları mümkünse bir örnekle açıklayabilir mi? Hem iki değişken (bağımsız veya bağımlı) arasında bir ilişki bulmaya çalışıyor, hem de önerilen modellerle ilişkili parametreyi (veya katsayıyı) belirlemeye çalışıyor. Örneğin, aşağıdaki gibi bir veri kümem varsa: Y = [1.000 …

3
R'de t-dağılımının takılması: ölçekleme parametresi
Bir t dağılımının parametrelerine nasıl uyurum, yani normal dağılımın 'ortalama' ve 'standart sapmasına' karşılık gelen parametreler. Bir t-dağılımı için 'ortalama' ve 'ölçeklendirme / serbestlik derecesi' olarak adlandırıldığını varsayıyorum? Aşağıdaki kod genellikle 'optimizasyon başarısız' hatalarıyla sonuçlanır. library(MASS) fitdistr(x, "t") Önce x 'i ölçeklendirmem veya olasılıklara dönüştürmem gerekiyor mu? Bunu en iyi …

4
Degrade artırıcı makine doğruluğu, yineleme sayısı arttıkça azalır
Gradyan arttırıcı makine algoritmasını caretR'deki paket üzerinden deniyorum. Küçük bir kolej veri kümesi kullanarak, aşağıdaki kodu koştu: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

5
Doğrusal regresyon neden hipotez ile giriş veri noktası arasındaki dikey mesafeye dayalı bir maliyet fonksiyonu kullanıyor?
Diyelim ki A, B, C, D, E giriş (tahminci) ve çıkış (yanıt) veri noktalarına sahibiz ve noktalardan bir çizgi sığdırmak istiyoruz. Bu, sorunu göstermek için basit bir sorundur, ancak daha yüksek boyutlara da genişletilebilir. Sorun bildirimi Mevcut en iyi uyum veya hipotez yukarıdaki siyah çizgi ile temsil edilir . Mavi …

3
Bir veri serisinin segmentlerini farklı eğrilere uyacak şekilde programlı olarak nasıl tespit edebilirim?
Belirli bir veri kümesinin bölümlerini en uygun farklı eğrilere ayırmak için belgelenmiş algoritmalar var mı? Örneğin, bu veri grafiğine bakan çoğu insan bunu kolayca 3 parçaya böler: sinüzoidal segment, doğrusal segment ve ters üstel segment. Aslında, bu özel bir sinüs dalgası, bir çizgi ve basit bir üstel formülü ile yaptım. …



3
Değerleri ve 1. / 2. türevleri içeren verilere bir eğri çizgiyi nasıl sığdırabilirim?
Diyelim ki, konum, hız ve ivme için bazı ölçümler içeren bir veri kümem var. Hepsi aynı "koşu" dan geliyor. Doğrusal bir sistem kurabilirim ve tüm bu ölçümlere bir polinom sığdırabilirim. Ama aynısını spline ile yapabilir miyim? Bunu yapmanın 'R' yolu nedir? İşte sığdırmak istediğim bazı simüle veriler: f <- function(x) …

1
Aritmetik ortalama neden log-normal dağılımdaki dağılım ortalamasından daha küçüktür?
Yani, log-normal dağıtılmış rasgele değişkenler üreten rastgele bir süreç var . Karşılık gelen olasılık yoğunluk fonksiyonu:XXX O orijinal dağılımın birkaç anının dağılımını tahmin etmek istedim , diyelim ki 1. an: aritmetik ortalama. Bunu yapmak için 10000 aritmetik ortalama 10000 tahminini yapabilmem için 10000 rasgele değişken 10000 kez çizdim. Bu anlamı …

2
ARIMA vs ARMA farkli serilerde
R (2.15.2) 'de bir zaman serisine bir kez ARIMA (3,1,3) ve bir zamanlar farklı zaman aralıklarına bir ARMA (3,3) taktım. Takılan parametreler, ARIMA'daki takma yöntemine atfettiğim farklılıklar gösteriyor. Ayrıca, ARMA (3,3) ile aynı verilere bir ARIMA (3,0,3) takmak, kullandığım takma yöntemi ne olursa olsun aynı parametrelerle sonuçlanmaz. Farkın nereden geldiğini …
13 r  time-series  arima  fitting  arma 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.