«mathematical-statistics» etiketlenmiş sorular

Resmi tanım ve genel sonuçlarla ilgili istatistik matematiksel teori.

1
TF-IDF logaritmasında logaritma kullanımını anlama
Ben okuyordum: https://en.wikipedia.org/wiki/Tf%E2%80%93idf#Definition Ama formülün neden böyle inşa edildiğini tam olarak anlayamıyorum. Ne Anlıyorum: iDF bir düzeyde belgelerin her birinde S teriminin ne sıklıkta göründüğünü ölçmeli ve terim daha sık göründükçe değeri düşmelidir. Bu açıdan iDF(S)=# of Documents# of Documents containing SiDF(S)=# of Documents# of Documents containing S iDF(S) = …

1
Bilgi geometrisinde açıklama
Bu soru, Amari'nin Eğimli Üstel Ailelerin-Eğriliklerin ve Bilgi Kaybının Diferansiyel Geometrisi makalesi ile ilgilidir . Metin aşağıdaki gibi gider. Let bir olması , bir koordinat sistemi ile olasılık dağılımları boyutlu manifoldu , olduğu varsayılır ...Sn= { pθ}Sn={pθ}S^n=\{p_{\theta}\}nnnθ = ( θ1, … , Θn)θ=(θ1,…,θn)\theta=(\theta_1,\dots,\theta_n)pθ( x ) > 0pθ(x)>0p_{\theta}(x)>0 Her nokta kabul …

2
Bir örnek t-testinde, varyans tahmin edicisinde örnek ortalaması
Boş hipotezin olduğu tek örnekli bir t testi olduğunu varsayalım . İstatistik daha sonra örnek standart sapma kullanılarak . Tahmininde , tek bir numune ortalamaları gözlemlerini karşılaştırır :μ=μ0μ=μ0\mu=\mu_0t=x¯¯¯−μ0s/n√t=x¯−μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssx¯¯¯x¯\overline{x} s=1n−1∑ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2}. However, if we assume a given μ0μ0\mu_0 to be true, one could also estimate the standard deviation s∗s∗s^* using μ0μ0\mu_0 …

2
Lojistik işlevle dönüştürülmüş bir Gauss rasgele değişkeninin beklenen değeri
Hem lojistik fonksiyon hem de standart sapma genellikle gösterilir . Standart sapma için ve kullanacağım .σσ\sigmaσ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x))sss Ben ortalama ve standart sapma biliyorum rastgele bir giriş ile bir lojistik nöron var . Umarım ortalamadaki fark bazı Gauss gürültüsü ile iyi bir şekilde tahmin edilebilir. Dolayısıyla, hafif bir gösterim kötüye …

1
Student-t hatalarıyla gerilemeler işe yaramaz mı?
Lütfen düzenlemeye bakın. Ağır kuyruklu verileriniz olduğunda, student-t hatalarıyla gerileme yapmak sezgisel bir şey gibi görünüyor. Bu olasılığı keşfederken, şu makaleyle karşılaştım: Breusch, TS, Robertson, JC ve Welsh, AH (01 Kasım 1997). İmparatorun yeni giysileri: çok değişkenli t regresyon modelinin eleştirisi. Statistica Neerlandica, 51, 3.) ( bağlantı , pdf ) …

2
Kullback-Leibler diverjansına karşı hipotez testi ve toplam varyasyon mesafesi
Araştırmamda şu genel sorunla karşılaştım: Aynı alan üzerinde iki PPP ve dağılımı ve QQQbu dağılımlardan çok sayıda (ancak sonlu) örnek var. Örnekler bu iki dağılımdan birinden bağımsız ve özdeş olarak dağıtılır (dağılımlar ilişkili olsa da: örneğin, QQQ , PPP ve diğer bazı dağılımların bir karışımı olabilir .) Boş hipotez, numunelerin …


3
bağımsız değişken olduğunda dağılımı
Rutin bir egzersiz olarak, ve bağımsız rasgele değişkenleri olduğu dağılımını bulmaya çalışıyorum .X2+Y2−−−−−−−√X2+Y2\sqrt{X^2+Y^2}XXXYYYU(0,1)U(0,1) U(0,1) nin eklem yoğunluğu(X,Y)(X,Y)(X,Y)fX,Y(x,y)=10&lt;x,y&lt;1fX,Y(x,y)=10&lt;x,y&lt;1f_{X,Y}(x,y)=\mathbf 1_{0\cos^{-1}\left(\frac{1}{z}\right)cosθcos⁡θ\cos\thetaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]zgünahθ&lt;1⟹θ&lt;sin−1(1z)zsin⁡θ&lt;1⟹θ&lt;sin−1⁡(1z)z\sin\theta<1\implies\theta<\sin^{-1}\left(\frac{1}{z}\right)sinθsin⁡θ\sin\thetaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right] Yani, için .1&lt;z&lt;2–√1&lt;z&lt;21< z<\sqrt 2cos−1(1z)&lt;θ&lt;sin−1(1z)cos−1⁡(1z)&lt;θ&lt;sin−1⁡(1z)\cos^{-1}\left(\frac{1}{z}\right)<\theta<\sin^{-1}\left(\frac{1}{z}\right) Dönüşümün jacobianının mutlak değeri|J|=z|J|=z|J|=z Böylece ortak yoğunluğu ile verilmektedir(Z,Θ)(Z,Θ)(Z,\Theta) fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2√),θ∈(cos−1(1/z),sin−1(1/z))}fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2),θ∈(cos−1⁡(1/z),sin−1⁡(1/z))}f_{Z,\Theta}(z,\theta)=z\mathbf 1_{\{z\in(0,1),\,\theta\in\left(0,\pi/2\right)\}\bigcup\{z\in(1,\sqrt2),\,\theta\in\left(\cos^{-1}\left(1/z\right),\sin^{-1}\left(1/z\right)\right)\}} Entegre , biz pdf elde gibiθθ\thetaZZZ fZ(z)=πz210&lt;z&lt;1+(πz2−2zcos−1(1z))11&lt;z&lt;2√fZ(z)=πz210&lt;z&lt;1+(πz2−2zcos−1⁡(1z))11&lt;z&lt;2f_Z(z)=\frac{\pi z}{2}\mathbf 1_{0\sqrt 2 \end{cases} doğru ifadeye benziyor. Farklılaşan durumda …


1
Bir grafikte takılı grafik ve gerçek gama dağılımı grafiği nasıl çizilir?
Gerekli paketi yükleyin. library(ggplot2) library(MASS) Gama dağılımına uygun 10.000 sayı oluşturun. x &lt;- round(rgamma(100000,shape = 2,rate = 0.2),1) x &lt;- x[which(x&gt;0)] Olasılık yoğunluğu fonksiyonunu çizin, x'in hangi dağılımı taktığını bilmiyoruz. t1 &lt;- as.data.frame(table(x)) names(t1) &lt;- c("x","y") t1 &lt;- transform(t1,x=as.numeric(as.character(x))) t1$y &lt;- t1$y/sum(t1[,2]) ggplot() + geom_point(data = t1,aes(x = x,y = …

4
R'de Kesikli Zaman Olay Geçmişi (Hayatta Kalma) Modeli
R'de ayrık zamanlı bir model yerleştirmeye çalışıyorum, ancak nasıl yapılacağından emin değilim. Bağımlı değişkeni farklı satırlarda, her bir zaman gözlemi için bir tane düzenleyebileceğinizi ve glmbir logit veya cloglog bağlantısıyla işlevi kullanabileceğinizi okudum. Bu anlamda, üç sütun vardır: ID, Event(her zaman atıl 1 ya da 0) ve Time Elapsedek olarak, …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
Örnek otocovaryans fonksiyonu hakkında soru
Bir zaman serisi analiz kitabı okuyorum ve örnek otokovaryans formülü kitapta şu şekilde tanımlanıyor: γˆ(h)=n−1∑t=1n−h(xt+h−x¯)(xt−x¯)γ^(h)=n−1∑t=1n−h(xt+h−x¯)(xt−x¯)\widehat{\gamma}(h) = n^{-1}\displaystyle\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x}) ile γˆ(−h)=γˆ(h)γ^(−h)=γ^(h)\widehat{\gamma}(-h) = \widehat{\gamma}(h)\; için h=0,1,...,n−1h=0,1,...,n−1\;h = 0,1, ..., n-1. x¯x¯\bar{x} ortalama. Birisi sezgisel olarak neden toplamı bölündüğümüzü açıklayabilir mi? nnn ve tarafından değil n−hn−hn-h? Kitap, bunun yukarıdaki formülün negatif olmayan kesin bir …

1
R doğrusal regresyon kategorik değişkeni “gizli” değer
Bu sadece birkaç kez karşılaştığım bir örnektir, bu yüzden örnek verilerim yok. R'de doğrusal regresyon modeli çalıştırmak: a.lm = lm(Y ~ x1 + x2) x1sürekli bir değişkendir. x2kategoriktir ve üç değeri vardır, örneğin "Düşük", "Orta" ve "Yüksek". Bununla birlikte, R tarafından verilen çıktı aşağıdaki gibi olacaktır: summary(a.lm) Estimate Std. Error …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 



Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.