«distributions» etiketlenmiş sorular

Dağıtım, olasılıkların veya frekansların matematiksel bir tanımıdır.


1
N normal iid ürününün yaklaşık dağılımı? Özel durum μ≈0
Verilen iid ve , arayan:N≥30N≥30N\geq30Xn≈N(μX,σ2X)Xn≈N(μX,σX2)X_n\approx\mathcal{N}(\mu_X,\sigma_X^2)μX≈0μX≈0\mu_X \approx 0 doğru kapalı form dağıtım yaklaşımı YN=∏1NXnYN=∏1NXnY_N=\prod\limits_{1}^{N}{X_n} aynı ürünün asimtotik ( üstel ?) yaklaşımı Bu daha genel bir sorunun özel durumudur .μX≈0μX≈0\mu_X \approx 0

2
Nasıl bulmak için olduğunda bir olasılık yoğunluk fonksiyonu olduğunu?
Bunu Nasıl Çözebilirim? Ara denklemlere ihtiyacım var. Belki de cevap .−tf(x)−tf(x)-tf(x) ddt[∫∞txf(x)dx]ddt[∫t∞xf(x)dx] \frac{d}{dt} \left [\int_t^\infty xf(x)\,dx \right ] f(x)f(x)f(x) olasılık yoğunluk fonksiyonudur. Yani, ve \ lim \ sınırlar_ {x \ ila \ infty} F (x) = 1limx→∞f(x)=0limx→∞f(x)=0\lim\limits_{x \to \infty} f(x) = 0limx→∞F(x)=1limx→∞F(x)=1\lim\limits_{x \to \infty} F(x) = 1 kaynak: http://www.actuaries.jp/lib/collection/books/H22/H22A.pdf s.40 …

1
Dunn testinin sonuçları nasıl okunur?
Dunn testinin sonuçlarını nasıl okurum ? Özellikle, aşağıdaki tablodaki değerler bana ne anlatıyor? 4 grupta parametrik olmayan verilerim var ve ilk önce grupların dağılımlarının birbirinden ve toplam veri kümesinden farklı olduğunu doğrulamak için bir Kruskal-Wallis testi yaptım. Sonra Dunn'ın testini kullanarak hangi grupların birbirinden farklı, hangilerinin farklı olmadığını gördüm. library(dunn.test) …

3
Bilinmeyen dağılım verileri nasıl normalleştirilir
Belirli bir türde tekrarlanan ölçüm verilerinin en uygun karakteristik dağılımını bulmaya çalışıyorum. Temel olarak, jeoloji dalımda, bir olayın ne kadar zaman önce gerçekleştiğini (kaya eşik sıcaklığının altında soğutulmuş) bulmak için sıklıkla numunelerden (kaya parçaları) minerallerin radyometrik tarihlendirmesini kullanırız. Tipik olarak, her bir numuneden birkaç (3-10) ölçüm yapılacaktır. Daha sonra ortalama …

5
Çok sayıda veri noktasındaki değerlerin gösterimi nasıl yapılır?
Çok büyük bir veri setim var ve yaklaşık% 5 rasgele değerler eksik. Bu değişkenler birbiriyle ilişkilidir. Aşağıdaki örnek R veri kümesi sadece yapay korelasyonlu verilere sahip bir oyuncak örneğidir. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
Teori, uyum veya başka bir şeye göre dağılımları seçmek daha mı iyi?
Bu felsefi bir soruyla sınırlıdır, ancak daha fazla deneyime sahip olanların dağıtım seçimi hakkında nasıl düşündükleri ile ilgileniyorum. Bazı durumlarda, teorinin en iyi şekilde çalışabileceği açıktır (farelerin kuyruk uzunlukları muhtemelen normal olarak dağılmıştır). Birçok durumda, muhtemelen bir veri kümesini tanımlamak için hiçbir teori yoktur, bu yüzden başlangıçta açıklamak için geliştirilen …



2
Binned verilerin üçüncü çeyreği nasıl tahmin edilir?
Üçüncü çeyreği, nüfusun dörtte birinden fazlasını içeren açık bir aralığa aitse belirlemek için herhangi bir teknik hile var mı (bu nedenle aralığı kapatamıyorum ve standart formülü kullanamıyorum)? Düzenle Bir şeyi yanlış anladığımda az çok tam bağlam sunacağım. İki sütun ve 6 satırlı bir tabloda düzenlenmiş verilerim var. Her sütun ile …

2
Veri kümesi verildiğinde olasılık dağılımını otomatik olarak belirleme
Bir veri kümesi verildi: x <- c(4.9958942,5.9730174,9.8642732,11.5609671,10.1178216,6.6279774,9.2441754,9.9419299,13.4710469,6.0601435,8.2095239,7.9456672,12.7039825,7.4197810,9.5928275,8.2267352,2.8314614,11.5653497,6.0828073,11.3926117,10.5403929,14.9751607,11.7647580,8.2867261,10.0291522,7.7132033,6.3337642,14.6066222,11.3436587,11.2717791,10.8818323,8.0320657,6.7354041,9.1871676,13.4381778,7.4353197,8.9210043,10.2010750,11.9442048,11.0081195,4.3369520,13.2562675,15.9945674,8.7528248,14.4948086,14.3577443,6.7438382,9.1434984,15.4599419,13.1424011,7.0481925,7.4823108,10.5743730,6.4166006,11.8225244,8.9388744,10.3698150,10.3965596,13.5226492,16.0069239,6.1139247,11.0838351,9.1659242,7.9896031,10.7282936,14.2666492,13.6478802,10.6248561,15.3834373,11.5096033,14.5806570,10.7648690,5.3407430,7.7535042,7.1942866,9.8867927,12.7413156,10.8127809,8.1726772,8.3965665) .. Parametrelerin bir tahminiyle en uygun olasılık dağılımını (gama, beta, normal, üstel, poisson, ki-kare, vb.) Belirlemek istiyorum. R kullanarak bir çözümün sağlandığı aşağıdaki bağlantıdaki sorunun zaten farkındayım: /programming/2661402/given-a-set-of-random-numbers-drawn-from-a- sürekli-tek-değişken-dağılım-f en iyi önerilen çözüm şudur: > library(MASS) > fitdistr(x, 't')$loglik #$ > fitdistr(x, 'normal')$loglik …


1
Verilerden dağılımı tahmin etme
RTarafından oluşturulan veri bir örnek var rnorm(50,0,1), bu yüzden veri açıkça normal bir dağılım alır. Ancak Rverilerle ilgili bu dağıtım bilgisini "bilmez". RÖrneklemimin ne tür bir dağıtımdan geldiğini tahmin edebilecek bir yöntem var mı ? Değilse, shapiro.testişlevi kullanacağım ve bu şekilde ilerleyeceğim.
12 r  distributions 


3
Parametreleştirilebilir kovaryans matrisi ile pozitif k-boyutlu çeyrek üzerinde dağılımlar nelerdir?
Aşağıdaki zzk 'ın sorusu negatif simülasyonları ile yaptığı problem üzerinde, ben, pozitif k boyutlu kadran üzerindeki dağılımları parametrized aileleri ne merak ediyorum kovaryans matrisi kendisi için seti olabilir. ΣRk+R+k\mathbb{R}_+^kΣΣ\Sigma Zzk ile tartışıldığı gibi , üzerindeki bir dağılımdan başlayıp doğrusal dönüşümünü uygulamak işe yaramaz. x⟶ Σ 1 / 2 (X-μ)+μRk+R+k\mathbb{R}_+^kX⟶Σ1/2(X−μ)+μX⟶Σ1/2(X−μ)+μX \longrightarrow\Sigma^{1/2} …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.