Normal dağılımların birleşiminden miktarlar


13

Farklı yaşlardaki çocuklar için antropometrik boyutların (omuz açıklığı gibi) dağılımı hakkında bilgi sahibim. Her yaş ve boyut için, standart sapma var. (Ayrıca sekiz adet kuantum var, ama onlardan istediğimi alabileceğimi sanmıyorum.)

Her boyut için, uzunluk dağılımının belirli miktarlarını tahmin etmek istiyorum. Boyutların her birinin normal olarak dağıtıldığını varsayarsam, bunu araçlarla ve standart sapmalarla yapabilirim. Dağıtımın belirli bir miktarıyla ilişkili değeri elde etmek için kullanabileceğim güzel bir formül var mı?

Tersi oldukça kolaydır: Belirli bir değer için, her normal dağılım (yaş) için değerin sağındaki alanı alın. Sonuçları toplayın ve dağılım sayısına bölün.

Güncelleme : İşte aynı soru grafik şeklinde. Renkli dağılımların her birinin normal olarak dağıtıldığını varsayın. Aynı soru grafik formda

Ayrıca, farklı uzunluklarda bir demet deneyebilir ve hassaslığım için istenen kantile yeterince yakın olana kadar bunları değiştirmeye devam edebilirim. Bundan daha iyi bir yol olup olmadığını merak ediyorum. Ve eğer bu doğru yaklaşımsa, bunun bir adı var mı?


3
Normal dağılımların bir karışımının miktarlarını hesaplamak için basit bir formül olup olmadığını mı soruyorsunuz ? Bu uygulamada, yaşa özgü parametrelere dayalı olarak yaşa bakmaksızın omuz açıklığının miktarlarını (örneğin) soruyorsunuz . Bu doğru bir yorum mu?
whuber

Yanıtlar:


16

Ne yazık ki, standart normal (diğerlerinin belirlenebileceği, normal bir konum ölçeği ailesi olduğu için) kantil işlevi kapalı bir formu (yani 'güzel formül') kabul etmez. Kapalı bir forma en yakın şey, standart normal kuantil fonksiyonun fonksiyonuw

d2wdp2=w(dwdp)2

w(1/2)=0w(1/2)=2π

qnorm(p, mean=mu, sd=sigma)

pN(μ,σ2)


Düzenleme: Sorunun değiştirilmiş bir anlayışla, veriler, normalin bir karışımından üretilir, böylece gözlenen verilerin yoğunluğu:

p(x)=iwipi(x)

iwi=1pi(x)μiσi

F(y)=yiwipi(x)dx=iwiypi(x)=iwiFi(y)

Fi(x)μiσiF1

F1wi,μi,σip

# evaluate the function at the point x, where the components 
# of the mixture have weights w, means stored in u, and std deviations
# stored in s - all must have the same length.
F = function(x,w,u,s) sum( w*pnorm(x,mean=u,sd=s) )

# provide an initial bracket for the quantile. default is c(-1000,1000). 
F_inv = function(p,w,u,s,br=c(-1000,1000))
{
   G = function(x) F(x,w,u,s) - p
   return( uniroot(G,br)$root ) 
}

#test 
# data is 50% N(0,1), 25% N(2,1), 20% N(5,1), 5% N(10,1)
X = c(rnorm(5000), rnorm(2500,mean=2,sd=1),rnorm(2000,mean=5,sd=1),rnorm(500,mean=10,sd=1))
quantile(X,.95)
    95% 
7.69205 
F_inv(.95,c(.5,.25,.2,.05),c(0,2,5,10),c(1,1,1,1))
[1] 7.745526

# data is 20% N(-5,1), 45% N(5,1), 30% N(10,1), 5% N(15,1)
X = c(rnorm(5000,mean=-5,sd=1), rnorm(2500,mean=5,sd=1),
      rnorm(2000,mean=10,sd=1), rnorm(500, mean=15,sd=1))
quantile(X,.95)
     95% 
12.69563 
F_inv(.95,c(.2,.45,.3,.05),c(-5,5,10,15),c(1,1,1,1))
[1] 12.81730

2
Sorunun son paragrafı, başka bir şeyin istendiğini ima ediyor. Açıklama istedim.
whuber

whuber'ın önsezi doğrudur. Soruyu daha az kafa karıştırıcı hale getirmek için bir resim ekledim.
Thomas Levine

1
Şimdi bu sorunla başa çıkmak için bir R paketi var, bkz. Stats.stackexchange.com/questions/390931/…
Christoph Hanck
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.