Her biri gözlemlenen ortalamayı ve ölçüsünün SD'sini, bilinen büyüklükteki . Aynı önlemin tasarladığım yeni bir çalışmada muhtemel dağılımı ve bu tahminde ne kadar belirsizlik olduğu konusunda mümkün olan en iyi tahminde bulunmak istiyorum. ) olduğunu varsaydığım için mutluyum .
İlk düşüncem meta-analizdi, ancak tipik olarak kullanılan modeller nokta tahminlerine ve karşılık gelen güven aralıklarına odaklanıyor. Bununla birlikte, tam dağılımı hakkında bir şeyler söylemek istiyorum, ki bu durumda da varyans hakkında bir tahminde bulunmak da dahil olmak üzere, .
Belirli bir dağılımın bütün parametre setini önceden edindiğim bilgiler ışığında tahmin etmede muhtemel Bayeisan yaklaşımlarını okudum. Bu genellikle bana daha anlamlı geliyor, ancak Bayesian analizinde sıfır deneyime sahibim. Bu aynı zamanda dişlerimi kesmek için basit, nispeten basit bir problem gibi görünüyor.
1) Problemim göz önüne alındığında, hangi yaklaşım en mantıklı ve neden? Meta-analiz mi, yoksa Bayesçi bir yaklaşım mı?
2) Bayesian yaklaşımının en iyisi olduğunu düşünüyorsanız, beni bunu uygulamanın bir yoluna işaret edebilir misiniz (tercihen R)?
DÜZENLEMELER:
Bunu 'basit' bir Bayesian tarzı olduğunu düşündüğüm şekilde çözmeye çalışıyorum.
Yukarıda da belirttiğim gibi, sadece önceden belirlenmiş bilgiler ışığında, yani , aynı zamanda varyansı ile de ilgilenmiyorum , yani
Yine, pratikte Bayeianism hakkında hiçbir şey bilmiyorum, ama bu bilinmeyen ortalama ve varyans ile normal dağılımın arka aracılığıyla bir kapalı form çözümü olduğunu bulmak için uzun sürmedi eşleşme normal ters-gama dağılımı ile,.
Sorun .
normal dağılımla tahmin edilir; Ters gama dağılımına sahip .
Kafamın etrafını dolaştırması biraz zaman aldı, ancak bu bağlantılardan ( 1 , 2 ) bunu nasıl yapabileceğimi düşünüyorum.
Her 33 çalışma / örnek için bir satırdan oluşan bir veri çerçevesi ve ortalama, varyans ve örneklem büyüklüğü için sütunlarla başladım. İlk çalışmadaki ortalama, varyans ve örneklem büyüklüğünü satır 1'de önceki bilgilerim olarak kullandım. Daha sonra bunu bir sonraki çalışmadaki bilgilerle güncelledim, ilgili parametreleri hesapladım ve ve dağılımını elde etmek için normal ters-gamadan örnek aldım . Bu, 33 çalışmanın tümü dahil edilinceye kadar tekrar edilir.
# Loop start values values
i <- 2
k <- 1
# Results go here
muL <- list() # mean of the estimated mean distribution
varL <- list() # variance of the estimated mean distribution
nL <- list() # sample size
eVarL <- list() # mean of the estimated variance distribution
distL <- list() # sampling 10k times from the mean and variance distributions
# Priors, taken from the study in row 1 of the data frame
muPrior <- bayesDf[1, 14] # Starting mean
nPrior <- bayesDf[1, 10] # Starting sample size
varPrior <- bayesDf[1, 16]^2 # Starting variance
for (i in 2:nrow(bayesDf)){
# "New" Data, Sufficient Statistics needed for parameter estimation
muSamp <- bayesDf[i, 14] # mean
nSamp <- bayesDf[i, 10] # sample size
sumSqSamp <- bayesDf[i, 16]^2*(nSamp-1) # sum of squares (variance * (n-1))
# Posteriors
nPost <- nPrior + nSamp
muPost <- (nPrior * muPrior + nSamp * muSamp) / (nPost)
sPost <- (nPrior * varPrior) +
sumSqSamp +
((nPrior * nSamp) / (nPost)) * ((muSamp - muPrior)^2)
varPost <- sPost/nPost
bPost <- (nPrior * varPrior) +
sumSqSamp +
(nPrior * nSamp / (nPost)) * ((muPrior - muSamp)^2)
# Update
muPrior <- muPost
nPrior <- nPost
varPrior <- varPost
# Store
muL[[i]] <- muPost
varL[[i]] <- varPost
nL[[i]] <- nPost
eVarL[[i]] <- (bPost/2) / ((nPost/2) - 1)
# Sample
muDistL <- list()
varDistL <- list()
for (j in 1:10000){
varDistL[[j]] <- 1/rgamma(1, nPost/2, bPost/2)
v <- 1/rgamma(1, nPost/2, bPost/2)
muDistL[[j]] <- rnorm(1, muPost, v/nPost)
}
# Store
varDist <- do.call(rbind, varDistL)
muDist <- do.call(rbind, muDistL)
dist <- as.data.frame(cbind(varDist, muDist))
distL[[k]] <- dist
# Advance
k <- k+1
i <- i+1
}
var <- do.call(rbind, varL)
mu <- do.call(rbind, muL)
n <- do.call(rbind, nL)
eVar <- do.call(rbind, eVarL)
normsDf <- as.data.frame(cbind(mu, var, eVar, n))
colnames(seDf) <- c("mu", "var", "evar", "n")
normsDf$order <- c(1:33)
ve her yeni örnek eklendikçe nasıl değiştiğini gösteren bir yol şeması .
Her bir güncellemede ortalama ve varyans için tahmin edilen dağılımlardan örneklemeye dayanarak önemsizlikler.
Ben sadece bunu başkası için faydalı olması durumunda eklemek istedim ve bu yüzden bilgili insanlar bana bunun mantıklı, kusurlu, vb. Olduğunu söyleyebilirler.