İki güven aralığını / puan tahminini birleştirme


17

Birinin aynı popülasyondan iki bağımsız örneği olduğunu ve iki örnek üzerinde nokta tahmini ve güven aralıkları elde etmek için farklı yöntemler kullanıldığını varsayalım. Önemsiz durumlarda, mantıklı bir kişi sadece iki örneği bir araya getirecek ve analizi yapmak için bir yöntem kullanacaktır, ancak bir an için eksik veri gibi numunelerden birinin sınırlandırılması nedeniyle farklı bir yöntemin kullanılması gerektiğini varsayalım. Bu iki ayrı analiz, ilgilenilen nüfus özelliği için bağımsız, eşit derecede geçerli tahminler üretecektir. Sezgisel olarak, bu iki tahmini hem nokta tahmini hem de güven aralığı açısından doğru bir şekilde birleştirmenin bir yolu olması gerektiğini düşünüyorum, bu da daha iyi bir tahmin prosedürü ile sonuçlanır. Sorum şu: Bunu yapmanın en iyi yolu ne olmalı? Her numunedeki bilgilere / örnek büyüklüğüne göre bir çeşit ağırlıklı ortalama düşünebilirim, ama güven aralıkları ne olacak?

Yanıtlar:


9

Birleştirilmiş bir tahmini aşağıdaki gibi yapabilirsiniz. Daha sonra, birleştirilmiş bir güven aralığı oluşturmak için toplanan tahminleri kullanabilirsiniz. Özellikle:

x1¯N(μ,σ2n1)

x2¯N(μ,σ2n2)

İki durum için güven aralıklarını kullanarak, tahminler için standart hataları yeniden oluşturabilir ve yukarıdakileri aşağıdakilerle değiştirebilirsiniz:

x1¯N(μ,SE1)

x2¯N(μ,SE2)

Birleştirilmiş bir tahmin:

x¯=n1x1¯+n2x2¯n1+n2

Böylece,

x¯N(μ,n12SE1+n22SE2(n1+n2)2)=N(μ,σ2n1+n2)


1
β^±ZαSE. Unfortunately, sometimes asymmetric CI may be more sensible, for example the CI for a binomial proportion when it's close to 0. In that case pooling the SE like this may not help.
user1600

@user1600 Good point.

This answer could be applied to any two distributions, it is just that the product of normals is a normal, giving a nice solution. MCMC simulation could be used with pairs of distributions without a closed form solution, using a Bayesian approach with one sample being the prior and the other the likelihood.
David LeBauer

If going back to confidence intervals from the pooled SE, what would the degrees of freedom for the T distribution be? Would this change if combining more than 2 confidence intervals?
DocBuckets

3

Sounds a lot like meta-analysis to me. Your assumption that the samples are from the same population means you can use fixed-effect meta-analysis (rather than random-effects meta-analysis). The generic inverse-variance method takes a set of independent estimates and their variances as input, so doesn't require the full data and works even if different estimators have been used for different samples. The combined estimate is then a weighted average of the separate estimates, weighting each estimate by the inverse of its variance. The variance of the combined estimate is the inverse of the sum of the weights (the inverses of the variances).

You want to work on a scale where the sampling distribution of the estimate is approximately normal, or at least a scale on which the confidence intervals are approximately symmetric, so a log transformed scale is usual for ratio estimates (risk ratios, odds ratios, rate ratios...). In other cases a variance-stabilising transformation would be useful, e.g. a square-root transformation for Poisson data, an arcsin-square-root transformation for binomial data, etc.


1

This is not unlike a stratified sample. So, pooling the samples for a point estimate and standard error seems like a reasonable approach. The two samples would be weighted by sample proportion.


0

See paper: K.M. Scott, X. Lu, C.M. Cavanaugh, J.S. Liu, Optimal methods for estimating kinetic isotope effects from different forms of the Rayleigh distillation equation, Geochimica et Cosmochimica Acta, Volume 68, Issue 3, 1 February 2004, Pages 433-442, ISSN 0016-7037, http://dx.doi.org/10.1016/S0016-7037(03)00459-9. (http://www.sciencedirect.com/science/article/pii/S0016703703004599)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.