Ortalamaların güven aralıkları nasıl hesaplanır?


19

Bir deneyi üç kez tekrarladığınızı düşünün. Her deneyde, üçlü ölçümler toplarsınız. Üç kopya, üç deneysel araç arasındaki farklara kıyasla birbirine oldukça yakın olma eğilimindedir. Büyük ortalamanın hesaplanması oldukça kolaydır. Peki, büyük anlam için bir güven aralığını nasıl hesaplayabiliriz?

Örnek veri:

Deney 1: 34, 41, 39

Deney 2: 45, 51, 52

Deney 3: 29, 31, 35

Bir deney içindeki yinelenen değerlerin ve her deneyin ortalama değerlerinin bir Gauss dağılımını takip ettiğini varsayın. Bir deneydeki varyasyonun SD'si, deneysel araçlar arasındaki SD'den daha küçüktür. Ayrıca, her deneyde üç değerin sıralanmadığını varsayalım. Her satırdaki üç değerin soldan sağa sırası tamamen keyfidir.

Basit yaklaşım önce her deneyin ortalamasını hesaplamaktır: 38.0, 49.3 ve 31.7 ve sonra bu üç değerin ortalamasını ve% 95 güven aralığını hesaplamak. Bu yöntemi kullanarak, genel ortalama 39.7'dir ve% 95 güven aralığı 17.4 ila 61.9 arasındadır.

Bu yaklaşımla ilgili sorun, üçlüler arasındaki değişimi tamamen göz ardı etmesidir. Bu varyasyonu hesaba katmanın iyi bir yolu olup olmadığını merak ediyorum.


1
Bir cevap değil, sadece sezgisel bir gözlem. Toplanan veri ortalaması (dokuz obs'in tümü) için CI , sadece ortalamalara dayanan CI ( 39.7 ± 12.83 ) 'dir . Değil emin CI ne yaptığını (yazım hatası? 17 değil 27 ve 51 değil 61?), Ben olsun 2.98 std üç araçlarının err ve için 4,30 olarak 0.975 2 df T dist bir dağılım. Aradığınız CI'nin bu ikisinin arasında bir yerde olacağını düşünürdüm - kısmi havuzlama gibi. Varyans formülü V ( Y ) = E [ V ( Y(39.7±2.13)(39.7±12.83)2.984.300.975 , her CI formülün yarısını kullanırV(Y)=E[V(Y|Yg)]+V[E(Y|Yg)]
olasılık

2
@ olasılık: Üç deney aracının SEM'i 5.168'dir (yazdığınız gibi 2.98 değil) ve orijinal gönderide verdiğim güven aralığı (17.4 ila 61.9) doğrudur. SEM, n'den (3'ün kare kökü) bölünerek SD'den (8.95) hesaplanır. Bunun yerine n'ye (3) bölündünüz.
Harvey Motulsky

benim hatam, aynı zamanda tarafından 6.40 havuzda aralığını değiştirmelidir (orada aynı hata)2.136.40
probabilityislogic

Aşağıdaki bağlantı buna cevap veriyor mu? talkstats.com/showthread.php/11554-mean-of-means

@TST, Toplanmış varyansta Wikipedia'ya bir bağlantıdan başka bir şey yok gibi görünüyor . Ayrıntılı düşünmek ister misiniz?
chl

Yanıtlar:


6

Dengeli rasgele tek yönlü ANOVA modelinde grandmean için doğal bir tam güven aralığı vardır Gerçekten de, bu kontrol etmek kolaydır, gözlenen aracının dağıtım ˉ y ı olan ˉ y ı ~ IID N ( ^ ı , τ 2 ) ile τ 2 = σ 2 b + σ 2 ağırlık

(yijμi)iidN(μi,σw2),j=1,,J,μiiidN(μ,σb2),i=1,,I.
y¯iy¯iiidN(μ,τ2) ve karelerin toplamı arasındaSSbdağılımınınSSbJτ2χ 2 I - 1 olduğu ve gözlemlenen toplam ortalama ˉ yN(μ,τ2'denbağımsızolduğu iyi bilinmektedir.τ2=σb2+σw2JSSb
SSbJτ2χI12
. Böylece ˉ y -μ
y¯N(μ,τ2I)
,I-1serbestlik derecesinesahip bir Studenttdağılımına sahiptir, buradanμhakkında kesin bir güven aralığı elde etmek kolaydır.
y¯μ1ISSbJ(I1)
tI1μ

Bu güven aralığının Gauss ortalamaları için klasik aralıktan başka bir şey olmadığını ve gözlemlerin yalnızca grup olarak anlamına geldiğini unutmayıny¯i . Böylece bahsettiğiniz basit yaklaşım:

Basit yaklaşım önce her deneyin ortalamasını hesaplamaktır: 38.0, 49.3 ve 31.7 ve sonra bu üç değerin ortalamasını ve% 95 güven aralığını hesaplamak. Bu yöntemi kullanarak, genel ortalama 39.7'dir ve% 95 güven aralığı 17.4 ila 61.9 arasındadır.

doğrudur. Ve yok sayılan varyasyon hakkındaki sezginiz:

Bu yaklaşımla ilgili sorun, üçlüler arasındaki değişimi tamamen göz ardı etmesidir. Bu varyasyonu hesaba katmanın iyi bir yolu olup olmadığını merak ediyorum.

Hata. Ayrıca /stats//a/72578/8402 adresinde bu kadar basitleştirmenin doğruluğundan bahsediyorum.

Güncelleme 12/04/2014

Bazı ayrıntılar artık blogumda yazılıyor: Güven aralıkları almak için bir modelin azaltılması .


Bu çözümü python'da uygulamak için herhangi bir yardım var mı? stackoverflow.com/questions/45682437/…
blehman

7

Bu, doğrusal karma etkiler modelinde bir tahmin meselesidir. Sorun, büyük ortalamanın varyansının, ayrı olarak tahmin edilmesi gereken (verilerin ANOVA'sı aracılığıyla) iki varyans bileşeninin ağırlıklı toplamı olmasıdır . Tahminlerin farklı serbestlik dereceleri vardır. Bu nedenle, her zamanki küçük örnek (Student t) formüllerini kullanarak ortalama için bir güven aralığı oluşturmaya çalışılabilse de, ortalamadan sapma olasılığı düşüktür, çünkü ortalamadan sapmalar bir Student t dağılımını tam olarak takip etmeyecektir.

Linear Karışık Efektler Modeli ile Tahmin , Eva Jarosova'nın yakın tarihli bir (2010) makalesi bu konuyu tartışıyor. (2015 itibariyle artık Web'de mevcut görünmüyor.) "Küçük" bir veri kümesi bağlamında (buna rağmen, bundan üç kat daha büyük), yaklaşık iki CI hesaplamasını (kuyu) değerlendirmek için simülasyon kullanıyor. bilinen Satterthwaite yaklaşımı ve "Kenward-Roger yöntemi"). Sonuçları arasında

Simülasyon çalışması, kovaryans parametrelerinin tahmin kalitesinin ve sonuç olarak küçük numunelerde güven aralıklarının ayarlanmasının oldukça zayıf olabileceğini ortaya koydu. Dengeli veriler için bile üç tip aralığın [konvansiyonel, Satterthwaite, KR] önemli ölçüde farklı olabileceği açıktır. Geleneksel ve ayarlanan aralıklar arasında çarpıcı bir fark gözlendiğinde, standart kovaryans parametre tahmin hataları kontrol edilmelidir. Öte yandan, [üç] aralık türü arasındaki farklar küçük olduğunda, ayarlama gereksiz gibi görünmektedir.

Kısacası, iyi bir yaklaşım

  1. Varyans bileşenlerinin tahminlerini kullanarak ve bir t-dağılımı geçerli gibi davranarak geleneksel bir CI hesaplayın.

  2. Ayrıca ayarlanan CI'lerden en az birini hesaplayın.

  3. Hesaplamalar "yakın" ise, geleneksel CI'yi kabul edin. Aksi takdirde, güvenilir bir CI üretmek için yeterli veri olmadığını rapor edin.


Varyans bileşenlerinin kullanılması, orijinal gönderide hesapladığım aynı güven aralığına yol açar. ANOVA tablosu, 480.7 sütunları arasında 2 df ile bir SS'ye sahiptir, yani MS 240.3'tür. SD, sqrt (MSbetween / n) = sqrt (240.3 / 3) = 8.95'tir, bu da başlangıçta aynı CI I'e yol açar (17.4 ila 61.9). Alıntı yaptığınız Jarasova belgesini takip etmeyi çok zor buldum ve bunun burada alakalı olduğundan tam olarak emin değilim (tekrarlanan ölçüm tasarımlarıyla ilgili gibi görünüyor). ???
Harvey Motulsky

@Harvey Açıklamanız bana tekrarlanan önlemler gibi geliyor! Jarasova gazetesinin yerinde olduğuna inanıyorum.
whuber

1
Üçlülerin sadece üç farklı test küveti (veya kuyusu) olduğu laboratuvarlarda ortak durumu düşünüyorum. Tabloda sunulan üçün sırası keyfidir. Birinci deneyde 2 numaralı kopya ile ikinci veya üçüncü deneylerde 2 numaralı kopya arasında hiçbir bağlantı veya korelasyon yoktur. Her deneyin sadece üç ölçümü vardır. Yani gerçekten tekrarlanan önlemler değil. Sağ?
Harvey Motulsky

whuber, burada kesin bir öğrenci dağılımı var. Cevabımı gör.
Stéphane Laurent

@whuber, Eva Jarasova'nın makalesi için sağladığınız bağlantı öldü ve bir Google araması hiçbir şey getirmedi. Referansı düzeltebilir misiniz?
Placidia

0

Her iki sorununuzu da çözen bir güven aralığınız olamaz. Bir tane seçmelisin. Deneme içindeki değerleri ne kadar doğru bir şekilde tahmin edebileceğinizi veya bunu arasında yapabileceğiniz ve deneyler arasında olacağı hakkında bir şey söylemenizi sağlayan deney varyansı içinde ortalama bir kare hata teriminden birini türetebilirsiniz. Eğer eskisini yapsaydım, büyük ortalamadan ziyade 0 civarında çizmek isterdim çünkü size gerçek ortalama değer hakkında, sadece bir etki hakkında bir şey söylemez (bu durumda 0). Veya her ikisini de çizebilir ve ne yaptığını açıklayabilirsiniz.

Aralarında bir tutam var. İçinde bir MSE ile çalışmak için bir ANOVA hata terimini hesaplamak gibi ve oradan CI için SE sadece sqrt (MSE / n) (bu durumda n = 3).


Aslında her ortalama ve büyük ortalama için güvenilir bir aralığınız olabilir. Sadece Bayes çok düzeyli bir model kullanın. Bazen bu tür bir tahmine kısmi havuzlama denir. Sorun küçük bir örnek, sanırım.
Manoel Galdino

Her ortalama ve büyük ortalama için bir güven aralığınız olabilir ... ama bunlar farklı şeyler ... güvenilir aralıklar gibi. Sorunu, iç çalışma varyasyonu ve aralarındaki toplam olarak CI'lerle ilgili olarak toplam olarak yorumladım. Her şey sizi farklı CI'nin farklı şeyleri anlamına getiriyor. (Ben de n kelimesini tam anlamıyla almadım)
John

1
Buna ek olarak, yapamam demek istediğim gerçekten “yapamaz” değil. Her nasılsa, her şey için bir güven aralığını hesaplayan tek bir denklem bulabilirsin. Bu mantıklı bir şey demek değildir. Bunu demek istemedim.
John

Yorumumu yazdıktan birkaç dakika sonra n kelimesini tam anlamıyla almamamız gerektiğini fark ettim. Ama düzenlemek için geç kalmıştı =).
Manoel Galdino

0

Bence büyük ortalama CI orijinal veriler için bile çok geniş [17,62].

Bu deneyler kimyada ÇOK yaygındır. Örneğin, referans materyallerinin belgelendirilmesinde, bütün lotlardan bazı şişeleri rastgele bir şekilde almanız ve her şişeler üzerinde tekrar analizi yapmanız gerekir. Referans değeri ve belirsizliğini nasıl hesaplıyorsunuz? Bunu yapmanın çok yolu var, ama en sofistike (ve doğru, sanırım) meta-analiz veya ML (Dersimonian-Laird, Vangel-Rukhin, vb.)

Bootstrap tahminleri ne olacak?


1
Simülasyon (normal olarak dağıtılmış ana etkileri ve hataları olan 10.000 çalışma) [21, 58] ortalama için simetrik iki taraflı% 95 CI olduğunu gösterir.
whuber

whuber: Bu simülasyonları nasıl yaptığını bilmek isterdim. Orijinal verilerden önyükleme mi yapıyorsunuz? Yoksa gerçek simülasyonlar mı? İkincisi, veri simüle etmek için ortalama ve SD'nin hangi değerini kullandınız?
Harvey Motulsky
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.