Hangi ortamlarda örnek boyutu arttıkça güven aralıkları daha iyi olmazdı?


11

Bir blog gönderisinde ,

"Ben WG Cochrane ilk gözlem (kabaca 1970'lerde) bir gözlem ortamında güven aralıklarla, küçük örnek boyutları sıfır kapsama alanı sağlayan yeterince büyük örnekleri ile daha iyi kapsama neden olduğuna inanıyorum!"

Şimdi, CI genişliğinin artan örnek boyutu ile 0'a yaklaşması gerektiğini varsayıyorum, ancak kapsamın aynı anda kötüleşeceği fikri beni ikna etmiyor. Bu iddia doğru ve hangi şartlar altında? Yoksa yanlış mı okuyorum?

Ben 10000 ila 1000000 örnek boyutları (tek örnek t-testi,% 95 CI), her örnek boyutunda 1000 çalışır rastgele normal dağıtılmış veri kullanarak bir simülasyon çalıştırdım ve kapsama daha yüksek örnek boyutları için daha kötü olmadı (bunun yerine, beklenen neredeyse sabit ~% 5 hata oranını buldum).


2
Kayıt için, burada adı geçen ünlü istatistikçi William G. Cochran (Cochrane değil) idi.
Nick Cox

2
Cevaplardan birinde karışıklığa neden olduğu için, "CI genişliği 1'e yaklaşmalıdır" iddiasının ya anlamsız (1 ne? Ölçü birimleri nelerdir?) Ya da sadece yanlış olduğunu lütfen unutmayın.
whuber

Yanıtlar:


17

"Gözlemsel bir ortamda" niteliğine dikkat edin.

Teklifi aldığınız bağlamı (içinde bulunduğu yorumların alt dizisi) kontrol etmek, niyetin simülasyonlardan ziyade "gerçek dünyada" olduğu ve muhtemelen kontrollü bir deney içermediği anlaşılıyor. ve bu durumda, muhtemel niyet, aralıkların elde edildiği varsayımların aslında tam olarak gerçekleşmediğinin bir sonucudur. Önyargıları etkileyebilen - küçük numunelerdeki değişkenliğe kıyasla küçük etkisi olan - ancak standart hatalar arttıkça genellikle örnek boyutu arttıkça boyutu küçülmeyen çok sayıda şey vardır.

Hesaplamalarımız, aralıklar küçüldükçe ( ) önyargı içermediğinden, oldukça küçük görünüyor olsa bile, değişmeyen önyargı, aralıklarımızın gerçek değeri içermesi için daha az ve daha az olasılık bırakır.1/n

İşte örnekleme arttıkça CI kapsamı olasılığı daralması hakkında ne düşündüğünü göstermek için belki de önyargıyı abartan bir örnek:

Sapma mevcut olduğunda numune boyutu arttıkça CI kapsama olasılığı küçültme şeması

Tabii ki herhangi bir belirli örnekte, aralık rastgele olacaktır - daha geniş veya daha dar olacak ve şemaya göre sola veya sağa kaydırılacaktır, böylece herhangi bir örnek boyutunda 0 ile 1 arasında bir miktar kapsama olasılığı vardır, ancak herhangi bir yanlılık arttıkça sıfıra doğru küçülecektir . Simüle edilmiş veriler kullanarak her örnek boyutunda 100 güven aralığı olan bir örnek (şeffaflıkla çizildiğinden, daha fazla aralığın kapsadığı yerlerde renk daha sağlamdır):n

Her n'de 10 örnek CI ile yukarıdakine benzer çizim


0

Tatlı ironi. Bu paragraftan önce, aynı kişi "Bu kadar yaygın bir karışıklık olduğuna şaşmamalı" diyor. "Gözlemsel bir ortamda güven aralıkları": bu ne anlama geliyor?

Bana öyle geliyor ki bu bir kez daha tahmin ve hipotez testleri arasında bir karışıklık .

Şimdi, CI genişliğinin artan numune boyutu ile 1'e yaklaşması gerektiğini biliyorum.

Hayır, bağlama bağlıdır. Prensip olarak, genişlik yaklaşmalıdır . Kapsam, çok sayıda Monte Carlo simülasyonu için nominal değere yakın olmalıdır. Kapsam, CI'nın oluşturulduğu varsayımlardan bazıları kusurlu olmadığı sürece örnek boyutuna bağlı değildir (belki de OP'nin ima ettiği şey budur. "Tüm modeller yanlış", evet.).0

Referans, kişisel bir blogun gönderisindeki bir yorumdur . Bu tür referansların geçerliliği konusunda fazla endişelenmem. Öte yandan Larry Wasserman'ın sahibi olduğu blog çok iyi yazılmış olma eğilimindedir. Bu bana xkcd çizgi romanını hatırlattı:

http://xkcd.com/386/

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.