Bu ifadeler neden ortalama olarak% 95 CI'dan mantıksal olarak gelmiyor?


26

Wagenmakers'ın internet sitesinden indirdiğim Hoekstra ve arkadaşlarının 2014 tarihli "Güven aralıklarının sağlam şekilde yanlış yorumlanması" konulu makalesini okudum .

Sondan iki sayfada, aşağıdaki görüntü belirir.

bilgi yarışması

Yazarlara göre, False tüm bu ifadelere doğru cevaptır. İfadelerin neden yanlış olduğundan emin değilim ve bildiğim kadarıyla makalenin geri kalanı bunu açıklamaya çalışmıyor.

1-2 ve 4'ün doğru olmadıklarına inanıyorum çünkü gerçek ortalamanın bilinmeyen kesin bir değeri olduğunda gerçek ortalamanın olası değeri hakkında bir şeyler iddia ediyorlar. Bu ikna edici bir ayrım mı?

3 ile ilgili olarak, birinin null hipotezinin yanlış olma olasılığı ile ilgili iddialarda bulunmadığını, nedeninin neden olduğundan emin olamadığımı anlıyorum.

Benzer şekilde 6 doğru olamaz çünkü gerçek ortalamanın deneyden deneye değişmekte olduğu anlamına gelir.

Gerçekten anlamadığım tek şey 5'tir. Neden bu yanlış? Zamanın% 95'inin gerçek ortalamayı içeren CI'leri ürettiği bir süreç varsa, neden nüfus değerinin 0,1 ile 0,4 arasında olduğu konusunda% 95 güvene sahip olduğumu söylemem ki? Bu, aldığımız örnek hakkında gerçek ortalamayı içermeyen% 5'ten biri olabileceğimizi düşünmemize neden olacak özel bilgilerimiz olabileceğinden mi? Örneğin, 0.13 güven aralığına dahil edilmiştir ve bir nedenden ötürü 0.13 bazı özel araştırma bağlamında makul bir değer olarak kabul edilmez, çünkü bu değer önceki teoriyle çelişir.

Zaten bu bağlamda güven ne anlama geliyor?


Yanıtlar:


11

Sorunun (5) anlamı, "güven" in açıklanmayan bazı yorumlarına dayanır. Makaleyi dikkatlice araştırdım ve “güven” i veya bu bağlamda ne anlama gelebileceğini tanımlama girişimi bulamadım. Makalenin soruya (5) cevabını açıklaması

“... [CI] CI'nin sınırlarını belirtir, oysa ... CI sadece prosedürü değerlendirmek için kullanılabilir, belirli bir aralığı değil.”

Bu hem aldatıcı hem de yanıltıcıdır. Birincisi, prosedürün sonucunu değerlendiremezseniz, prosedür ilk etapta ne işe yarar? İkincisi, sorudaki ifade prosedürle ilgili değil , okuyucunun sonuçlarına olan güveniyle ilgili.

Yazarlar kendilerini savunurlar:

"Devam etmeden önce, bir CI'nin doğru tanımını hatırlamak önemlidir. Bir CI, bir parametrenin tahmini etrafında oluşturulan sayısal bir aralıktır. Böyle bir aralık, doğrudan parametrenin özelliğini göstermez; bunun yerine Sık kullanılan bir teknik için tipik olan prosedürün bir özelliği. "

Onların önyargıları son cümleyle ortaya çıkıyor: "sıkça teknik" (belki de üstü kapalı bir sneer ile yazılmış). Bu karakterizasyon doğru olmasına rağmen , kritik olarak eksik. Güven aralığının da deneysel yöntemlerin (örneklerin nasıl elde edildiğini ve ölçüldüğünü) ve daha da önemlisi doğanın kendisinin bir özelliği olduğunu fark etmekte başarısız olur. Birinin değeriyle ilgilenmesinin tek nedeni budur.

Geçenlerde Edward Batschelet'in Biyoloji Dairesel İstatistiklerini okumaktan zevk aldım (Academic Press, 1981). Batschelet, çalışan bilim adamına yönelik bir tarzda, açıkça ve konuya göre yazıyor. İşte güven aralıkları hakkında söylediği:

" Şans dalgalanmaları nedeniyle sapmaların göstergeler olmadan bir parametre tahmini biraz bilimsel bir değeri vardır. ...

“Tahmini olacak parametrenin sabit bir sayı olmasına rağmen, güven sınırları numune tarafından belirlenir. İstatistiklerdir ve bu nedenle şans dalgalanmalarına bağlıdır. Aynı popülasyondan alınan farklı örnekler farklı güven aralıklarına neden olur.”

[Vurgu orijinalde, s. 84-85'te.]

Vurgudaki farklılığa dikkat edin: söz konusu makale prosedüre odaklanırken , Batschelet numuneye ve özellikle de parametre hakkında ne gösterebileceğine ve bu bilgilerin "şans dalgalanmalarından" ne kadar etkilenebileceğine odaklanır . Bunu inanılmaz pratik, bilimsel bir yaklaşımla çok daha yapıcı, aydınlatıcı ve - nihayetinde - faydalı buluyorum.

Bu nedenle, makalenin önerdiğinden daha kesin bir güven aralığı karakterizasyonu şöyle devam etmelidir:

Bir CI, bir parametrenin tahmini etrafında oluşturulan sayısal bir aralıktır. CI inşaatının altında yatan varsayımlara katılan herkes, parametrenin aralık dahilinde olduğundan emin olduklarını söyleyerek haklı çıkarılır: bu "kendine güvenen" nin anlamıdır. Bu anlam genel olarak, geleneksel teknik olmayan güven anlamlarına uygundur, çünkü deneyin birçok kopyası altında (gerçekte gerçekleşip gerçekleşmediğine bakılmaksızın) CI'nin değişken olmasına rağmen, çoğu zaman parametresini içermesi beklenir.

Bu dolgunda, daha geleneksel ve daha yapıcı bir “güven” duygusu, (5) sorusunun cevabı doğrudur.


2
Batschelet'in yaklaşımının, boş okuyabilen CI'ler gibi düşünceli okuyucularda duraklama sağlayan belirli tür güven aralıklarını ekarte ettiği görülüyor. Böyle bir CI, "şans dalgalanmalarından kaynaklanan sapmaların göstergeleri" fikrini neredeyse hiç yakalayamaz. Bu, belki de standart güven aralığı tanımının, amaçlananı tam olarak yerine getirmediğini gösterir. Ne olursa olsun, söz konusu “güven” in ne anlama geldiğine dair net bir gösterge yokluğunda, yazarın bu soruya verdikleri cevaplara dayanarak elde ettiği sonuçları indirmemiz gerekir.
whuber

Sizin 5 rafine edilmiş güven aralığı tanımınız altında haklı olduğunuzu kabul etmiyorum. CI yeterli bir istatistiği temel almalıdır - başka bir durumda, "kötü" ve "iyi" bir alt sınıfına sahip olan, sahip olduğunuz örnekten tanıyabileceğiniz, bu sınıflardaki kapsamın çok düşük veya çok yüksek olduğu CI'ler oluşturabilirsiniz. En temel örnek, bir y_i 2 boyutlu bir iid örneğidir . Örnek ortalaması için yeterli değildir, bu nedenle CI kapsamınız, aldığınız belirli örneğe bağlı olarak değişir. μyicauchy(μ,1)μ
Olasılıksal

... devam ... bu yüzden uzun süreli ortalama kapsam sağlanmış olsa da, belirli bir numune sınıfındaki kapsam olmaz.
olasılıkalite

10

Soru 1-2, 4: sık analizde, gerçek ortalama rastgele bir değişken değildir, bu nedenle olasılıklar tanımlanmamıştır, oysa Bayesian analizinde olasılıklar öncekine bağlı olacaktır.

Soru 3: Örneğin, kesin olarak bildiğimiz bir durumu göz önünde bulundurun Bu sonuçların elde edilmesinin hala mümkün olabileceğini, ancak sıfır hipotezinin 'muhtemel' olmadığını doğrulaması gerektiğini söylemek makul değildir. Boş hipotez doğruysa gerçekleşmesi muhtemel olmayan veriler elde ettik, ancak bu boş hipotezin gerçek olamayacağı anlamına gelmez.

Soru 5: Bu "biraz güvende olabiliriz" tanımına bağlı olduğundan biraz sorgulanabilir. İfadeyi, p% güven aralıklarından çıkarılan şey anlamına gelmesi için tanımlarsak, ifade, tanım gereği doğrudur. Tipik Bayes yanlısı argümanı, insanların bu ifadeleri sezgisel olarak "olasılık% p" anlamına geldiğini, yani yanlış olacağını (yani 1-2.4 ile karşılaştırılan cevaplarla karşılaştırın) ifade etme eğiliminde olduklarını belirtir.

Soru 6: “Gerçek ortalamanın deneyden deneye değişmekte olduğu anlamına gelir” açıklamanız tam olarak doğru.

Makale yakın zamanda Andrew Gelman'ın blogunda tartışıldı ( http://andrewgelman.com/2014/03/15/problematic-interpretations-confidence-intervals/ ). Örneğin, 5. sorudaki ifadenin yorumlanmasına ilişkin konu yorumlarda tartışılmaktadır.


1
Öyleyse, kişi geri dönüp her "gerçek ortalama" örneğini "gerçek ortalama için en iyi tahminde" ile değiştirirse ifadeler doğru olur mu?
Superbest

@ En iyi No. Hayır. "Bu verilere göre en iyi tahminin yapılması" düşünülürse, bilinen bir sabittir (en iyisinin iyi tanımlanmış olması şartıyla). "Gelecekteki bir örneğin en iyi tahminini" göz önüne alırsak, bunun nasıl değiştiğini bilmiyoruz çünkü gerçek ortalamayı bilmiyoruz.
Juho Kokkala

Bu, tam olarak yukarıdaki yorum için bir çürütme değildir, ancak "en iyi tahminin" gerçekten bir dağıtımdan ziyade gerçek bir sayıya işaret ettiğini belirtmeliyim. Bir CI ile, belki de "gerçek ortalamanın bu verilerde verilebileceği yerin dağılımı" hakkında konuşulabilir.
Superbest

1
@Super Bu, kağıtta ele alınan CI'nın tam olarak yanlış anlaşılmasıdır. Özellikle, gerçek ortalama bir sayıdır ; dağıtımı yok. İçin bir site arayışında ilk iki isabet Bkz güven aralığı daha fazla tartışma için.
whuber

1
Süper, "güvenilir aralık" yakın gelecekti.
whuber

8

"% 95 güvende" olmanın ne anlama geldiğinin herhangi bir resmi tanımı olmadan, 5. numarayı doğru ya da yanlış olarak etiketlemenin nedeni nedir? Bir meslekten olmayan kişi, kuşkusuz bunu, ortalamanın% 95 olasılıkla o aralıkta olma ihtimaliyle eşanlamlı olarak algılayacaktır: ancak bazı insanlar, zamanları gerçek ortalamanın% 95'ini içeren bir aralık oluşturma yöntemi kullanmış olması anlamında kullanırlar. kesin olarak bilinmeyen bir parametrenin olasılık dağılımından bahsetmekten kaçınmak; Bu, terminolojinin yeterince doğal bir uzantısı gibi görünüyor.

Yukarıdaki açıklamanın (# 4) benzer yapısı, daha önce bu fikri ağırlasalar bile, yanıt verenleri "% 95 kendinden emin olabiliriz" ve "% 95 olasılık var" arasında bir ayrım yapmaya çalışmaya teşvik etmiş olabilir. Bu hileliğin # 5’e, en yüksek oranda anlaşmaya varmasını umuyordum - kağıda bakarken, yanıldığımı fark ettim, ancak en azından% 80’inin anketi Hollandaca bir sürümde okuduğunu, belki de İngilizce çevirinin uygunluğu.


4

BS Everitt'in İstatistik Sözlüğü'nden bir güven aralığı tanımı :

"Numune gözlemlerinden hesaplanan ve belirli bir olasılıkla gerçek parametre değerini içerdiğine inanılan bir değerler aralığı. Örneğin,% 95'lik bir CI, tahmin işleminin tekrar tekrar tekrar edildiğini, ardından% 95'ini belirtir. hesaplanan aralıkların gerçek parametre değerini içermesi beklenir. Belirtilen olasılık seviyesinin, aralığın özelliklerini ifade eder, parametrenin kendisine değil, rastgele bir değişken olarak kabul edilmez. "

Çok yaygın bir yanlış kanı bir anlamını şaşırtmak için güven aralığı , bir o ile inandırıcı aralık sorularda benzer marka ifadeleri yapar, AKA "Bayes güven aralığı",.

Güven aralıklarının çoğu zaman bilgi vermeyen bir durumdan türetilen güvenilir aralıklarla benzer olduğunu duymuştum, ancak bana feci bir şekilde söylendi (çok saygı duyduğum bir erkek tarafından da olsa) ve ayrıntılar veya alıntılarım yok.


Jaynes 1976 kağıt güven aralıkları vs bayesyen aralıkları. Bu en az bir tane güvenilir sulak. Ayrıca Berger ve Bernardo'nun referans öncelikleri de var. Cidden, bunları hiç duymadın mı?
probabilityislogic

2

Soru 5’in yanlışlığına ilişkin sezgi ile ilgili olarak, bu konuda aşağıdaki tartışmayı buradan ele alıyorum

Hesapladığınız güven aralığının gerçek nüfus ortalamasını içerme olasılığı% 95 olduğunu söylemek doğru. Nüfus ortalamasının aralık içinde kalma şansı% 95 olduğunu söylemek doğru değil.

Fark ne? Popülasyon ortalaması bir değere sahiptir. Ne olduğunu bilmiyorsunuz (simülasyonlar yapmıyorsanız) ancak bir değeri var. Deneyi tekrarlarsanız, bu değer değişmez (ve bunun ne olduğunu hala bilemezsiniz). Bu nedenle, nüfusun ortalamalarının belirli bir aralıkta olma ihtimalini sormak kesinlikle doğru değildir. Buna karşılık, hesapladığınız güven aralığı, topladığınız verilere bağlıdır. Deneyi tekrarlarsanız, güven aralığınız neredeyse kesinlikle farklı olacaktır. Bu nedenle, aralığın popülasyon ortalamasını içerme olasılığını sormak sorun değil.

Şimdi 5 ile ilgili sorularınız için. Neden yanlış?

  1. Bu, aldığımız örnek hakkında gerçek ortalamayı içermeyen% 5'ten biri olabileceğimizi düşünmemize neden olacak özel bilgilerimiz olabileceğinden mi? Hayır, bunun yerine, gerçek ortalamanın rastgele bir değişken olmadığı, ancak güven aralığı verinin bir işlevi olduğu içindir.
  2. 100(1α)100(1α)

Bir ek not olarak (bu sorunun diğer cevaplarında da belirtildiği gibi), Bayesian istatistiklerinden bir kavram olan güvenilir bir aralık , parametrenin gerçek değerinin fiilen elde edilen veriler verilen güven aralığında olma özelliğine sahip olduğunu tahmin eder. Belki Gelman'ın blogundan bu konuda daha fazla bilgi edinebilirsiniz.


5
"Aralık, gerçek değeri içerir" ve "gerçek değer, aralık içinde yer alır", aynı şey anlamına gelir. Birincisi açısından düşünmek daha yararlıdır ancak birinin doğru, diğeri yanlış olduğunu söylemek gerçekten mantıklı değildir.
David Richerby
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.