Neden bir% 95 Güven Aralığı (CI) ortalamayı içeren bir% 95 şans anlamına gelmiyor?


228

Buradaki çeşitli ilgili sorularla, "% 95 güven aralığı" dediğimiz şeyin "% 95" bölümünün, örnekleme ve CI-hesaplama prosedürlerimizi birçok kez tam olarak çoğaltacak olmamız gerektiği anlamına geldiği konusunda fikir birliği olduğu anlaşılıyor. Bu şekilde hesaplanan CI'lerin% 95'i popülasyon ortalamasını içerecektir. Ayrıca, bu tanımın yapmaması konusunda fikir birliği var gibitek bir% 95 CI'den, ortalamanın CI içinde bir yere düşme ihtimalinin% 95 olduğu sonucuna varmak. Bununla birlikte, eskilerin,% 95'inin nüfus ortalamasını içeren birçok CI’yi hayal ettikleri gibi, gerçekte hesaplanmış CI’nizin popülasyonu içerip içermediğine ilişkin olarak belirsizliğimiz olmaması gerektiği anlamına gelmediğini anlamıyorum. demek ya da değil) bizi, gerçek vakamızın CI'yi içerme olasılığını tahmin etmemiz olarak, hayal edilen vakaların (% 95) taban oranını kullanmaya zorlar.

Mesajların "aslında hesaplanan CI'nin popülasyon ortalamasını içeriyor veya içermiyor, yani olasılık 1 veya 0" satırları üzerinde tartıştıklarını gördüm. Ancak bu, bağımlı olan tuhaf bir olasılık tanımı anlamına geliyor gibi görünüyor. bilinmeyen eyaletlerde (yani bir arkadaş adil para basar, sonucu gizler ve kafalarının% 50 şansı olduğunu söylememe izin verilmez).

Elbette yanılıyorum ama mantığımın nerelere gittiğini anlamıyorum.


4
"Şans" derken, teknik frekansçı anlamda veya Bayesyen öznel mantıklılık anlamında "olasılık" mı demek istiyorsunuz? Sıkcı anlamda, yalnızca rastgele deney olaylarının olasılığı vardır. Sırasını belirlemek için verilen (sabit) sayılara (gerçek ortalama, hesaplanan CI sınırları) bakmak (CI? 'Da bulunan gerçek ortalama) rastgele bir deney değildir. Bu aynı zamanda “gerçekte hesaplanan CI'nin olasılık kısmının popülasyon ortalamasını içeriyor veya içermiyor, bu yüzden olasılığı ya 1 ya da 0” da yanlış. Sıkı bir olasılık modeli bu durumda geçerli değildir.
caracal

11
Teorik ortalamaya nasıl davrandığınıza bağlıdır. Eğer rastgele değişken ise, o zaman bir aralığa girme olasılığı hakkında söyleyebilirsiniz. Eğer sabitse, yapamazsınız. Bu konuyu şahsen benim için kapatan en basit açıklama budur.
mpiktas

2
Bu arada, Thaddeus Tarpey'den bu konuşmaya rastladım: Tüm modeller haklı… çoğu işe yaramaz . % 95 güven aralığının (p. 81 ff.) İçerme olasılığı sorusunu tartıştı . μ
chl

3
@Nesp: Bir CI'nin (sabit) bir parametre içerdiği (posterior) olasılığa atıfta bulunarak "Bu olasılık sıfır veya bir" ifadesiyle ilgili herhangi bir sorun olduğunu sanmıyorum. (Bu bile gelmez gerçekten olasılık herhangi frequentist yorumuna dayanır!). Aynı zamanda “bilinmeyen devletlere” dayanmamaktadır. Böyle bir ifade, kesin olarak, belirli bir örneğe dayanarak bir CI'nin verildiği durumu ifade eder. Bu tür bir olasılığın önemsiz olduğunu, yani degerleri aldigini göstermek basit bir matematik egzersizidir . {0,1}
kardinal

3
@MikeLawrence, üç yıl boyunca, şu şekilde% 95 güven aralığı tanımlamasından memnun musunuz: "popülasyondan tekrar tekrar örneklenirsek ve her numuneden sonra% 95 güven aralığı hesaplarsak, güven aralığımızın% 95'i ortalamayı içerir. ". 2012'de olduğu gibi, bunun% 95'lik bir güven aralığının ortalamayı içeren% 95'lik bir olasılığa sahip olduğu anlamına gelmediğini görmek için mücadele ediyorum. Bu soruyu sorduğunuzdan beri güven aralığı anlayışınızın nasıl geliştiğini görmek isterim.
luciano

Yanıtlar:


107

Meselenin bir kısmı, bir olasılığın sık tanımının, belirli bir deneyin sonucuna önemsiz bir olasılığın uygulanmasına izin vermemesi, ancak yalnızca bu özel deneyin bir örnek olarak kabul edilebileceği bazı hayali deney popülasyonlarına uygulanmasına izin vermemesidir. Bir CI'nin tanımı, eldeki örnekte toplanan verilerden ziyade, bu (genellikle) hayali deney popülasyonu hakkında bir açıklama olduğu için kafa karıştırıcıdır. Dolayısıyla meselenin bir kısmı olasılık tanımının bir tanesidir:% 95 olasılıkla belirli bir aralıkta kalan gerçek değer fikri, sıkça bir çerçeveyle tutarsızdır.

Meselenin bir başka yönü de, sıklık güveninin hesaplanmasının, belirli bir örneklemde yer alan bilgilerin istatistiğin gerçek değerinin sınırlandırılmasıyla ilgili tüm bilgileri kullanmamasıdır. Benim soruma göre, "Bayesian güvenilir aralıklarının sık sık güven aralıklarında açıkça göründüğü durumlar var mı?"Edwin Jaynes'in güven aralıkları ve güvenilir aralıklar arasındaki farkı gerçekten vurgulayan bazı iyi örnekleri olan bir makaleyi tartışıyor. Bu tartışma ile özellikle ilgili olan, kesilmiş bir üstel dağılım parametresini (endüstriyel kalite kontrolündeki bir sorun için) tahmin etmek için güvenilir ve güvenirlik aralığı arasındaki farkı tartışan Örnek 5'tir. Verdiği örnekte, örnekte parametrenin gerçek değerinin% 90 güven aralığında doğru bir yerde bulunmadığından emin olmak için yeterli bilgi var !

Bu, bazılarına şok edici gelebilir, ancak bu sonucun nedeni, güven aralıkları ve güvenilir aralıklar, iki farklı olasılık yorumundan, iki farklı sorunun cevabıdır.

Güven aralığı, isteğin cevabı: "Bana parametrenin gerçek değerini çok sayıda tekrarlanan bir deneyin% parantez içine alacak bir aralık verin ." Güvenilir aralık isteğine bir cevaptır: "Bana olasılık ile gerçek değerini braketleri bir aralık ver . Aslında gözlenen ettik belirli örneği verilen " İkinci isteğini cevaplamak edebilmek için, öncelikle (a ya benimsemelidir (1) veri üretme işleminde yeni bir kavram veya (b) olasılık tanımının kendisinde farklı bir kavram. p100pp

Herhangi bir% 95 güven aralığının herhangi bir% 95 güven ortalamasının ortalamayı içerme şansı olduğu anlamına gelmemesinin ana nedeni, güven aralığının farklı bir sorunun cevabı olmasıdır, bu nedenle, iki sorunun cevabı olduğunda sadece doğru cevaptır. aynı sayısal çözüme sahip.

Kısacası, güvenilir ve güven aralıkları farklı bakış açılarından farklı soruları cevaplar; her ikisi de kullanışlıdır, ancak gerçekten sormak istediğiniz soru için doğru aralığı seçmeniz gerekir. Gerçek değeri içeren% 95 (posterior) olasılığın yorumunu kabul eden bir aralık istiyorsanız, güvenilir bir aralık (ve bununla birlikte, olasılık olasılığının kavramsallaştırılması) bir güven aralığı değil. Yapmamanız gereken şey, yorumlamada analizde kullanılandan farklı bir olasılık tanımı benimsemek.

İyileştirmelerinden dolayı @cardinal'a teşekkürler!

İşte David MaKay'ın “Bilgi Kuramı, Çıkarım ve Öğrenme Algoritmaları” adlı mükemmel kitabından somut bir örnek : (sayfa 464):

İlgili parametrenin ve verileri , aşağıdaki dağılımdan bağımsız olarak çizilen bir çift nokta ve olalım :D x 1 x 2θDx1x2

p(x|θ)={1/2x=θ,1/2x=θ+1,0otherwise

Eğer olan , o zaman veri setlerini görmeyi beklediğiniz , , ve tüm eşit olasılıkla . Güven aralığını düşünün39 ( 39 , 39 ) ( 39 , 40 ) ( 40 , 39 ) ( 40 , 40 ) 1 / 4θ39(39,39)(39,40)(40,39)(40,40)1/4

[θmin(D),θmax(D)]=[min(x1,x2),max(x1,x2)] .

Açıkça bu geçerli bir% 75 güven aralığıdır çünkü verileri yeniden örneklediyseniz, , çoğu zaman bu şekilde oluşturulan güven aralığı gerçek zamanın% 75'ini içerecektir.D=(x1,x2)

Şimdi verilerini dikkate alın . Bu durumda, frekansçı% 75 güven aralığı . Bununla birlikte, üretim sürecinin modelinin doğru olduğunu varsayarsak, bu durumda 28 ya da 29 olabilir ve 29'un 28'den daha büyük olduğunu varsaymak için hiçbir nedenimiz yoktur, bu nedenle arka olasılık . Bunun gerçek değerini içerdiğini sadece% 50 ihtimali vardır Yani bu durumda frequentist güven aralığı açıkça% 75 güvenilir aralık değil , yaklaşık anlaması ne verilen bu özel örnekten .[ 29 , 29 ] θ p ( θ = 28 | D ) = p ( θ = 29 | D ) =D=(29,29)[29,29]θθ θp(θ=28|D)=p(θ=29|D)=1/2θθ

Evet, bu tartışmalı bir örnektir, ancak güven aralıkları ve güvenilir aralıklar farklı olmasaydı, o zaman tartışmalı örneklerde yine aynı olurdu.

Önemli fark, güven aralığının, deneyi birçok kez tekrarlarsanız ne olacağına dair bir ifade olduğunu, güvenilir aralığın bu belirli örnekten neyin çıkabileceğini anlatan bir ifade olduğunu unutmayın.


8
Güven aralığı, "eğer deney çok sayıda tekrarlanırsa, istatistiğin gerçek değerini p olasılık ile p birleştirecek bir aralık verin" sorusunun cevabıdır. Güvenilir aralık, "Bana gerçek değeri p ile parantezleyen bir aralık verin" sorusunun cevabıdır. Her şeyden önce, sıklıkta bir olasılık yorumuna ilişkin ifade arzulanan bir şey bırakır. Belki de mesele , bu cümlede olasılık kelimesi kullanımında yatmaktadır . İkincisi, güvenilir aralık "tanım" ı biraz fazla basit buluyorum ...
kardinal

7
... ve bir CI'ye verdiğiniz karakterizasyonu göz önüne alarak biraz yanıltıcı. İlgili bir damarda, kapanış cümlesinde aynı sorun vardır: Zamanın% 95'inin gerçek değerini içeren bir aralık istiyorsanız, o zaman bir güven aralığı değil güvenilir bir aralık seçin. "Zamanın% 95'inin gerçek değerini içeren" konuşma dili kullanımı biraz kesin değildir ve yanlış izlenimi bırakmaktadır. Aslında, böyle bir ifadenin CI'nin tanımına daha yakın olduğu konusunda inandırıcı bir iddiada bulunabilirim (inanıyorum) .
kardinal

11
Talep : Yorum yapanların düşüncelerini / sebeplerini ifade etmesi için katılımcıya bu cevabı vermesi yararlı olacaktır. Bu soru, genişletilmiş tartışmalara yol açma olasılığından biraz daha fazla olsa da, yanıtlayanlara yapıcı geri bildirim sağlamakta fayda var; Bu, sitenin genel içeriğini iyileştirmeye yardımcı olmanın en kolay yollarından biridir. Şerefe.
kardinal

9
Dikran, evet, katılıyorum. Bu, düzenlemelerde biraz daha fazla çizmeye çalıştığım şeyin bir parçasıydı. Radikal bir frekansçı (kesinlikle değilim ), kışkırtıcı bir şekilde şöyle diyebilir: “Bir CI muhafazakar, önceden gözlemlediğim herhangi bir veri olursa olsun, parametre% 95 aralığında yakalanacak şekilde tasarlayacağım . İnanılmaz bir aralık, "Oops, birisi sadece kucağımda bir miktar veri attı." Bu verilerden oluşturduğum aralığın gerçek parametreyi içermesi olasılığı nedir? "demekten kaynaklanıyor. İkinci durumda bu biraz adaletsiz .. .
kardinal

2
Dikran, hepimiz farklı geçmişlerden geliyoruz ve bu anlayışımızı zenginleştirmeye yardımcı oluyor. Olasılık ve ilgili kavramlarla ilgili olarak, belki de etkileşim kurma zevkine sahip olduğum en parlak düşünür resmi bir istatistik veya (matematiksel) olasılık geçmişine sahip değildi; o bir mühendisdi.
kardinal

28

Sık sık istatistiklerde olasılıklar uzun vadede olaylarla ilgilidir. Sadece bittikten sonra tek bir etkinliğe başvurmuyorlar. Ve bir deneyin gerçekleştirilmesi ve CI'nin hesaplanması tam da böyle bir olay.

Gizli bir madalyonun kafa olma ihtimaliyle karşılaştırmak istedin ama yapamazsın. Çok yakın bir şeyle ilişkilendirebilirsin. Oyununuz, "başlıklar" düştükten sonra belirtmeniz gereken bir kurala sahipse, uzun vadede doğru olma olasılığı% 50'dir ve bu benzerdir.

Denemenizi çalıştırıp verilerinizi topladığınızda, madalyonun asıl çevirisine benzer bir şey elde edersiniz. Deneyin süreç oluşturduğu ki saygısız madalyonun süreci gibidirμμya da sadece bozuk para kafa gibi değil ya da değil. Bozuk parayı çevirdiğinizde, görseniz de görmeseniz de, kafaları ya da kafaları olma ihtimali yoktur. Şimdi kafaları aradığını varsayalım. CI hesaplayan budur. Çünkü jetonu asla ortaya çıkaramazsınız (bir deney analojiniz yok olur). Ya haklısın ya da yanılıyorsun, hepsi bu. Şu anki durumunun bir sonraki kapakta başa çıkma olasılığı ile herhangi bir ilişkisi var mı, yoksa ne olduğunu tahmin edebilirdim? Hayır. Kafanın üretildiği işlem, onları üretme olasılığının 0,5'e sahiptir, ancak zaten var olan bir kafanın 0.5 olma olasılığına sahip olduğu anlamına gelmez. CI’nizi hesapladığınızda, yakalama olasılığı yoktur.μ, ya yapar ya da yapmaz — bozuk parayı zaten çevirdiniz.

Tamam, sanırım yeterince işkence yaptım. Kritik olan nokta, analojinizin yanlış yönlendirilmiş olmasıdır. Bozuk parayı asla ortaya çıkaramazsınız; Sadece jetonlarla ilgili varsayımlara dayanarak başları veya kuyrukları çağırabilirsiniz (deneyler). Daha sonra başınıza ya da kuyruklarına doğru bir bahis yapmak isteyebilirsiniz, ancak bunu asla toplayamazsınız. Ayrıca, CI prosedürünün kritik bir bileşeni, içe aktarma değerinin aralıkta olduğunu belirtmenizdir. Eğer yoksa, bir CI'nız olmaz (ya da en azından belirtilen% 'de değil).

Muhtemelen CI'yi kafa karıştırıcı yapan şey onun adı. içeren ya da içermeyen bir değerler aralığıdır . Biz içerdikleri düşünüyorum ama bu olasılığı o gelişmekte girdi süreç olarak aynı değildir. % 95 CI adının% 95 kısmı hemen hemen işlemle ilgilidir. Sen edebilirsiniz sonradan içerdiğini düşündüğünüz bir dizi hesaplamak bazı olasılık düzeyinde ama bu farklı bir hesaplama değil, bir CI bu.μ μμμμ

Bir ataması olarak adı% 95 CI düşünmek daha iyidir tür size haklı olarak düşünmek ihtiva değer aralığını ölçüm ve bu inandırıcılık dan% 95 ayırın. % 99 CI Wendy CI iken buna Jennifer CI diyebiliriz. Bu aslında daha iyi olabilir. Ardından, daha sonra biz inanıyoruz söyleyebiliriz değerlerin aralığında olması muhtemeldir ve hiç kimse biz yakaladık Wendy olasılık olduğunu söyleyerek sıkışmış olacaktı . Farklı bir adlandırma istiyorsanız, muhtemelen CI'nin "güven" kısmından da kurtulmakta özgürsünüz (ama bu bir aralıktır).μ μμμμ


Yeterince adil olmak gerekirse, bu cevap tamam görünüyor, ancak bunun resmi (matematiksel) bir tanımını görmeyi çok isterim. Resmi olarak, olaylara dönüştürmeyi kastediyorum. Amacımı açıklayacağım: Başlangıçtaki değerleriyle çok karışık olduğumu hatırlıyorum . Bir yerlerde, " değerlerinin gerçekte hesapladığı şey, boş hipotezi doğru olduğu verilen verinin olasılığıdır " olduğunu okudum . Bunu Bayes teoremi ile ilişkilendirdiğimde hepsi o kadar anlamlıydı ki artık bunu herkese açıklayabiliyorum (yani ). Ancak, (ironik olarak) o kadar emin değilim ...p H 0 p ( D | H 0 )ppH0p(D|H0)
Néstor

... (devam) güven aralıklarıyla: söylediklerinizi bilgi olarak ifade etmenin bir yolu var mı? Frekansta. istatistikleri. biri genellikle , bazı yöntemlerle (örneğin, MLE) bir nokta tahmini, hesaplar . bir yolu var mı (örneğin, bir "bayesian merkezi arka aralığı", "gerçek ortalama" ile) bir fonksiyonu olarak (yani neyi güven aralıklarının% gerçekten) kullanarak, ifade edebiliriz olarak olarak işlevi nedir? Sezgisel olarak, her zaman bunun yapılabileceğini düşündüm ama asla yapamadım. μ^P(L1(μ^)<μ<L2(mu^)|D)μP(L1<X¯μ<L2)=ααp(H0|D)p(D|H0)
Néstor

Bazen yorumları silebilmenin sakıncaları vardır. Bu durumda hızlı değişimlere ayak uyduramadım!
kardinal

1
Güven aralığınızı hesaplamazsanız, gizli madalyonunkine benzer bir şey elde edersiniz ve madalyonun tıpkı madalyonun% 50'sinin baş olma ihtimalinin% 50 olduğu gibi. ” - Sanırım analoji burada yanlış. "CI'nin hesaplanması", madeni parayı açığa vurmakla uyuşmaz, bu, hala 50-50 haklı olma şansınız olan "Heads" veya "Tails" olarak adlandırmaya karşılık gelir . Bozuk parayı açığa çıkarmak * değerinin popülasyon değerini görmeye * karşılık gelir , bu noktada "aradığı" aralıkta olup olmadığına dair soruyu cevaplayabilirsiniz. OP'nin bulmacası kaldı. μ
Glen_b

1
@ vonjd, bunun ne anlama geldiğini anlamadım. Açıkçası rakibinizin floşuna sahip olması veya olmaması durumu. Birincisi, olasılık (önemsiz) 1, ikincisi ise 0'dır. Sonuç olarak, olasılığın makul bir şekilde olduğunu söyleyemezsiniz. Bu mükemmel bir anlam ifade ediyor. Elden önce işlem yapmadan önce , floş alma olasılığı hakkında konuşmak makul olur. Aynı şekilde, bir kart çekmeden önce, ihtiyacınız olan kıyafeti alma olasılığından bahsetmek de makul olacaktır. Kartı aldıktan sonra , neye uygun olursa olsun.
gung

22

Argümanlar, çıkarım ve mantık hakkındaki biçimsel, açık fikirler, Batı geleneği dahilinde, Aristoteles ile ortaya çıkmıştır. Aristoteles, bu konular hakkında birkaç farklı eserde ( Konular ;-) dahil olmak üzere) yazdı . Ancak, en temel tek ilke, Metafizik dahil olmak üzere çeşitli yerlerde bulunabilecek Çelişkisizlik Yasasıdır.kitap IV, bölüm 3 ve 4'tür. Tipik bir formülasyon: "... aynı anda hiçbir şeyin [aynı anlamda] olması ve olmaması mümkün değildir" (1006 1). Önemi biraz daha önce belirtiliyor, "... bu diğer tüm aksiyomlar için bile doğal bir başlangıç ​​noktasıdır" (1005 b 30). Felsefi balmumu için beni bağışlayın, ancak doğası gereği bu soru kolaylık için kenara itilemeyen felsefi içeriğe sahiptir.

Bu düşünce deneyimini göz önünde bulundurun: Alex bir yazı tura attı, yakaladı ve eli yukarı bakacak şekilde ön koluna çevirdi. Bob tam olarak doğru pozisyonda duruyordu; Bozuk parayı Alex'in elinde kısaca gördü ve böylece hangi tarafın yukarı baktığını anlayabiliyor. Bununla birlikte, Carlos madeni parayı görmedi - doğru yerde değildi. Bu noktada, Alex onlara madalyonun kafa gösterme ihtimalinin ne olduğunu soruyor. Carlos, ihtimalin .5 olduğunu, çünkü kafaların uzun dönem frekansının bu olduğunu söylüyor. Bob aynı fikirde değil, kesinlikle ihtimalin 0'dan başka bir şey olmadığını ileri sürüyor .

Şimdi, kim haklı? Elbette, Bob'un yanlış görmesi ve yanlış olması mümkündür (yanlış göremediğini varsayalım). Bununla birlikte, her ikisinin de haklı olduğunu ve çelişki olmayan yasaya dayandığını söyleyemezsiniz. (Sanırım, çelişki yasasına inanmazsanız, ikisinin de doğru olduğunu ya da başka bir formülasyon olduğunu düşünebilirsiniz.) Şimdi, benzer bir durum düşünün, ancak Bob olmasaydı Carlos'un önerisi olabilirdi. etrafta Bob olmadan daha doğru (eh?), kimse parayı görmediğinden beri? Bu davada çelişki yasasının uygulanması pek net değil, ancak durumun önemli gibi görünen kısımlarının eskisinden ikincisine kadar sabit tutulduğu açık. Olasılığı tanımlamak için birçok girişimde bulunuldu ve gelecekte hala daha birçok şey olabilir, ancak etrafta duran ve nerede konumlandıklarına dair bir işlev olarak olasılık tanımı çok cazip değildir. Her halükarda ("cümlesini kullandığınızı tahmin ederek"güven aralığı "), Frequentist yaklaşım içinde çalışıyoruz ve orada madalyonun gerçek halinin alakasız olduğunu bilen var mı? Bu rastgele bir değişken değil - fark edilmiş bir değer ve ya kafa gösteriyor, ya da yazı gösteriyor .

@John'un belirttiği gibi, madalyonun durumu ilk başta bir güven aralığı gerçek ortalamayı kapsıyor mu sorusuna benzer görünmeyebilir. Bununla birlikte, bir madeni para yerine, bunu soyut olarak Bernoulli dağılımından parametresiyle elde edilen gerçek bir değer olarak anlayabiliriz . Madeni para durumunda, , oysa% 95 CI için, . Bağlantının kurulmasında fark edilmesi gereken, metaforun önemli bölümünün durumu düzenleyen değil, tersine çevrilen jetonun veya hesaplanan CI'nin rastgele bir değişken değil, gerçek bir değer olduğudur. pp=.5p=.95p

Bu noktada, bütün bunların Frequentist olasılık kavramı içindeki durumun böyle olduğunu not etmek benim için önemlidir. Bayesian perspektifi, çelişki yasasını ihlal etmiyor, sadece gerçekliğin doğası (daha özel olarak olasılıkla ilgili) hakkındaki farklı metafizik varsayımlardan başlıyor. Özgeçmiş konusundaki diğerleri, Bayes perspektifinde benden çok daha iyi anlaşılıyorlar ve belki de sorunuzun ardındaki varsayımların Bayes yaklaşımı içinde neden geçerli olmadığını ve aslında, ortalamanın% 95'inin bir olasılık olabileceğini açıklayabilirler. % 95 güvenilir bir yerde yatmak(diğerlerinin yanı sıra) önceden kullanılanların doğru olduğu dahil olmak üzere belirli koşullar altında, (aşağıda @DikranMarsupial tarafından yapılan yoruma bakınız). Bununla birlikte, herkesin kabul edeceğini düşünüyorum, Frequentist yaklaşım içinde çalıştığınızı belirttiğinizde, gerçek ortalamaların herhangi bir% 95 CI’de bulunma ihtimalinin .95 olması durumunda olamaz.


5
Bayes yaklaşımı altında, gerçek değerin% 95 güvenilir bir aralıkta olma olasılığı% 95 olduğu gerçeği doğru değildir. İstatistiğin değeri için belirli bir ön dağılım göz önüne alındığında (başlangıçtaki bilgi durumumuzu temsil eder), ardından verileri gözlemledikten sonra bize bir aralık veren güncellenmiş bilgi durumunu gösteren bir posterior dağılımımız olduğunu söylemek daha doğru olacaktır. gerçek değerin yattığından% 95 eminiz. Bu, yalnızca öncekimizin doğru olması durumunda (ve ihtimalin şekli gibi diğer varsayımlar) doğru olacaktır.
Dikran Marsupial

@DikranMarsupial, not için teşekkürler. Bu biraz ağız dolusu. Cevabınızı önerinizle daha tutarlı hale getirmek için düzenlemiştim, ancak bunu toto içine kopyalamadım . Başka düzenlemelerin uygun olup olmadığını bana bildirin.
gung

Temel olarak, Bayesian yaklaşımı, ilgilenilen parametre ile ilgili bilgi durumunuzun bir ifadesi olarak yorumlanır (bakınız kardinal, öğreniyorum; o), ancak tüm varsayımlar doğru olmadıkça, bu bilgi durumunun doğru olduğunu garanti etmez . Felsefi tartışmadan zevk aldım, bir dahaki sefere bulanık mantığın tartışıldığı için çelişki yasasını hatırlamam gerek; o)
Dikran Marsupial

12

Neden% 95'lik bir CI ortalamayı içeren% 95'lik bir şans anlamına gelmiyor?

Bu soruda ve verilen cevapların çoğunda açıklığa kavuşturulması gereken birçok konu var. Kendimi sadece ikisiyle sınırlayacağım.

a. Bir nüfusun anlamı nedir? Gerçek bir nüfus var mıdır?

Nüfus ortalaması kavramı modele bağlıdır. Tüm modeller yanlış olduğu, ancak bazıları yararlı olduğu için, bu popülasyon ortalaması, yalnızca faydalı yorumlar sağlamak için tanımlanan bir kurgudur. Kurgu bir olasılık modeli ile başlar.

Olasılık modeli üçlüsü burada örnek alanıdır (boş olmayan bir küme), bir ailedir alt kümelerinin ve , üzerinde tanımlanmış iyi tanımlanmış bir olasılık ölçüsüdür (veri davranışını yönetir). Genellik kaybı olmadan, sadece ayrık durumu göz önünde bulundurun. Popülasyon ortalaması yani altındaki merkezi eğilimi temsil eder ve ayrıca kütle merkezi olarak da yorumlanabilir. içindeki tüm noktalar , her birinin ağırlığı

(X,F,P),
XFXPF
μ=xXxP(X=x),
PXxX , tarafından verilir .P(X=x)

Olasılık teorisinde, ölçüsü bilinen kabul edilir, bu nedenle popülasyon ortalamasına yukarıdaki basit işlemle erişilebilir. Bununla birlikte, pratikte, olasılığı pek bilinmemektedir. Bir olasılık olmadan , verilerin olasılıksal davranışını tarif edemez. Veri davranışını açıklamak için kesin bir olasılık belirleyemediğimiz için, veri davranışını yöneten (veya açıklayan) olasılık önlemleri içeren bir aile belirledik. Sonra klasik istatistiksel model ortaya çıkıyor Yukarıdaki modelde ile varsa parametrik bir model olduğu söylenir.PPPPM

(X,F,M).
ΘRpp< bu kadar . Bu yazıdaki sadece parametrik modeli düşünelim.M{Pθ: θΘ}

Her olasılık ölçüsü için, her bir olasılık ölçüsü için , Diğer bir deyişle, tanımına sıkıca bağlı olan nüfus ailesi vardır . ' ailesi sınırlı insanlar tarafından tanımlanır ve bu nedenle veri davranışını düzenleyen gerçek olasılık ölçüsünü içermeyebilir. Aslına bakılırsa, seçilen aile gerçek ölçüyü pek içermez, ayrıca bu gerçek ölçü bile olmayabilir. Bir popülasyon ortalaması kavramı, deki olasılık ölçülerine bağlı olduğundan, popülasyon ortalaması modele bağlıdır.PθM

μθ=xXxPθ(X=x).
{μθ: θΘ}MMM

Bayesian yaklaşımı, (veya eşdeğerde ) alt kümeleri üzerinde önceden bir olasılık olarak düşünür , ancak bu yazıda sadece klasik versiyon üzerinde yoğunlaşacağım.MΘ

b. Güven aralığının tanımı ve amacı nedir?

Yukarıda belirtildiği gibi, popülasyon ortalaması modele bağlıdır ve faydalı yorumlar sağlar. Bununla birlikte, istatistiksel model bir olasılık ölçütleri ailesi tarafından tanımlandığı için (her olasılık ölçüsü bir popülasyon ortalaması oluşturur) bir popülasyon aracı ailesine sahibiz. Bu nedenle, bir deneye dayanarak, nüfus araçlarının iyi adaylarını içeren küçük bir seti (aralığı) tahmin etmek için çıkarımsal prosedürler kullanılmalıdır. İyi bilinen bir prosedür, kümesiyle tanımlanan ( ) güven bölgesidir; öyle ki, tüm , nerede1αCαθΘ

Pθ(Cα(X)μθ)1α   and   infθΘPθ(Cα(X)μθ)=1α,
Pθ(Cα(X)=)=0 (bkz. Schervish, 1995). Bu çok genel bir tanımdır ve neredeyse her türlü güven aralığı içerir. Burada, olasılığıdır içeren ölçüsü altında . Bu olasılık her zaman büyük veya eşit olmalıdır , eşitlik en kötü durumda meydana gelir.Pθ(Cα(X)μθ)Cα(X)μθPθ1α

Not: Okuyucular, gerçeklik durumuna ilişkin varsayımlarda bulunmanın gerekmediğini fark etmelidir, güven bölgesi, herhangi bir "doğru" ortama atıfta bulunmadan iyi tanımlanmış bir istatistiksel model için tanımlanmıştır. "Doğru" olasılık ölçüsü mevcut olmasa veya de olmasa bile , varsayımlar gerçeklik durumlarından ziyade istatistiksel modelleme ile ilgili olduğu için güven bölgesi tanımı işe yarayacaktır.M

Bir yandan, verileri gözlemlemeden önce , rasgele bir (veya rastgele aralık) ve " ın ' ortalama en azından, tümü için . Bu, frekansçı paradigma için çok istenen bir özelliktir.Cα(X)Cα(X)μθ(1α)θΘ

Öte yandan, verilerini gözlemledikten sonra , sadece sabit bir ve " in "' nın ortalamasını içermesi olasılığının tüm .xCα(x)Cα(x)μθθΘ

Yani, verisini inceledikten sonra , olasılıksal akıl yürütmeyi artık kullanamayız. Bildiğim kadarıyla, gözlemlenen bir örnek için güven kümelerini tedavi edecek bir teori yok (üzerinde çalışıyorum ve güzel sonuçlar elde ediyorum). Bir süre için, , gözlenen kümenin (veya aralık) in tüm içeren kümelerinden biri olduğuna .C α ( x ) ( 1 - α ) % 100 μ θ θ ΘxCα(x)(1α)100%μθθΘ

Not: Görevime yorum, eleştiri, eleştiri ve hatta itiraz davet ediyorum. Bunu derinlemesine tartışalım. Anadili İngilizce olmadığım için gönderimim kesinlikle yazım hataları ve gramer hataları içeriyor.

Referans:

Schervish, M. (1995), İstatistik Teorisi, İkinci baskı, Springer.


Tartışmak isteyen var mı?
Alexandre Patriota

4
Sohbetlerde görüşmeler yapılabilir, ancak ana sitemizde uygunsuz. Bunun nasıl çalıştığı hakkında daha fazla bilgi için lütfen yardım merkezimize bakın . Bu arada, gönderinizin biçimlendirmesinden şaşırıyorum: hemen hemen hepsi bir teklif olarak biçimlendirilmiş. Bu materyali yayınlanmış bir kaynaktan çıkardınız mı yoksa kendi cevabınız mı? İkincisi ise, lütfen teklifleri kaldırın!
whuber

2
(1). Etkileyici şekilde net bir özet için teşekkür ederiz. Sitemize hoşgeldiniz!
whuber

11

Hiç kimsenin Berger'in "Olabilirlik Prensibi" nin ikinci bölümünde açıklanan temel olarak işe yaramaz bir% 75 güven aralığı örneğini getirmediğine şaşırdım. Ayrıntılar, orijinal metinde bulunabilir (bu, Euclid Projesi'nde ücretsiz olarak mevcuttur ): örnek için esas teşkil eden şey, kesin olarak bilinmeyen bir parametrenin değerini kesin olarak bildiğiniz bir durumu açık bir şekilde tanımlamanızdır. verileri gözlemleyerek, ancak aralığınızın gerçek değeri içerdiğine yalnızca % 75 oranında güvendiğiniz olduğunu iddia edersiniz . Bu örneğin ayrıntılarını incelemek, güven aralıkları oluşturma mantığını anlamamı sağlayan şeydi.


8
Sık kullanılan bir ortamda, ilk önce bir CI referansına göre "aralığınızın gerçek değeri içerdiğine yalnızca% 75 güven duyduğunuza dair güvende olduğunuz" iddia edilmez . Burada, konunun temel noktası yatıyor. :)
kardinal

1
bu örneğe doğrudan bir bağlantı / sayfa referansı verebilir misiniz? Bölümü araştırdım ama doğru örneği bulamadım.
Ronald

@Ronald: Bölüm 2'nin ilk sayfasında ilk kişi. Doğrudan bağlantı hoş bir ekleme olabilir.
kardinal,

1
İstediğiniz gibi bağlayın. Ah evet. Bu örnekte içinde, açık görünüyor: bir deney yaparsak, ortaya çıkan Güven Aralığı o% 75 şans var olacaktır ortalamasını içerir. Deneyi yaptıktan ve nasıl oynandığını öğrendikten sonra, ortaya çıkan örneğin dağılımına bağlı olarak bu olasılık farklı olabilir.
Ronald

7

Bunun yeni bir soru olarak sorulması gerekip gerekmediğini bilmiyorum, ancak bir düşünce deneyi önererek yukarıda sorulanla aynı soruyu ele alıyor.

Öncelikle, standart bir desteden rastgele bir oyun kartı seçersem, bir kulübe seçme ihtimalimin (bakmadan) 13/52 =% 25 olduğunu varsayacağım.

İkincisi, bir defalarca% 95 güven aralığının bir deneyi tekrarlamak açısından yorumlanması gerektiği ve hesaplanan aralığın zamanın% 95'inin gerçek ortalamasını içereceği defalarca belirtildi - bunun James Waters tarafından makul şekilde ikna edici bir şekilde gösterildiğini düşünüyorum. simülasyonu. Çoğu insan% 95 CI değerindeki bu yorumu kabul ediyor gibi görünmektedir.

Şimdi, düşünce deneyi için. Büyük bir popülasyonda normal dağılmış bir değişkene sahip olduğumuzu varsayalım - belki yetişkin erkek veya dişilerin boyları. Belirli bir örneklem büyüklüğünden çoklu örnekleme işlemlerini popülasyondan yapmak ve her örnek için örnek ortalamasını ve% 95 güven aralığını hesaplamakla görevli olan istekli ve yorulmayan bir asistanım var. Asistanım çok keskin ve nüfustan olası tüm numuneleri ölçmeyi başarıyor. Daha sonra, her numune için asistanım, ortaya çıkan güven aralığını yeşil (CI gerçek ortalamayı içeriyorsa) veya kırmızı (CI gerçek ortalamayı içermiyorsa) kaydeder. Maalesef asistanım bana deneylerinin sonuçlarını göstermeyecek. Nüfustaki yetişkinlerin yükseklikleri hakkında biraz bilgi almam gerekiyor, ancak yalnızca zamanım var. bir kez deneyi yapmak için kaynakları ve sabır. Tek bir rastgele örneklem yaptım (asistanım tarafından kullanılan aynı örneklem büyüklüğünde) ve güven aralığını (aynı denklemi kullanarak) hesaplarım.

Asistanımın sonuçlarını görmenin bir yolu yok. Öyleyse, seçtiğim rastgele örneğin yeşil CI vermesi ihtimali nedir (yani aralık gerçek ortalamaları içerir)?

Aklımda, bu daha önce ana hatlarıyla belirtilen kart destesi durumuyla aynıdır ve hesaplanan aralığın gerçek ortalamayı (yani yeşil) içerme ihtimalinin% 95 olduğu şeklinde yorumlanabilir. Yine de, fikir birliği% 95'lik bir güven aralığının, aralığın gerçek ortalamayı içerme olasılığı% 95 olduğu için yorumlanamayacağı görülüyor. Yukarıdaki düşünce deneyindeki mantığım neden (ve nerede) dağılıyor?


+1 Bu, normal bir popülasyondan ikili örnekleme durumuna olan kavramsal ilerlemenin dikkate değer bir açıklığıdır. Bizimle paylaştığınız için teşekkür ederiz ve sitemize hoş geldiniz!
whuber

Lütfen bunu bir soru olarak gönderin.
John

Yorumunuz için teşekkürler, John. Şimdi ayrı bir soru olarak yayınladım ( stats.stackexchange.com/questions/301478/… ).
user1718097 5:17

4

Çok sayıda büyük cevapta kapsamlı tartışmalar olsa da, daha basit bir bakış açısı eklemek istiyorum. (diğer cevaplarda değinilmiş olmasına rağmen - ancak açıkça belirtilmemiştir.) Bazı parametreler bir örnek , güven aralığı formun olasılık ifadesidir.θ(X1,X2,,Xn)100p%

P(g(X1,X2,,Xn)<θ<f(X1,X2,,Xn))=p

bir sabit olduğunu düşünürsek , yukarıdaki ifade ve veya daha doğru olan rasgele değişkenlerle ilgilidir. rastgele aralık .gr ( X 1 , x 2 , , X, n, ) f ( x 1 , x 2 , , X, n, ) ( g ( X 1 , x 2 , , X, n, ) , f ( x 1 , x 2 , , X, n, ) )θg(X1,X2,,Xn)f(X1,X2,,Xn)(g(X1,X2,,Xn),f(X1,X2,,Xn))

Bu nedenle, aralıkta yer alan parametrenin olasılığı hakkında herhangi bir bilgi vermek yerine, aralık rastgele değişkenlerden yapıldığı için parametreyi içeren aralığın olasılığı hakkında bilgi vermektedir.


3

Pratik amaçlar için,% 95 CI'nizin gerçek ortalamayı 95: 5 orana dahil ettiğini iddia etmek için daha fazla yanlış değilsiniz, arkadaşınızın jeton çevirisine 50:50 oranlarında bahis oynayacağınızdan daha fazla.

Eğer arkadaşınız bozuk parayı çoktan attıysa ve onun kafalarının % 50 ihtimalinin olduğunu düşünüyorsan , o zaman sadece olasılık kelimesi için farklı bir tanım kullanıyorsun. Diğerlerinin de söylediği gibi, frekans uzmanları için, meydana gelen bir olaya bir olasılık atayamazsınız, aksine, belirli bir işlemi kullanarak gelecekte meydana gelen bir olaya olasılığını tanımlayabilirsiniz.

Başka bir blogdan: Sıkça şöyle diyecek: "Belirli bir etkinliğin olasılığı yoktur. Yazı tura baş ya da yazı gösterir, ve göstermediğiniz sürece, gerçeği söyleyemem. Sadece atmayı tekrarlarsanız birçok, birçok defa, herhangi bir fırlatma aracının başlangıç ​​koşullarını yeterince kuvvetli bir şekilde değiştirirseniz, her fırında kafaların göreceli frekansının bir çok fırlatmaya 0,5'e yaklaşmasını beklerim. http://www.researchgate.net/post/What_is_the_difference_between_frequentist_and_bayesian_probability


2
Bu blog saman adam argümanı gibi geliyor. Olasılık modelleri oluşturma kapasitesindeki bir çeşit (var olmayan) doğal sınırlama ile bir olasılık felsefesini karıştırıyor gibi görünmektedir. Bu karakterizasyonda herhangi bir klasik istatistiksel prosedür veya metodoloji tanımıyorum. Yine de, son sonucunuzun iyi bir sonuç olduğunu düşünüyorum - ama bahisin CI ile ilgili olduğunu açıkça söyleyerek kullandığı dil değil, bu sorunun çözülmesi amaçlanan bir kafa karışıklığı oluşturma riski taşıdığı anlamına gelir.
whuber

1
Sık kullandığım bir yol, CI'nin bir prosedürün sonucu olduğunu vurgulamaktır. Nihai ifadenizden hoşlandığım şey, "95: 5'te bahis oynamaktan daha fazla yanlış değilsiniz." "Arkadaşınızın jetonuna bahse girmek için 50:50 oranına ulaşın."
whuber

Tamam, değiştirdim.
nigelhenry

2

Sahip olduğunuz belirli veri kümesinden hesapladığınız CI’nin, ortalamayı içermeyen olası CI’lerin% 5’inden biri olduğunu söyleyin. Hayal etmek istediğiniz% 95 güvenilir aralığına ne kadar yakın? (Yani,% 95 olasılık ile ortalamayı içermeye ne kadar yakın?) Hiç yakın olduğu konusunda hiçbir güvenceniz yok. Aslında, CI'niz, aslında ortalamayı içeren% 95 CI'nin% 95'inden tek bir taneyle bile çakışmayabilir. Ortalamanın kendisini içermediğinden bahsetmiyorum bile, bu da% 95 güvenilir bir aralık olmadığını gösteriyor.

Belki bunu görmezden gelmek istersiniz ve iyimser bir şekilde, CI'nizin ortalamayı içeren% 95'ten biri olduğunu kabul edersiniz. Tamam,% 95’te olduğuna göre CI’niz hakkında ne biliyoruz? Ortalamayı içermesi, ancak ortalamanın diğer tarafındaki diğer her şey hariç, belki de en uç noktadan çıkabilmektir. Dağılımın% 95'ini içermesi muhtemel değildir.

Her iki durumda da,% 95 CI’nizin% 95 güvenilir bir aralıkta olabileceği konusunda makul bir ümit bile yoktur.


İlk paragrafı merak ediyorum. Belki de yanlış okuyorum, ancak argüman, CI'lerin ve güvenilir aralıkların tüm olası gözlem kümeleri için çakıştığı birden fazla örnek olması gerçeği ile çelişmektedir . Neyi kaçırdım?
kardinal

@ cardinal: Yanılıyor olabilirim. Genel durumdan bahsediyordum, fakat tahminimce, CI ve güvenilir aralığın aynı olduğu durumlarda, CI'lerin çok daha uzakta olmasını engelleyen normallik gibi başka kısıtlamalar da olacaktır.
Wayne,

Odak noktam paragraftaki son cümleye kuvvetle çizildi; rastlantısal aralıkların örneği bir noktayı vurgulamak içindir. Bu cümleyi gerçekten inanıp inanmadığınızı düşünebilirsiniz. :)
kardinal

Bir% 95 CI% 5 anlamına gelmez anlamına mı değil ortalamasını içerir? "Tanım gereği, ortalamanın kendisini içermesine gerek yok mu" demeliyim? Yoksa daha fazlasını mı özlüyorum?
Wayne,

Wayne, belirli bir aralığın ortalamayı içermemesi olgusu geçerli bir güvenilir aralık olmasını nasıl önler? Bu görüşü yanlış mı okudum?
kardinal

2

(yani, bir arkadaş adil parayı çevirir, sonucu gizler ve kafalarının% 50 şansı olduğunu söylememe izin verilmez)

Eğer sadece arkadaşlarının jetonunun% 50 baş / kuyruk ile kaydığını tahmin ediyorsan, doğru yapmıyorsun demektir.

  • Madeni paraya indikten sonra / sonra ve sonuç gizlenmeden önce hızlıca bakmaya çalışmalısınız.
  • Ayrıca, önceden madalyonun adaletli olduğuna dair önceden yapılmış bir tahmin yapmayı denemelisiniz.

Kuşkusuz, madeni para çevirme hakkındaki tahmininizin güvenilirliği bu koşullara bağlı olacaktır ve her zaman aynı% 50 olmayacaktır (bazen 'hile yapma yönteminiz daha iyi çalışabilir).

Genel tahmininiz, hile yaparsanız, zamanın% 50'den% 50'sine kadar olabilir, ancak bu, her atma olasılığının sürekli olarak% x kafa olduğu anlamına gelmez. Bu nedenle, genel olasılığınızı belirli bir atış olasılığına yansıtmanız biraz garip olacaktır. Farklı bir 'olasılık türü'.


“Olasılık” ı hangi seviyede veya derinlikte belirlediğiniz / tanımladığınız birazdır .

  • Güven, 'belirli deney / çeviride özel olasılıktan' ve 'a priori olasılıklardan' bağımsızdır .

  • Güven, deneyler topluluğu ile ilgilidir . Popülasyondaki a priori olasılıkları veya dağılımlarını bilmenize gerek kalmayacak şekilde yapılandırılmıştır.

  • Güven, tahminin genel “başarısızlık oranı” ile ilgilidir, ancak belirli durumlar için olasılıkta daha kesin değişiklikler olabilir .

    ( Olasılıktaki bu varyasyonlar , teoride en azından dolaylı olarak var olurlar ve onların var olmaları için onları bilmemize gerek yoktur. Fakat bu olasılıkları Bayesyen bir yaklaşım kullanarak açıkça ifade edebiliriz).


Örnek 1:

Diyelim ki çok nadir bir hastalık için test yapıyorsunuz. Bernoulli denemesi (pozitif veya negatif) olarak görülebilen ve kişi hasta olduğunda pozitif sonuç için yüksek olan veya kişi hasta olmadığı zaman olan bir test yaparsınız .p=0.99p=0.01

Şimdi bu tipik olarak için bir CI aralığı tahmin etmek için (klinik uygulamada) yapılmaz, ancak isterseniz (örneğin) bunu yapabilirsiniz. Test pozitifse, o zaman ve test negatifse o zaman tahmin edersiniz .p0.05p10p0.95

Hasta popülasyonunun% 1'ine sahipseniz, ortalama olarak testin% 1.98'ini pozitif alırsınız (% 99 sağlıklı insan testinden% 1 ve% 1 hastalardan pozitif testinden% 99). Bu,% 95 CI aralığınızı (koşullu) pozitif bir testle karşılaştığınızda yapar , zamanın yalnızca% 50'sini doğrular.

Öte yandan, negatif bir testle karşılaştığınızda, zamanın% 95'inden daha fazlası olacaksınız, bu nedenle genel olarak CI aralığı tahmininiz doğru (en azından)% 95 oranında, ancak duruma göre (belirli durumlar için) ) gerçekten aralık içindeki olasılığının % 95 olduğunu söyleyemezsiniz . Muhtemelen bazı değişiklikler olabilir.p

Örnek 2:

Diyelim ki insanlar 300 IQ sorusu yapıyor. Naif güven aralığı ve bakış frequentist açıdan her kişi olduğunu varsayalım olabilir bir teorik kişisel sahiptir test performansı için dağıtım ve gözlemlenen test performansına dayalı bir aralık için bazı tahminini yaratabilir Öyle ki vakaların% aralık içinde doğru bir şekilde içerme hakkınız olacak .iN(μi,σi2)μi

Bu, regresyonun ortalamanın bir etkisi olduğunu ve herhangi bir kişinin IQ a-priori olasılığının olarak . Daha sonra aşırı durumlarda, sonuçların düşük veya yüksek olması sonucu, bir kişinin IQ'sunun ölçümlere / testlere dayanarak% 95 güven aralığında olması olasılığı% 95'ten düşük olacaktır .μiN(100,15)

(bunun tersi 100'e yakın sonuçları olan kişiler için doğrudur, onların IQ'ları% 95 -CI'de% 95'ten daha büyük olasılıkla olacaktır ve bu, aşırı uçlarda yaptığınız hataları haklı çıkacak şekilde telafi etmelidir. vakaların% 95'inde)


2

Öncelikle, güven aralığının bir tanımını verelim ya da birden fazla boyuttaki boşluklarda, güven bölgesi. Tanım, Jerzy Neyman'ın 1937 tarihli makalesinde Kraliyet Cemiyeti'ne verdiği özlü bir versiyondur.

Parametrenin ve istatistiğin olmasına izin verin . Her mümkün olan parametre değeri , bir kabul bölgesi ile ilişkilidir için , güven katsayısı veya güven düzeyi (genellikle 0.95) ve olasılıklarımızı tanımlamamız gereken arka plan bilgisidir . , verilen güven bölgesi , .pspA(p,α)prob(sA(p,α)|p=p,I)=ααIps=sC(s,α)={p|sA(p,α)}

Başka bir deyişle, güven bölgesini oluşturan parametre değerleri, sadece örnek alanın karşılık gelen olasılık bölgesi istatistiği içeren değerlerdir.α

Şimdi olası parametresi değeri için şunu göz önünde bulundurun :p

[pC(s,α)]prob(s=s|p=p,I)ds=[sA(p,α)]prob(s=s|p=p,I)ds=α

köşeli parantezler Iverson parantezleridir. Bu bir güven aralığı veya bölge için kilit sonuçtur. Şöyle ki bu beklenti , koşullu örnekleme dağıtım altında , bir . Bu sonuç kabul bölgelerinin inşası ile garanti edilir ve ayrıca için de geçerlidir , çünkü olası bir parametre değeridir. Ancak, ilgili bir olasılık ifadesi değildir , çünkü beklentiler olasılık değildir![pC(s,α)]pαppp

Bu beklentinin genellikle yanlış olduğu olasılık, koşuluna bağlı olarak, parametrenin güven bölgesinde kalması ihtimalidir :s=s

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=s|p=p,I)prob(p=p|I)dpprob(s=s|p=p,I)prob(p=p|I)dp

Bu olasılık azaltır sadece bilgi kombinasyonları için ve kabul bölgeleri . Önce düzgün ve, örneğin, örnek dağılımı simetrik olan ve (örn bir Gauss daha sonra da ortalaması olarak):αIA(p,α)spp

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=p|p=s,I)dpprob(s=p|p=s,I)dp=prob(sC(s,α)|p=s,I)=prob(sA(s,α)|p=s,I)

Ayrıca, kabul bölgeleri , o zaman:sA(s,α)sA(s,α)

prob(pC(s,α)|s=s,I)=prob(sA(s,α)|p=s,I)=α

Normal bir istatistik hakkında oluşturulan standart bir güven aralığı olan bir popülasyon ortalaması tahmin etme ders kitabı örneği, önceki varsayımların özel bir durumudur. Bu nedenle, standart% 95 güven aralığı , 0.95 olasılıklı ortalamayı içermektedir; ancak bu yazışmalar genelde geçerli değildir.


-1

Burada bazı ilginç cevaplar var, ancak R kullanarak biraz uygulamalı gösteri ekleyeceğimi düşündüm. Geçenlerde bu kodu, güven aralıklarının nasıl çalıştığını vurgulamak için bir istatistik kursunda kullandık. İşte kod ne yapar:

1 - Bilinen bir dağılımdan örnekler (n = 1000)

2 - Her numunenin ortalaması için% 95 CI değerini hesaplar.

3 - Her bir numunenin CI'sının gerçek ortalamayı içerip içermediğini sorar.

4 - Konsolide gerçek ortalamayı içeren CI'lerin oranını rapor eder.

Senaryoyu sadece birkaç kez koştum ve CI'lerin% 94'ünden daha azının gerçek ortalamayı içerdiğini bulmak çok nadir değil. En azından benim için bu, güven aralığının, gerçek parametreyi içerme% 95 olasılığına sahip olduğu fikrini ortadan kaldırmaya yardımcı oluyor.

#   In the following code, we simulate the process of
#   sampling from a distribution and calculating
#   a confidence interval for the mean of that 
#   distribution.  How often do the confidence
#   intervals actually include the mean? Let's see!
#
#   You can change the number of replicates in the
#   first line to change the number of times the 
#   loop is run (and the number of confidence intervals
#   that you simulate).
#
#   The results from each simulation are saved to a
#   data frame.  In the data frame, each row represents
#   the results from one simulation or replicate of the 
#   loop.  There are three columns in the data frame, 
#   one which lists the lower confidence limits, one with
#   the higher confidence limits, and a third column, which
#   I called "Valid" which is either TRUE or FALSE
#   depending on whether or not that simulated confidence
#   interval includes the true mean of the distribution.
#
#   To see the results of the simulation, run the whole
#   code at once, from "start" to "finish" and look in the
#   console to find the answer to the question.    

#   "start"

replicates <- 1000

conf.int.low <- rep(NA, replicates)
conf.int.high <- rep(NA, replicates)
conf.int.check <- rep(NA, replicates)

for (i in 1:replicates) {

        n <- 10
        mu <- 70
        variance <- 25
        sigma <- sqrt(variance)
        sample <- rnorm(n, mu, sigma)
        se.mean <- sigma/sqrt(n)
        sample.avg <- mean(sample)
        prob <- 0.95
        alpha <- 1-prob
        q.alpha <- qnorm(1-alpha/2)
        low.95 <- sample.avg - q.alpha*se.mean
        high.95 <- sample.avg + q.alpha*se.mean

        conf.int.low[i] <- low.95
        conf.int.high[i] <- high.95
        conf.int.check[i] <- low.95 < mu & mu < high.95
 }    

# Collect the intervals in a data frame
ci.dataframe <- data.frame(
        LowerCI=conf.int.low,
        UpperCI=conf.int.high, 
        Valid=conf.int.check
        )

# Take a peak at the top of the data frame
head(ci.dataframe)

# What fraction of the intervals included the true mean?
ci.fraction <- length(which(conf.int.check, useNames=TRUE))/replicates
ci.fraction

    #   "finish"

Bu yardımcı olur umarım!


2
Eleştiriden dolayı özür dilerim, ancak bu cevabı (geçici olarak) düşürmek zorunda kaldım. Güven aralığının anlamını yanlış anladığına inanıyorum ve içtenlikle bunun sınıfınızda kullanılan argüman olmadığını umuyorum. Simülasyonlar (oldukça ayrıntılı) bir binom örnekleme deneyine indirgenmiştir.
kardinal

5
@ cardinal Şey ... sadece sık sık istatistiklerin uzun süreli yorumunu kullanıyor. Popülasyondan birçok kez örnek alın, CI'yi birçok kez hesaplayın ve gerçek ortalamanın zamanın% 95'ini içerdiğini tespit edin ( ). En azından bu bana oldukça açıktı. 1α=0.95
Néstor,

4
1000 CI örneğindeki "% 94'ten az" kesinlikle CI'lerin% 95'inin ortalamayı içerdiği fikrine karşı kesinlikle önemli bir kanıt değildir. Aslında, bu durumda, CI'lerin% 95'inin gerçekten ortalamayı içermesini beklerdim.
Ronald

3
@Ronald: Evet, bu tam olarak yorumlardaki noktamdı, ama çok daha basit ve kesin bir şekilde söylediniz . Teşekkürler. Yorumlardan birinde belirtildiği gibi , kişi zamanın % 8,7'si kadar 940 başarı veya daha az görecektir ve bu, 1000 deneme boyunca yapılan herhangi bir % 95 CI için geçerlidir . :)
kardinal

2
@JamesWaters: Zaman ayırdığınız için teşekkürler. Kod gayet iyi ancak nasıl "hatalı olduğu örnekleri gösterdiğini" anlamıyorum. Bu amacı açıklayabilir misiniz? Hala burada temel bir yanlış anlaşılma olabileceğinden şüpheleniyorum. CI'nin ne olduğunu ve nasıl doğru bir şekilde yorumlandığını biliyor gibi görünüyorsunuz, ancak simülasyon denemesi yanıt verdiğini iddia ettiğiniz soruya cevap vermiyor. Bu cevabın potansiyeli olduğunu düşünüyorum, bu yüzden karşısına çıkmaya çalıştığınız noktayı netleştirmek için güzel bir düzenleme yapıldığını görmek istiyorum. Şerefe. :)
kardinal
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.