Tam olarak güven aralığı nedir?


86

Bir güven aralığının ne olduğunu kabaca ve gayrı resmi olarak biliyorum. Ancak, kafamı oldukça önemli bir ayrıntıya doyamıyorum: Wikipedia'ya göre:

Bir güven aralığı, parametrenin gerçek değerinin gerçekte elde edilen veriler göz önüne alındığında verilen güven aralığında olma özelliğine sahip olduğunu tahmin etmemektedir.

Aynı zamanda bu sitede birçok yerde benzer noktaları gördüm. Vikipedi'den de daha doğru bir tanım:

tekrarlanan (ve muhtemelen farklı) deneylerin birçok ayrı veri analizine güven aralıkları oluşturulmuşsa, parametrenin gerçek değerini içeren bu aralıkların oranı yaklaşık olarak güven düzeyiyle eşleşir

Yine, bu sitede birçok yerde benzer noktaları gördüm. Anlamadım. Tekrarlanan deneyler altında, gerçek parametre ihtiva bilgisayarlı güven aralıkları fraksiyon ise olduğu , daha sonra bu olasılık nasıl gerçek deney için hesaplanan güven aralığı içindedir başka bir şey olmak ? Cevap olarak aşağıdakileri arıyorum:θ(1α)θ(1α)

  1. Yukarıdaki yanlış ve doğru tanımlar arasındaki ayrımın netleştirilmesi.

  2. İlk tanımın neden yanlış olduğunu açıkça gösteren bir güven aralığı resmi, kesin tanımı.

  3. Temel model doğru olsa bile, ilk tanımlamanın olağanüstü yanlış olduğu bir duruma somut bir örnek.


4
Bu gönderide , güven aralıkları konusunun iyi bir tartışması istatistik.stackexchange.com/questions/2356/… . Bence yazıya atıfta bulunulan makale, yukarıdaki tanımların güven aralıkları için doğru olmasının kesin bir nedeni olduğu konusunda biraz ışık tutmaya yardımcı olduğunu düşünüyorum. CI'lerin nasıl parçalandığını görmek, onları daha iyi anlayabilmek için sık sık görülür.
Olasılık 3

2
Bir parçam soruyu alkışlıyor (+1). Rekabet eden bir kısım şunu belirtmek ister: 1. İstatistik veya tüketici araştırmalarının büyük çoğunluğu, istatistiği pragmatik olarak kullanan ancak kimya veya pazar araştırmalarında kendi amaçlarını ortaya koymak için felsefi olmayan kişiler kullanan kişilerin, sorunların güzelliğini asla kavramayacaklardır. sonuçları açıklamak için zararda olmak. 2. Bazı saf istatistikçiler bile rastgele örneklerle çalışmadıklarında güven aralıklarını içerenler gibi sözde olasılıklı ifadeler yapma tuzağına düşebilirler. Çok daha büyük bir sorun.
rolando2

3
@Mario Varsayımınız doğru değil! Deneyin 100 tekrarından , CI'lerden 95'inin (araçlar değil) gerçek (ancak bilinmeyen) ortalamayı içermesini bekliyoruz . CI rastgeledir, ancak gerçek popülasyon ortalaması değildir.
whuber

6
Cumming & Maillardet (2006) tarafından , çoğaltma araçlarının% 95'inin orijinal CI'ye girmeyeceğini ancak yalnızca% 83,4'ünün (bu değere 'yakalama yüzdesi' adını verdiğini ) gösterdiğini gösteren güzel bir makale var . Bunun nedeni iki değişkenlik kaynağı olmasıdır: A) orijinal ortalamanın değişkenliği etrafında muve B) replikasyonun değişkenliği civarındadır mu. Çoğu kişi A unutma: Orijinal CI necessarliy etrafında inşa edilmez mu!
Felix S

2
İlgilenen okuyucular bu konuyu da görmek isteyebilir: Neden bir% 95 CI,% 95'in ortalamayı kullanma şansı anlamına gelmiyor?
gung

Yanıtlar:


26

Güven aralıkları hakkında düşünürken bu düşünce deneyini faydalı buldum. Ayrıca 3. sorunuzu cevaplar.

Let ve . İki gözlem göz önünde değerleri alınarak ve gözlemler tekabül ve arasında ve izin ve . Daha sonra için% 50 güven aralığı, (aralık içerdiğinden eğer veya , her sahiptir olasılığı ).Y = X + a - 1XU(0,1)Y=X+a12Yy1y2x1x2Xyl=min(y1,y2)yu=max(y1,y2)[yl,yu]aax1<12<x2x1>12>x214

Ancak, eğer o zaman aralığı içerdiğini olasılığı olduğunu biliyoruz olduğunu değil, . İncelik bir yani bir parametre için güven aralığı (rasgele değişkenlerdir) aralığının uç noktaları olasılığı ile parametrenin her iki tarafında uzanması anlamına gelir Eğer aralık hesaplamadan önce , parametre olasılığını değil aralığı içinde hesapladıktan sonra tir .yuyl>12a112z%z% z%


3
neredeyse kesinlikle olduğuna dikkat edin , bu nedenle aralığı sıfır parametresi olan parametresini içerir . Aslında argüman tahmin ettiğiniz şey . Y>a[yl,yu]aθ=a+12

4
Bu sayaç örneğinin geçerli olduğunu sanmıyorum, ancak aralığın içerdiği olasılığını yalnızca o gördükten sonra bir olasılık olduğunu biliyorsunuzdur . Ek bilgi edindikten sonra olasılığın değişmesi son derece makul. Bildiğiniz tek şey, aralığın% 50'lik bir güven aralığı olduğuysa, olasılık hala 1 / 2'dir (her ne kadar uzun vadede frekansı olmayan belirli bir olaya uygulandığı için sıklıkta olan bir Bayesçi olasılığı olmasa da)θyuyl>1/2
Dikran Marsupial

1
Bu gerçekten iyi bir örnek, ancak güven aralığını hesaplamadan önce ve sonra bir şekilde değişen olasılıklarla ilgili ifadelerinize kesinlikle katılmıyorum . Bu hiçbir anlam ifade etmiyor ve matematiğin bir şekilde bildiğiniz ve bilmediğiniz şeylerle ilgilendiği izlenimini veriyor. Öyle değil! Bu , her zaman buna sahip olan . Ayrıca her zaman var olduğunu olduğu . Bu bir çelişki değil, bir tanesi koşulsuz bir olasılık, diğeri ise koşullu bir olasılık. P(a[yl,yu])12P(a[yl,yu]|yuyl>12)1
fgp

2
@fgp, evet, belki de Taylor’ın belki de değişen olasılıklarla ilgili konuşması kötü. Hiçbir olasılık değişmiyor. Argümanın gösterdiği şey, CI'lerin yanlış anlaşıldığını gösteren durumların ortaya çıkmasının ne kadar kolay olduğu mantıklı sorunlara yol açıyor. Eğer gözlemlediğiniz bir CI’nin% 50’nin doğru olma olasılığına sahip olduğunu düşünüyorsanız, ancak doğru olamayacağına inanıyorsanız, o zaman bir CI’nin yanlış olduğunu anlarsınız.
John

36

Güven aralıklarıyla ilgili birçok sorun var, ancak tekliflere odaklanalım. Sorun, doğruluk meselesi olmaktan ziyade olası yanlış yorumlarda yatmaktadır. İnsanlar bir "parametrenin belirli bir olasılığı vardır" derken , parametrenin rastgele bir değişken olduğunu düşünüyorlar. Bu, rastgele değişkenin aralığın kendisi olduğu ve parametrenin belirlendiği, rastgele değil, henüz bilinmediği, (klasik) bir güven aralığı prosedürünün bakış açısı değildir. Bu yüzden bu tür ifadelere sıkça saldırılmaktadır.

Matematiksel olarak, izin eğer veri haritalar bir prosedür olabilir parametre alanı alt kümeleriyle ve (parametre değeri ne olursa olsun, eğer onaylama işlemi olabilir) , olayını tanımlar , sonra - tanım gereği - bir olasılık vardır olası bir değeri için . Tüm güven ile bir güven aralığı işlemdir sonra bu olasılığı (tüm parametre değerleri üzerinden) bir infimum olması gerekiyordutx=(xi)θθt(x)A(x)Prθ(A(x))θt1α1α. (Bu kritere göre, genellikle kısa güven aralıkları veya simetrik olanlar üretme gibi bazı ek özellikleri optimize eden prosedürleri seçeriz, ancak bu ayrı bir meseledir.) Büyük Sayıların Zayıf Yasası ikinci teklifi haklı çıkarır. Ancak bu, güven aralıklarının bir tanımı değildir: yalnızca sahip oldukları bir özelliktir.

Bu analizin 1. soruyu cevapladığını, 2. sorunun öncülünün yanlış olduğunu ve 3. soruyu tartışmaya soktuğunu düşünüyorum.


3
Mükemmel bir soruya cevap verdiğiniz için teşekkür ederiz. Daha fazla tartışma için aşağıdaki analojiyi ortaya çıkarabilir miyim? Diyelim ki defalarca adil bir yazı tura atarım. Ardından, . Şimdi, bir kez yazı tura atarım, ama size ne çevirdiğimi gösterme ve şunu sorarım: "Başların ortaya çıkma olasılığı nedir?". Bu soruya nasıl cevap verirsiniz? P(Head)=.50
Wolfgang

3
Bunu ifade etmenin bir başka yolu: Bayesliler için, olasılığı olabilecek tek “şeyler” muhtemel olaylardır - rastgele bir deneyin gelecekteki sonuçları anlamında. Parametrenin sabit bir gerçek değeri olduğu göz önüne alındığında, belirli değerlere sahip bir aralığınız olduğunda, parametrenin aralığa dahil edilip edilmemesi artık olası bir olay değildir. Sonuç olarak, aralıkları oluşturan süreçte güvene sahip olabilirsiniz, ancak iki spesifik sayıya değil.
caracal

1
@caracal - düşünce için sadece bazı yiyecekler, her gerçekten "rastgele" bir "para çevirme" mi? Eğer "evet" derseniz, bir madalyonun gelip gelmeyeceği pek çok şeyin belirleyici (fakat karmaşık) bir fonksiyon olduğu fikrini reddedersiniz. .). Bu, CI tabanlı düşünme için geçerli olan "rastgelelik" in çift ​​standardını göstermektedir, Veriler sabittir, ancak değeri konusunda belirsiziz (ergo verileri rastgeledir ), parametreler sabitken , ancak değeri konusunda belirsiziz ( ergo parametreleri rastgele değildir ).
Olasılık

4
@Wolfgang Örneğinizin güven aralıklarıyla nasıl ilgili olduğunu anlamıyorum. Dağıtım parametresiyle ilgili hiçbir şey istemezsiniz. Durumunuz, tahmin aralıkları ile en yakından ilgilidir . Bütün bu tartışmanın bu bağlamda bir ilgisi olabileceğini düşünüyorum, ancak güven aralıkları ile ilgili bir konuya ait değil.
whuber

2
@whuber Gerçek bilinmeyen parametreyi yakalayan belirli bir% 95 CI için olasılık ifadesi yapıp yapamayacağı sorusu, sonucun hala bilinmediği belli bir çeviride olasılık ifadesi yapıp yapamayacağı sorusuna çok benzer. Uzun vadede, CI'lerin% 95'i parametreyi yakalayacaktır. Uzun vadede, kliplerin% 50'si kafadır. Belirli bir CI'nin parametreyi yakalama şansı% 95 olduğunu söyleyebilir miyiz? Bakmadan önce kafaların kalkma ihtimalinin% 50 olduğunu söyleyebilir miyiz? İkisine de evet derdim. Ancak bazı insanlar aynı fikirde olmayabilir.
Wolfgang

19

CI'ların tanımını yanlış olarak adlandırmam ama birden fazla olasılık tanımı olması nedeniyle yanlış yorumlamaları kolaydır. CI'ler aşağıdaki Olasılık tanımına dayanmaktadır (Frequentist veya ontolojik)

(1) Bir teklifin olasılığı = teklifin gerçek olduğu gözlenen sürelerin uzun süreli oranı, veri üretme sürecine bağlı

Dolayısıyla, bir CI kullanımında kavramsal olarak geçerli olmak için, bu olasılık tanımını kabul etmelisiniz . Bunu yapmazsanız, o zaman aralığınız teorik bir bakış açısına göre bir CI değildir.

Bu nedenle, "olasılık uzunluğunun" tanımının kullanılmakta olduğunu açıkça ortaya koymak için, olasılık kelimesini orantılı kelime olarak kullandık.

Olasılığın temel alternatif tanımı (tümdengelimli Mantık veya Bayesyeninin bir uzantısı olarak epistemolojik veya olasılık)

(2) Bir teklifin olasılığı = teklifin doğru olduğuna, bir bilgi durumuna bağlı olduğuna dair rasyonel inanç derecesi

İnsanlar çoğu zaman sezgisel olarak bu tanımların her ikisini de karıştırır ve sezgilerine hitap etmek için hangi yorumu yaparlarsa kullanın. Bu sizi her türlü kafa karıştırıcı duruma sokabilir (özellikle bir paradigmadan diğerine geçtiğinizde).

İki yaklaşımın çoğu zaman aynı sonuca ulaştığı, bazı durumlarda sahip olduğumuz anlamına gelir:

Teklifin doğru olduğuna dair rasyonel inanç derecesi; bilgi durumuna bağlı olarak = teklifin doğru olduğu zamanların uzun dönem oranı, veri üretme sürecine bağlı

Mesele evrensel olarak geçerli olmamasıdır , bu yüzden iki farklı tanımlamanın daima aynı sonuçlara yol açmasını bekleyemeyiz. Yani, aslında Bayesian çözümünü çözmezseniz ve daha sonra aynı aralık olduğunu bulamazsanız, CI tarafından verilen değeri, gerçek değeri içerme olasılığı olarak veremezsiniz. Ve yaparsanız, aralık o zaman bir Güven Aralığı değil, Güvenilir bir Aralıktır.


2
Tanım 1'e göre bir önerme ihtimalinin neden rasyonel bir sayı olması gerektiğini anlamıyorum. Uzun dönem oranı , teklifin doğru olduğu gözlemlenen oranların sınırına işaret ediyor gibi görünmektedir. Her oran rasyonel bir sayıdır ancak limitleri olmayabilir. (Neyse ki, senin bu parantez Cevabınız geri kalanına en iyi ihtimalle teğet görünüyor.)
Did

3
@probability Bu cevap bizi çok yapıcı olmayan bir teğet telaşa düşürüyor gibi görünüyor. Olasılığın ve oranın eşitlenmesi, bir termometredeki cıva seviyesi ile bir sıcaklığın eşitlenmesine benzeyen bir ontolojik karışıklık şeklidir: biri teorik bir yapı, diğeri ise onu ölçmek için kullanılan fiziksel bir fenomendir. İstatistik.stackexchange.com/questions/1525/… adresinde bununla ilgili bir tartışma var .
whuber

@Didier - haklısın, aslında x_n , Bu irrasyonel limit ile rasyonel terimlerdir. Bu notu kaldırdım. Bunu getirdiğin için teşekkürler. xn=r2xn1+xn12r
Olasılık 20

6
@whuber - Mesele ortaya çıkmakla ilgilidir çünkü tam da bu yanlış anlama, insanları CI'leri yanlış şekilde yorumlamaya yönlendirir. Olasılığı "rasyonel inanç derecesi" ile karıştırmak, frekansçı paradigma ile tutarlı değildir. Bu, CI'leri "gerçek değerin aralık içinde olma olasılığı" anlamına geldiğinde aldığın şeydir, bu, @ dsimcha'nın soruda yaptığı şey.
Olasılıksal

1
@probability Açıklama için teşekkürler. Cevabınızı "olasılık = oran" tanımına uygun olduğunu anladım. Aslında, sıkı bir yeniden okuma hala yorumunuzun bunu yanlış anlama olarak nitelendirmesine rağmen, üçüncü paragrafta söylediğiniz şeyin bu olduğunu öne sürüyor. Bu noktayı netleştirmek isteyebilirsiniz.
whuber

6

RA Fisher, güven aralıklarının kullanışlılığına ilişkin bir kriter getirdi: Bir CI, farklı bir güven düzeyi anlamına gelen "tanımlanabilir alt grupları" kabul etmemelidir. Çoğu (hepsi değilse) karşı örneklerde, farklı kapsam olasılıkları olan tanımlanabilir altkümelerin olduğu durumlarımız vardır.

Bu durumlarda, parametrenin nerede olduğu hakkında sübjektif bir anlam belirtmek için Bayesian kimlik aralıklarını kullanabilir ya da verilere verilen parametrede göreceli belirsizliği yansıtmak için bir olasılık aralığı oluşturabilirsiniz.

Örneğin, nispeten çelişkili görünmeyen bir vaka, nüfus ortalaması için 2 taraflı normal güven aralığıdır. Verilen std. Normal bir popülasyondan örnekleme varsayarak,% 95 CI parametre hakkında daha fazla bilgi sağlayacak hiçbir tanımlayıcı alt grubun olmadığını kabul eder. Bu, örnek ortalamasının olasılık fonksiyonunda yeterli bir istatistik olduğu gerçeğiyle görülebilir - yani, olasılık fonksiyonunu, örnek ortalamasını öğrendiğimizde bireysel örnek değerlerinden bağımsızdır.

Normal ortalama için% 95 simetrik CI'ya sübjektif güvenmemizin nedeni, belirtilen kapsam olasılığından daha az ve normal ortalama için simetrik% 95 CI'nin "en yüksek olabilirlik" aralığı, yani hepsi aralık içindeki parametre değerleri, aralık dışındaki parametre değerlerinden daha yüksek bir olasılığa sahiptir. Bununla birlikte, olasılık bir olasılık olmadığından (uzun dönem doğruluk anlamında), daha çok öznel bir kriterdir (Bayes önceki ve olasılık kullanımında olduğu gibi). Özetle,% 95'in kapsayıcılık olasılığına sahip normal ortalama için sonsuz sayıda aralık vardır, ancak yalnızca simetrik CI, aralıklı bir tahminden beklediğimiz sezgisel olasılıklara sahiptir.

Bu nedenle, RA Fisher'ın kriteri, kapsama olasılığının yalnızca bu tanımlanabilir altkümelerin hiçbirini kabul etmediği durumlarda öznel güven ile eşitlenmesi gerektiği anlamına gelir. Alt kümeler varsa, kapsam olasılığı alt kümeyi tanımlayan parametrelerin gerçek değerlerine bağlı olacaktır. Sezgisel güven düzeyine sahip bir aralık elde etmek için aralık aralığını alt kümeyi tanımlamaya yardımcı olan uygun yardımcı istatistiklere göre ayarlamanız gerekir. VEYA, doğal olarak parametreleri rastgele değişkenler olarak yorumlamaya (yani Bayesian istatistikleri) yol açan dağılma / karışım modellerine başvurabilir ya da olabilirlik çerçevesinde profil / koşullu / marjinal olasılıkları hesaplayabilirsiniz. Her iki durumda da, nesnel olarak doğrulanabilir bir olasılıkla doğru olma olasılığını ortaya koyma umudunu bıraktınız,

Bu yardımcı olur umarım.


1
(+1) Simetrik Normal CI'yi doğrulamanın bir yolu, beklenen uzunluğu en aza indirmesidir. Nihayetinde bu, öznellikten bir karar prosedüründe bir kayıp fonksiyonu olarak uzunluk seçimine geri itiyor: ancak bu tartışmalı bir şekilde “iyi” bir öznellik türü (çünkü analitik hedeflerimizin istatistiksel prosedür seçimimizdeki rolünü ortaya koyduğu için) "Kötü" öznellik, sadece bazı aşağılayıcı epitel gibi geliyor.
whuber

5

Bir itibaren teorik perspektif Sorular 2 ve 3 tanımlamalar yanlış olduğunu yanlış varsayıma dayanmaktadır. Bu yüzden @ whuber'in bu konudaki cevabı ile aynı fikirdeyim ve @ whuber'in 1. soruya cevabı benden herhangi bir ek girdi gerektirmiyor.

Bununla birlikte, daha pratik bir perspektiften , aynı bilgiye dayanan bir Bayesian güvenilir aralığı ile sayısal olarak aynı olduğunda (yani bilgi vermeyen bir önceki), sezgisel tanımına (gerçek değerin bulunma olasılığı) bir güven aralığı verilebilir.

Ancak bu, zorlu anti-bayesyen ölümü için biraz bulaşıcıdır, çünkü CI'sine vermek istediği yorumu vermek için gereken koşulları doğrulamak için, sezgisel yorumlamanın otomatik olarak tuttuğu Bayesian çözümünü çözmeleri gerekir!

En kolay örnek, bilinen bir varyans olan normal ortalama için güven aralığı ve posterior güvenilir aralık .1αx¯±σZα/21αx¯±σZα/2

Koşullardan tam olarak emin değilim, ancak aşağıdakilerin CI'lerin sahip olduğu sezgisel yorumlaması için önemli olduğunu biliyorum:

1) dağılımı parametrelerden bağımsız olan bir Pivot istatistiği var (normal ve ki-kare dağılımlarının dışında tam pivotlar var mı?)

2) sıkıntı parametresi yoktur (CI'leri yaparken sıkıntı parametrelerinin ele alınması gereken kesin yöntemlerden biri olan Pivotal istatistik hariç )

3) ilgilenilen parametre için yeterli bir istatistik var ve güven aralığı yeterli istatistiği kullanıyor

4) Yeterli istatistik ve posterior dağılımın örnekleme dağılımı, yeterli istatistik ile parametre arasında bir çeşit simetriye sahiptir. Normal durumda, örnekleme dağılımı simetri içinde iken .(x¯|μ,σ)N(μ,σn)(μ|x¯,σ)N(x¯,σn)

Bu koşulları bulmak genellikle zordur ve genellikle Bayesian aralığını hesaplamak ve karşılaştırmak daha kolaydır. İlginç bir alıştırma da, "CI'm de ne kadar güvenilir bir aralıktır?" Sorusunu denemek ve cevaplamak olabilir. Buna daha önce bakarak CI prosedürünüzle ilgili bazı gizli varsayımları keşfedebilirsiniz.


1
(+1) Gerçekten "Bayes karşıtı" diye bir insan var mı? :-)
whuber

6
@whuber İşte bir tane . Ve işte istatistik felsefesinde burs konusunda işbirliği yapan bir ekonometri .
Cyan

1
Teşekkürler! Bu, farkında olmadığım olasılık ve istatistik felsefesinde oldukça ilginç bir konu.
whuber

1
eksik olarak yanlış yazdın mı ? x¯±zα/2σnn
qazwsx

3

Bunu anlamak zor olabilir:

  • ortalama olarak tüm güven aralıklarının% 95'i parametre içerecekse
  • ve belirli bir güven aralığına sahibim
  • neden bu aralığın parametreyi içerme olasılığı da% 95 değil?

Bir güven aralığı, örnekleme prosedürü ile ilgilidir. Çok sayıda örnek alıp her örnek için% 95'lik bir güven aralığı hesaplarsanız, bu aralıkların% 95'inin nüfus ortalamasını içerdiğini görürsünüz.

Bu, örneğin endüstriyel kalite departmanları için kullanışlıdır. Bu adamlar birçok örnek alıyorlar ve şimdi tahminlerinin çoğunun gerçeğe oldukça yakın olacağına güveniyorlar. Tahminlerinin% 95'inin oldukça iyi olduğunu biliyorlar, ancak her bir özel tahmin için bunu söyleyemiyorlar.

Bunu haddeleme zarlarıyla karşılaştırın: 600 (adil) zar atmanız durumunda, kaç tane 6 atarsınız? En iyi tahmininiz * 600 = 100.16

Bununla birlikte, BİR ölümü attıysanız, şunu söylemenin bir faydası yoktur: "Şimdi 6 attığım% 1/6 veya% 16,6 olasılık var". Neden? Çünkü kalıp 6 ya da başka bir rakam gösterir. 6 fırlattın ya da atmadın. Bu nedenle olasılık 1 veya 0'dır. Olasılık olamaz .16

Atmadan önce ONE kaleme sahip bir 6 atma olasılığının ne olacağı sorulduğunda, bir Bayes dili " " cevabını verir (önceki bilgilere dayanarak: herkes bir kalıbın 6 tarafı ve eşit şansı olduğunu bilir) bunlardan birine düşmemesi), ancak bir Frequentist "Fikrim yok" diyecektir, çünkü sıklık sadece önceklere veya dışsal bilgilere dayanarak verilere dayanmamaktadır.16

Aynı şekilde, sadece 1 numuneniz varsa (dolayısıyla 1 güven aralığı), popülasyon ortalamasının bu aralıkta ne kadar muhtemel olduğunu söyleyemezsiniz. Ortalama (veya herhangi bir parametre) içinde veya değil. Olasılık 1 ya da 0'dır.

Ayrıca, Güven Aralığı içindeki değerlerin, bunun dışındakilerden daha muhtemel olduğu doğru değildir. Küçük bir örnek yaptım; her şey ° C cinsinden ölçülür. Unutmayın, su 0 ° C'de donar ve 100 ° C'de kaynar.

Durum: Soğuk bir gölde, buzun altında akan suyun sıcaklığını tahmin etmek istiyoruz. Sıcaklığı 100 noktada ölçüyoruz. İşte verilerim:

  • 0,1 ° C (49 noktada ölçülmüş);
  • 0.2 ° C (ayrıca 49 noktada);
  • 0 ° C (. 1 konumda Bu su olduğu gibi donma noktasına);
  • 95 ° C (bir yerde, yasadışı olarak göle çok sıcak su döken bir fabrika var).
  • Ortalama sıcaklık: 1.1 ° C;
  • Standart sapma: 1.5 ° C;
  • % 95 -CI: (-0.8 ° C ...... + 3.0 ° C).

Bu güven aralığında sıcaklıkların kesinlikle dışardakinden daha olası DEĞİLDİR. Bu gölde akan suyun ortalama sıcaklığı 0 ° C'den düşük olamaz, aksi takdirde su değil buz olur. Bu güven aralığının bir kısmı (yani, -0.8'den 0'a kadar olan bölüm) , gerçek parametreyi içerme ihtimalinin% 0 olma ihtimaline sahiptir.

Sonuç olarak: güven aralıkları sıkça kullanılan bir kavramdır ve bu nedenle tekrarlanan örnekler fikrine dayanır. Eğer birçok araştırmacı bu gölden örnek alabilseydi ve tüm bu araştırmacılar güven aralıklarını hesaplarsa, bu aralıkların% 95'i gerçek parametreyi içerecektir. Ancak, tek bir güven aralığı için, doğru parametreyi içerme ihtimalinin ne kadar düşük olduğunu söylemek mümkün değildir.


1
Frekansist istatistiğin inancı, önceden inanan ve güncelleyen frekansçı bir kişiyle ölçmemesi gerçeğini karıştırmayın. Aradaki fark, frekans uzmanının veri dışında hiçbir bilgisi olmayan bir aptal olup olmadığı değil, frekans uzmanının inanç durumlarının doğrudan ölçülerini sağlayıp sağlamadığıdır. Araştırmacı, testlere, CI'lara vb. Dayanarak inançlarını güncellemelidir, aksi halde tüm sistemler çalışmaz, çünkü her şey alınan kararlara bağlıdır.
John,

2

Tamam, klasik frekans yöntemlerini kullanarak bir parametre için% 95 güven aralığı hesapladığınızda, parametrenin bu aralıkta kalma olasılığı% 95 olduğu anlamına gelmez. Ve yine de ... soruna bir Bayesian perspektifinden yaklaştığınızda ve parametre için% 95'lik güvenilir bir aralık hesapladığınızda , klasik yaklaşımı kullandığınız zamanla aynı ( önceden bilgilendirici olmayan bir varsayım varsayarak) elde edersiniz. Bu nedenle, bir veri kümesinin ortalaması için% 95 güven aralığını (örneğin) hesaplamak için klasik istatistikleri kullanırsam, o zaman parametrenin o aralıkta kalma olasılığı% 95 olduğu doğrudur.


5
Sıkça güven aralıkları ve Bayesçi güvenilir aralıkları kullanarak aynı sonucu elde edip etmediğiniz, probleme ve özellikle de Bayes yaklaşımında kullanılan önceki dağılıma bağlıdır. Matematik ve fen bilimlerinde de haklı olduğunuzda doğru sebepten dolayı haklısınız!
Dikran Marsupial

4
"[A parametresi] için% 95 güven aralığını hesaplamak için klasik istatistikleri kullanırsanız", o zaman tutarlı bir şekilde mantıklı davranıyorsanız, "parametrenin bu aralıkta kalma olasılığı" anlamına gelmek anlamsızdır . Bu olasılıktan bahsettiğiniz an, durumun istatistiksel modelini değiştirdiniz. Parametrenin rastgele olduğu yeni modelde, frekansçı yöntemler kullanarak bir CI hesaplamak yanlıştır. Bazı durumlarda bu şekilde doğru cevabı elde etmek ilginçtir, ancak bunun altında yatan kavramsal karışıklığı haklı çıkarmaz.
whuber

4
@whuber - öncülünüz "... sürekli mantıklıysanız ..." eski güzel Cox teoreminin bir sonucudur. Tutarlı bir şekilde muhakkak davranıyorsanız, çözümünüzün matematiksel olarak Bayesian ile aynı olması gerektiğini söylüyor. Bu nedenle, bu öncül verildiğinde, bir CI mutlaka güvenilir bir aralığa denk olacaktır ve bir olasılık olarak yorumlanması geçerli bir yorumdur. Bayes'te dağılımı olan parametre değil, dağılımı olan parametre hakkındaki belirsizliktir.
olasılık

2
... devamı ... Yani bir Bayesli olduğum aptalca bir oyun oynayabilir "Prob bu aralık aralığındadır", ben sık sık "Ben bir aralık parametresini kapsayan prob", ben bir Bayesliyim ..., ben sıkıcıyım, ..., ben bir Bayesiyim ..., ben sıkıcıyım, ..... her zaman gerçek hesaplamanın sayıları asla değişmez
olasılık 26

2

Frequentist güven aralığı hakkında soruyorsun . Tanım (2 alıntıdan hiçbirinin bir tanım olmadığını unutmayın! Her ikisi de doğru olan ifadeler):

Bu deneyi çok kez tekrarlamış olsaydım, bu takma model bu parametre değerleri ile birlikte verilmişse , deneylerin% 95'inde bir parametrenin tahmini değeri bu aralıkta düşecekti.

Bu nedenle bir modeliniz (gözlemlenen verilerinizi kullanarak oluşturulmuş) ve tahmin edilen parametrelerini kullanıyorsunuz. Daha sonra , bu modele ve parametrelere göre bazı varsayımsal veri kümeleri oluşturursanız , tahmin edilen parametreler güven aralığı içerisinde olur.

Dolayısıyla, bu sık görüşlü yaklaşım modeli ve tahmin edilen parametreleri olduğu gibi sabit olarak alır ve verilerinizi belirsiz olarak görür - birçok diğer olası verinin rastgele bir örneği olarak.

Bu yorumlamak gerçekten zordur ve bu genellikle Bayesian İstatistik (bir argüman olarak kullanılmaktadır Bazen biraz tartışmalı olabilir mi . Öte yandan Bayesian istatistikler belirsiz olarak sabit ve davranır parametre olarak veri alır. Bayesian güvenilir aralıklar vardır o zaman beklediğiniz gibi aslında sezgisel: bayesyen güvenilir aralıklar% 95 ile gerçek parametre değerinin yattığı aralıklardır.

Ancak pratikte çoğu kişi sık sık güven aralıklarını Bayesçenin güvenilir aralıklarıyla aynı şekilde yorumluyor ve birçok istatistikçi bunu büyük bir sorun olarak görmüyor - hepsi bilseler de,% 100 doğru değil. Ayrıca pratikte, bayezyen bilgisiz öncüller kullanıldığında , sık ve bayes güven / inandırıcı aralıklar çok farklı olmayacaktır .


-1 "Tanımınız" yanlış görünüyor, en azından bir tanesinde okuyunuz. Cl kapsayacak şekilde imal edilir , gerçek bir olasılık ile parametre . Belirli bir model veya parametrelerin yerleştirilme yöntemine bağlı değildir. Belki de tanımı yanlış okuyorum: Bu parametre ile ilgili şu anki tahmininizi ifade etmek için "bu takılı modeli bu parametre değerine sahip" olarak alıyorum . Eğer öyle bir şey yapmadıysanız, belki de bu noktayı netleştirebilirsiniz. 1 - α1α1α
whuber

@whuber, Tamam, Anladım, ancak tanımımın yanlış olduğunu söylerseniz, lütfen CI'nin tam tanımını gönderin.
Meraklı

Yorumumu açıklığa kavuşturdum Tomas, çünkü bana göre tanımınızı niyet etmediğiniz bir şekilde okuyor olabilirim. Kiefer, İstatistiki Çıktıya Giriş , "[T] denemenin sonucunun olduğunu yazıyor: [S], prosedürünü tahmininde ve gerçek değerini tahmin etmek için kullandığını yazıyor olan ... [T] o miktarı .. .bir sayı adlandırılır güven katsayısı prosedürü ... adlandırılan birXt=[L,U]ϕ(θ)θθ0γt(θ0)=Prθ0{L(X)ϕ(θ0)U(X)}γ¯t=infθΩγt(θ)ttgüven aralığı. "
whuber

@whuber, tanımınız benim için gerçekten anlaşılmaz ve çoğu insan için de korkuyorum :) Ve evet, şu anki kastetmiştim, sık sık bayesin zıttı olarak parametre tahminini ve rastgele olarak parametre tahminini aldıkça.
Merakla

3
Meraklı tanımınızdaki ana sorunun, "... bir parametrenin tahmini değeri aralık içinde olacağını düşünüyorum." Tahmini bir parametre değil, bilinmeyen bir sabit parametredir; ve aralık içinde kalmaz, aralık hareket eder ve zamanın% 95'i parametreyi yakalar.
John,

2

Diyelim ki basit bir durumdayız. Bilinmeyen bir parametre var ve bir tahmincisi (gayri) 1 civarında bir tutarsızlık vardır. Sence (gayri) olmalıdır en sık.θTθθ[T1;T+1]

Gerçek bir deneyde olduğunu gözlemlediniz .T=12

"Gördüklerime bakıldığında ( ), olasılığı nedir?" sorulması doğaldır . Matematiksel: . Herkes doğal olarak bu soruyu sorar. Güven aralığı teorisi bu soruya mantıklı cevap vermelidir. Ama öyle değil.T=12θ[11;13]P(θ[11;13]|T=12)

Bayes istatistikleri bu soruya cevap veriyor. Bayesian istatistiklerinde, gerçekten hesaplayabilirsiniz . Ancak , deneyi yapmadan ve gözlemlemeden önce bunun için bir dağıtım olduğunu varsaymanız gerekir . Örneğin :P(θ[11;13]|T=12)θT

  • da önceki bir dağıtım üniformasına sahip olduğunu varsayınθ[0;30]
  • bu deneyi yap, bulT=12
  • Bayes formülünü uygulayın:P(θ[11;13]|T=12)=0.94

Ancak sık kullanılan istatistiklerde önceden bir şey yoktur ve bu nedenle gibi bir şey yoktur. Bunun yerine istatistikçiler şey böyle söylüyorum: "Ne olursa , olasılığıdır olduğu ". Matematiksel: "İçeride ISTV melerin RWMAIWi'nin İçeride ISTV melerin RWMAIWi'nin [ T - 1 ; T + 1 ]P(θ...|T...)θθ[T1;T+1]0.95θ,P(θ[T1;T+1]|θ)=0.95

Yani :

  • Bayesian: içinP(θ[T1;T+1]|T)=0.94T=12
  • Sıkça :θ,P(θ[T1;T+1]|θ)=0.95

Bayesian ifadesi daha doğaldır. Sıklıkla, sık konuşma ifadesi kendiliğinden Bayesian ifadesiyle yanlış yorumlanır (yıllardır istatistik kullanmayan herhangi bir normal insan beyni tarafından). Ve dürüst olmak gerekirse, birçok istatistik kitabı bu noktayı netleştirmiyor.

Ve pratikte?

Pek çok olağan durumda, gerçek, sık ve Bayesçi yaklaşımların edindiği olasılıkların çok yakın olmasıdır. Bu nedenle, Bayesci için sıkça yapılan ifadenin kafa karıştırıcı olmasının çok az sonuçları vardır. Ancak "felsefi" çok farklı.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.