“Gerçek kapsam olasılığı” hesaplanması, “güvenilir aralık” hesaplamasıyla aynı şey midir?


10

Giriş seviyesi istatistik ders kitabı okuyordum. Binom dağılımlı verilerde başarı oranının maksimum olasılık tahmini hakkındaki bölümde, bir güven aralığını hesaplamak için bir formül verdi ve daha sonra dikkatsizce bahsedildi

Gerçek kapsama olasılığını, yani yöntemin gerçek parametre değerini yakalayan bir aralık üretme olasılığını göz önünde bulundurun. Bu, nominal değerden biraz daha az olabilir.

Ve muhtemelen gerçek kapsama olasılığını içeren alternatif bir "güven aralığı" oluşturma önerisiyle devam ediyor.

İlk kez nominal ve gerçek kapsama olasılığı fikri ile karşı karşıya kaldım. Burada eski sorulardan geçerken, bunun için bir anlayış bulduğumu düşünüyorum: olasılık olarak adlandırdığımız iki farklı kavram var, ilki henüz gerçekleşmemiş bir olayın belirli bir sonuç üretmesi ve ikincisi gözlemci bir ajanın halihazırda meydana gelen bir olayın sonucu için tahmininin ne kadar doğru olduğudur. Ayrıca güven aralıklarının sadece ilk olasılık türünü ölçtüğü ve “güvenilir aralıklar” denilen şeyin ikinci olasılık türünü ölçtüğü görülmüştür. Özet olarak, güven aralıklarının "nominal kapsam olasılığı" hesaplayanlar ve güvenilir aralıkların "gerçek kapsam olasılığı" nı kapsayan varsayımlar olduğunu varsaydım.

Ama belki kitabı yanlış yorumladım (sunduğu farklı hesaplama yöntemlerinin bir güven aralığı ve güvenilir bir aralık için mi, yoksa iki farklı güven aralığı için mi olduğu tamamen açık değil) veya daha önce geldiğim diğer kaynaklar şimdiki anlayışım. Özellikle başka bir soru üzerine aldığım bir yorum,

Bayes için güven, sıklık için güven aralıkları

sonuçlardan şüphe duymamı sağladı, çünkü kitap bu bölümde bir Bayes yöntemi tanımlamıyordu.

Bu yüzden, anlayışımın doğru olup olmadığını veya yolda mantıklı bir hata yapıp yapmadığımı açıklığa kavuşturun.


Nominal kapsam olasılığı "hedef" kapsam olasılığıdır: bir güven aralığı sağlayan bir yöntem elde ettiğimizde elde etmeye çalıştığımız olasılık. Gerçek kapsam "gerçek" kapsamdır. Bazı insanlar , gerçek kapsama alanı nominal kapsama eşit olduğunda güven aralığının tam olduğunu söyler . Scotchi ve Unwisdom, güven aralığının asla ayrık veriler için kesin olmadığını belirtmişlerdir. Başka bir örnek, asimptotik bir güven aralığı kullandığımız zamandır: sadece olduğunda . Fikrinizi tamamen anlıyorum çünkü "gerçek" aynı zamanda "şimdiki" ile eşanlamlıdır. n
Stéphane Laurent

Yanıtlar:


5

Genel olarak, ayrı bir dağıtımla çalışırken gerçek kapsama olasılığı asla nominal olasılığa eşit olmayacaktır.

Güven aralığı, verilerin bir fonksiyonu olarak tanımlanır. Binom dağılımı ile çalışıyorsanız, sadece son derece çok sayıda olası sonuç vardır ( kesin olarak ), bu yüzden sadece son derece olası birçok güven aralığı vardır. parametresi sürekli olduğundan, kapsama olasılığının ( bir fonksiyonu olan ) yaklaşık% 95'ten (ya da her neyse) daha iyi sonuç veremeyeceğini görmek oldukça kolaydır .n+1pp

CLT'ye dayanan yöntemlerin nominal değerin altında kapsama olasılıklarına sahip olacağı genellikle doğrudur, ancak diğer yöntemler aslında daha muhafazakar olabilir.


1
Tanımın yararlı bir resmi ifadesi: ve bilinmeyen bir parametre örnek alanı verildiğinde , güven yordamı bir çift işlevinden oluşur daBu ifadenin sol tarafı (bunun θ'ya bağlı olduğunu unutmayın) ve RHS nominal güven seviyesidir . LHS'nin sonsuz ( üzeri ) RHS'ye eşitse, prosedür tamdır . Ω,F,Pθ1α LU:ΩR
P[{ωΩ|[L(ω),U(ω)]θ}]1α.
coverage probabilityΩ
Unwisdom

8

Bayes güvenilir aralıkları ile sık sık güven aralıklarıyla ilgisi yoktur. % 95 (diyelim) güven aralığı, parametrenin gerçek değeri ne olursa olsun en az % 95 kapsama alanı olarak tanımlanırπ. Dolayısıyla, nominal kapsam% 95 olduğunda, gerçek kapsam% 97 olabilir.π=π1,% 96.5 olduğunda π=π2, ancak değeri olmadan π% 95'in altında mı? Konu (yani, nominal ve gerçek kapsama alanı arasında bir tutarsızlık) binom gibi ayrı dağılımlarla ortaya çıkar.

Bir örnek olarak, x başarıları n başarı olasılığı bilinmeyen binom denemeleri π:

xπUPr(X=x|π=0.7)I(πU0.7)00.39303780.000729010.58180340.010206020.72866160.059535130.84683890.185220140.93715010.324135150.99148760.302526161.00000000.1176491
İlk sütun, gözlemlenen olası değerlerini gösterir . İkincisi, her durumda hesaplayacağınız kesin üst güven sınırlaması gösterir. Şimdi diyelim ki : üçüncü sütun, bu varsayım altında gözlemlenen her değerinin olasılığını gösterir ; dördüncü, hangi durumlarda hesaplanan güven aralığının gerçek parametre değerini kapsadığını gösterir ve bunları ile işaretler . Güven aralığının gerçek değeri kapsadığı durumlar için olasılıkları , gerçek kapsamı . farklı gerçek değerleri içinx 95%πU=π:[Pr(X>x|π)=0.95]π=0.7x10.989065π, gerçek kapsam farklı olacaktır:

coverages

Nominal kapsam ancak gerçek parametre değerleri elde edilebilir üst sınırlarla çakıştığında elde edilir.

[Sorunuzu tekrar okudum ve yazarın gerçek değerin nominal kapsam olasılığından daha az olabileceğini söylediğini fark ettim . Bu yüzden, güven aralığını hesaplamak için yaklaşık bir yöntemden bahsettiklerini düşünüyorum, ancak yukarıda söylediğim şey hala devam ediyor. Grafik, yaklaşık bir ortalama güven seviyesi bildirmeyi önerebilir, ancak — bilinmeyen bir parametrenin değerlerini ortalamak mı?]98%

† Gerçek kapsama alanının hiçbir zaman değerinin nominal kapsamından daha az olmaması ve - @ Unwisdom'un anlamındaki bazı değerler için buna eşit olmaması, @ Stephane's için tam olarak.ππ

Upper Üst ve alt sınırları olan aralıklar elbette daha yaygın olarak kullanılır; ancak açıklanması biraz daha karmaşıktır ve yalnızca bir üst sınır ile dikkate alınması gereken tek bir kesin aralık vardır. (Bkz. Blaker (2000), "Ayrık dağılımlar için güven eğrileri ve iyileştirilmiş kesin güven aralıkları", Kanada İstatistik Dergisi , 28 , 4 ve referanslar.)


Cevap verdiğiniz için teşekkür ederim. Şimdi gerçek kapsama olasılığının ne olduğunu bildiğime göre, bu sorudaki kullanıcının neden güvenilir ve güven aralıkları arasındaki farkı açıklayan sorulara gönderildiğini tahmin ediyor musunuz? Burada gerçek / nominal kapsama probunun olduğu fikrini aldım. ikilik ilişkilidir. stats.stackexchange.com/questions/63922/…
rumtscho

Muhtemelen OP sadece "nominal" ve "gerçek" terimlerini gördüğü yere bir bağlantı verdiğinden (sizin yaptığınız gibi soruda özetlemek veya alıntı yapmak yerine) ve ardından sorunun geri kalanını, bu bağlamda kullanın.
Scortchi - Monica'yı eski durumuna döndürün

2

Farkın aslında güven aralıkları hesaplanırken yapılan tahminlerin kullanımı ile ilgili olduğunu düşünüyorum. Örneğin, oldukça standart CI

estimate±1.96×estimated standard error

Buna "% 95 güven aralığı" diyebiliriz. Bununla birlikte, burada genellikle birkaç yaklaşım yapılması söz konusudur. Eğer tahminlerde bulunmazsak, gerçek kapsamı hesaplayabiliriz. Tipik bir durum standart hatayı tahmin etmektedir. Daha sonra aralıklar% 95 olasılıkla gerçek değeri yakalamak için çok dardır. Sadece% 85 olasılıkla gerçek değeri yakalayabilirler. "Gerçek kapsama alanı" olasılığı, bir tür monte edilmiş bir carlo simülasyonu kullanılarak hesaplanabilir (örneğin , seçilen bir gerçek değeri kullanarak örnek veri seti oluşturun, sonra her biri için% 95 CI hesaplayın ve gerçek değeri içerdiğini bulun ).1000850

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.