Dar güven aralığı - daha yüksek doğruluk?


18

Güven aralıkları hakkında iki sorum var:

Görünüşe göre dar bir güven aralığı, bu aralıkta gözlem elde etme şansının daha az olduğu anlamına gelir, bu nedenle doğruluğumuz daha yüksektir.

Ayrıca% 95 güven aralığı, daha geniş olan% 99 güven aralığından daha dardır.

% 99 güven aralığı% 95'ten daha doğrudur.

Birisi doğruluk ve darlık arasındaki bu farkı anlamama yardımcı olabilecek basit bir açıklama yapabilir mi?


2
Sanırım " bu aralığın dışında bir gözlem alma şansı daha az ". Ne yazık ki, bir Güven Aralığı teknik, istatistiksel konulardan dolayı ne anlama geldiği anlamına gelmeyebilir, ancak genel olarak aralık ne kadar dar olursa (belirli bir güven düzeyinde) sonuçlar hakkında daha az belirsizlik söz konusudur. Bu sitede bir Güven Aralığının ne anlama geldiğini tartışan pek çok konu vardır (örneğin Güvenilir Bir Aralık yerine). Tahmini Aralıklara bile girmiyoruz ...
Wayne

@Wayne Neden deyimi olmayacak "bir gözlem elde daha küçük bir şans var içinde o aralıkta"? Dar aralık büyük bir tip 1 hatası içerdiğinden, gerçek null hipotezini reddetme olasılığı daha yüksektir , yani, gerçek null değerim bu aralıkta yer almaz. Bana öyle geliyor ki a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervaldoğru. Lütfen hatayı nerede yaptığımı açıklar mısınız?
user 31466

Yanıtlar:


19

% 95'i, denemenizdeki gerçek etkiyi kapsadığınızdan ne kadar emin olduğunuza sayısal olarak bağlı değildir. Belki de "% 95 kapsama alanı hesaplamasını kullanan aralık" ın bunun için daha doğru bir isim olabileceğini kabul etmek. Aralığın gerçek değeri içereceğine karar vermek için seçim yapabilirsiniz; ve bunu sürekli olarak% 95 oranında yaparsanız haklı olacaksınız. Ancak, daha fazla bilgi olmadan belirli bir denemeniz için ne kadar olası olduğunu gerçekten bilmiyorsunuz.

S1: İlk sorgunuz iki şeyi birleştirir ve bir terimi yanlış kullanır. Şaşkın olmana şaşmamalı. Daha dar bir güven aralığı daha kesin olabilir, ancak% 95 yöntemi gibi aynı şekilde hesaplandığında hepsi aynı doğruluktadır. Gerçek değeri zamanın aynı oranında yakalarlar.

Ayrıca, sadece dar olması, bu dar güven aralığında kalan bir örnekle karşılaşma olasılığınızın düşük olduğu anlamına gelmez. Dar bir güven aralığı üç yoldan biriyle elde edilebilir. Verilerin deneysel yöntemi veya doğası çok düşük varyansa sahip olabilir. Deniz suyunda musluk suyunun kaynama noktası etrafındaki güven aralığı, numune boyutundan bağımsız olarak oldukça küçüktür. İnsanların ortalama ağırlığı etrafındaki güven aralığı oldukça büyük olabilir, çünkü insanlar çok değişkendir, ancak yalnızca daha fazla gözlem alarak bu güven aralığını daha küçük hale getirebilir. Bu durumda, gerçek değerin nerede olduğuna inandığınız konusunda daha fazla kesinlik kazandıkça, daha fazla örnek toplayarak ve daha dar bir güven aralığı oluşturarak, o zaman bu güven aralığında bir kişiyle karşılaşma olasılığı azalır. (her halükarda numune boyutunu arttırdığınızda azalır, ancak büyük numuneyi kaynar su torbasında toplama zahmetine girmeyebilirsiniz). Son olarak, dar olabilir çünkü örneğiniz temsilsizdir. Bu durumda, gerçek değeri içermeyen aralıkların% 5'inden birine sahip olmanız daha olasıdır. CI genişliği ve literatürü ve bu verilerin tipik olarak ne kadar değişken olduğunu bilerek kontrol etmeniz gereken bir şey hakkında biraz çelişki var. Bu durumda, gerçek değeri içermeyen aralıkların% 5'inden birine sahip olmanız daha olasıdır. CI genişliği ve literatürü ve bu verilerin tipik olarak ne kadar değişken olduğunu bilerek kontrol etmeniz gereken bir şey hakkında biraz çelişki var. Bu durumda, gerçek değeri içermeyen aralıkların% 5'inden birine sahip olmanız daha olasıdır. CI genişliği ve literatürü ve bu verilerin tipik olarak ne kadar değişken olduğunu bilerek kontrol etmeniz gereken bir şey hakkında biraz çelişki var.

Ayrıca, güven aralığının popülasyonun gerçek ortalama değerini tahmin etmeye çalışmak olduğunu düşünün. Bu noktayı bilseydiniz, daha da kesin (ve doğru) olursunuz ve hatta bir dizi tahmininiz bile olmazdı. Ancak, aynı değerle bir gözlemle karşılaşma olasılığınız, herhangi bir örnek tabanlı CI içinde bir tane bulmaktan çok daha düşük olacaktır.

S2 :% 99 güven aralığı% 95'ten daha geniştir. Bu nedenle, gerçek değeri içermesi daha olasıdır. Kesin ve doğru arasındaki farkı görün, ikisini karıştırıyorsunuz. Daha düşük değişkenlik ve daha yüksek örnek boyutu ile bir güven aralığını daha dar yaparsam, daha kesin hale gelirse, olası değerler daha küçük bir aralığı kapsar. % 99 hesaplama kullanarak kapsamı artırırsam daha doğru olur, gerçek değerin aralık içinde olması daha olasıdır.


2
Popülasyondaki ortalamanın değişkenliği (= tahmin etmeye çalıştığınız şey) sıfırdır.
Nick Sabbe

10

Belirli bir veri kümesi için, bir güven aralığının güven düzeyini artırmak yalnızca daha büyük aralıklarla (veya en azından daha küçük değil ) sonuçlanır . Bu doğruluk veya kesinlik değil, gerçek değeri kaçırmak için ne kadar risk almak istediğinizle ilgilidir.

Birden fazla veri kümesinden aynı tür parametre için güven aralıklarını karşılaştırıyorsanız ve biri diğerinden daha küçükse, daha küçük olanın daha kesin olduğunu söyleyebilirsiniz . Bu durumda doğruluktan ziyade kesinlik hakkında konuşmayı tercih ediyorum ( bu ilgili Wikipedia makalesine bakın ).


"Aynı tür parametre" ve "birden çok veri kümesi" ile kastedilen nedir? Diyelim ki, okuma yazma bilmeme ve anket farklı zamanlarda 1995, 1998 vb. Peki "cehalet oranı" aynı tür bir parametre midir ve 1995, 1998 vb. Veri setleri birden fazla veri kümesini gösteriyor mu?
user 31466

Örneğin, her biri bir miktar popülasyonun ortalaması için bir dizi güven aralığı. Örneğiniz de uyuyor sanırım.
Karl

3

Her şeyden önce, belirli bir güven yüzdesi için bir CI (örneğin% 95), tüm pratik amaçlar için (teknik olarak doğru olmasa da) gerçek değerin aralıkta olduğundan emin olduğunuz anlamına gelir.

Bu aralık "dar" ise (bunun yalnızca göreceli olarak görülebileceğini unutmayın, bu nedenle, aşağıdakilerle karşılaştırmak için, 1 birim genişliğinde olduğunu söyleyin), bu, oynamak için çok fazla alan olmadığı anlamına gelir: hangi değer o aralığın gerçek değere yakın olacağını seçersiniz (aralık dar olduğu için) ve bundan oldukça eminsinizdir (% 95).

Bunu nispeten geniş bir% 95 CI ile karşılaştırın (önceki örnekle eşleştirmek için 100 birim genişliğinde olduğunu söyleyin): burada, gerçek değerin bu aralıkta olacağından hala% 95 eminsiniz, ancak bu size çok fazla şey söylemiyor aralıkta nispeten çok sayıda değer olduğu için (1'den ziyade yaklaşık 100 faktörü - ve yine saflaştırıcılardan sadeleştirmeyi göz ardı etmelerini rica ediyorum).

Tipik olarak, gerçek değerin içinde% 99 emin olmak istediğinizde, yalnızca% 95 kesin olmanız gerektiğinden daha büyük bir aralığa ihtiyacınız olacaktır (not: aralıklar iç içe değilse bu doğru olmayabilir ), dolayısıyla, ne kadar fazla güveye ihtiyacınız olursa, seçmeniz gereken aralık o kadar geniş olur.

Öte yandan, sen olan yüksek bir güven aralığı ile daha emin. Yani, size aynı genişlikte 2 aralık veririm ve birinin% 95 CI ve diğerinin% 99 CI olduğunu söylersem, umarım% 99 olanı tercih edersiniz. Bu anlamda,% 99 CI daha doğrudur: gerçeği kaçıracağınızdan daha az şüpheniz var.


Teşekkürler! öyleyse, nötrinoların ışıktan daha hızlı olduğu üzerine yapılan bu yeni araştırmanın çok küçük bir güven aralığına sahip olduklarını söylediklerinde (sanırım bu dar anlamına gelir) o zaman geniş bir güven aralığı olsaydı, doğru olma olasılıklarının daha yüksek olduğu anlamına mı geliyor? (diğer tüm yönleri göz ardı ederek)
15'te yukarı

10
Nick, ilk ifaden yanlış. Bu bir "teknik sorun" değil, doğru değil. Güven aralığı, tekrarlanan deneylerde neler olacağına, zamanın% 95'inin gerçek değerini kapsayacağına dair bir ifadedir. Gerçek değerin, verilen denemede bulunan verilen aralığım dahilinde olduğuna dair bir açıklama hiç de aynı değil. Eğer "o" kelimesini "kendinden emin" olarak ve parantez içindeki sayısal miktarı kaldırırsanız, o zaman gerçeğe daha yakın olursunuz. Bunun, aralığa düşmesi muhtemel gerçek değere inandığınız anlamına geldiğini söyleyebilirsiniz.
John

aksi halde, cevap oldukça iyi ...
John

4
@John: Cümlemin olmamasını ima etmediği halde, aralığın kendisinin rastgele değişken olduğunu söylemekten özellikle kaçındım (kuşkusuz, bunu öneriyor). İlgili meseleleri biliyorum ama onları soru ile ilgisiz buldum. Farkın da önemli olduğu pratik bir durum görmedim , dolayısıyla "tüm pratik amaçlar için".
Nick Sabbe

4
Sorunla karşılaşmadınız mı? Bu p-değerini = null olasılığını söylemek ve daha sonra onunla hiç karşılaşmadığınızı söylemek gibidir. Doğru dergilerde kalırsanız olmaz. Gerçek değerin mevcut aralığınızda% 95 olduğundan emin olduğunuzu söylemek yanlıştır. Bazı ezoterik bir mesele olarak davranmak, artık (en azından) etrafta dolaşan bir kişinin daha, "değerin bu aralıkta olduğundan% 95 emin olduğumuzu" söyleyeceğimiz anlamına geliyor. Bunu düzeltmek için cevabınızı pek değiştiremezsiniz. Bir ifadeyi değiştirirseniz, eteğiniz diğer sorunlar göz ardı edilebilir.
John

3

Burada oy verdiğim bazı iyi cevapları ekliyorum. Sonucu netleştirmek için söylenmesi gereken biraz daha fazla şey olduğunu düşünüyorum. Efron'un tanımladığı gibi doğru ve doğru terimlerini seviyorum. Son zamanlarda bu konuda farklı bir soru üzerine uzun bir tartışma yaptım. Ilımlı whuber bu cevabı gerçekten sevdi. Bunu tekrarlamak için aynı boyuta gitmeyeceğim. Ancak Efron'un doğruluğu, güven seviyesi ve aralığın genişliği veya sıkılığı ile ilgili doğrulukla ilgilidir. Ama önce doğruluk düşünmeden gerginlik hakkında konuşamazsınız. Bazı güven aralıkları, reklam verdikleri gerçek kapsama sahip oldukları için doğrudur. Asimptotik dağılım kullandığı için% 95 güven aralığı da yaklaşık olabilir. Asimptotiklere dayalı yaklaşık aralıklar, sonlu örneklem büyüklüğüdür, n, asemptotik dağılım tam dağılım olsaydı alacağınız kapsama alanı olan reklamı yapılan kapsama sahip olmayacaktır. Bu nedenle, yaklaşık bir aralık gizlenebilir (yani, gerçek kapsamı yalnızca% 91 olduğunda% 95 reklam verebilir) veya nadir ancak daha az ciddi olan vaka örtüşmesinde (yani reklamı yapılan kapsam% 95'tir, ancak% 98'de gerçektir). Önceki durumda, gerçek kapsama alanının reklamı yapılan kapsama ne kadar yakın olduğu konusunda endişeliyiz). Yakınlık ölçüsü, 1 / √n veya 1 / n olarak adlandırılabilecek doğruluk sırasıdır. Gerçek güven seviyesi yakınsa doğru diyoruz. Asla kesin olmayan ancak bazı varyantlar diğerlerinden daha doğru olan önyükleme güven aralıklarında doğrudur.

Bu doğruluk tanımı OP'nin bahsettiğinden farklı olabilir, ancak şimdi Efron'un tanımının ne olduğu ve doğru olmanın neden önemli olduğu açık olmalıdır. Şimdi kesin olan iki yönteminiz varsa, herhangi bir güven düzeyi için daha küçük beklenen genişliğe sahipse birini diğerinden daha fazla tercih edebiliriz. Bu anlamda en iyi olan güven aralığı (bazen en kısa olarak adlandırılır) seçim yapılacaktır. Ancak bu kesinliği gerektiriyordu. Güven seviyesi sadece yaklaşık ise, elma ve portakalları karşılaştırıyor olabiliriz. Biri diğerinden daha dar olabilir, çünkü daha az doğrudur ve dolayısıyla gerçek kapsamı reklamı yapılan kapsamından daha düşüktür.

Eğer iki güven aralığı çok doğruysa ya da biri doğruysa ve diğeri çok doğru karşılaştırırken beklenen genişlik iyi olabilir, çünkü en azından şimdi sadece iki iki elma türüne bakıyoruz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.