% 95 güven aralığında tüm değerler eşit derecede muhtemel mi?


56

Şu soruya uyumsuz bilgi buldum: " Biri, araçlardaki veya oranlardaki farkın% 95'lik bir güven aralığı (CI) oluşturursa, CI içindeki tüm değerler eşit derecede muhtemel mi? Veya, en muhtemel tahmin noktası mı? CI'nin "kuyrukları" na yakın olan değerlerin CI ortasındaki değerlerden daha düşük olması durumunda?

Örneğin, randomize bir klinik çalışma raporunda, belirli bir tedavi ile göreceli mortalite riskinin 1.06 (% 95 CI 0.96 - 1.18) olduğu belirtiliyorsa, 0.96'nın olasılığı 1.06 ile aynı değerde midir?

Çevrimiçi olarak bu konsepte çok sayıda referans buldum, ancak aşağıdaki iki örnek buradaki belirsizliği yansıtıyor:

  1. Lisa Sullivan'ın Güven Aralıkları ile ilgili modülü şöyle:

    fark için güven aralıkları, ( ) için bir dizi olası değer sağlar . Güven aralığındaki tüm değerlerin, ( ) gerçek değerinin eşit olasılıkla eşit tahminleri olduğuna dikkat etmek önemlidir .μ 1 - μ 2μ1-μ2μ1-μ2

  2. Hata Marjında ​​başlıklı bu blog yayını :

    Aklımda olan şey, “sınır marjı” hakkında yanlış anlama, sanki merkezi sınır teoremi, t dağıtımı yerine sınırlı bir düzgün dağılım anlamına geliyormuş gibi, güven aralığı dahilindeki tüm noktaları eşit derecede olası olarak ele alıyor . [...]
    “Hata payı” ndan bahseden şey özlüyor, nokta tahminine yakın olasılıkların, sınırın kenarındaki olasılıklardan çok daha muhtemel olması ”.

Bunlar çelişkili görünüyor, peki hangisi doğru?


7
Acaba, p-değerlerin boş hipotez altında eşit olarak dağıldığı ilgili kavramla ilgili bir karışıklık olup olmadığını merak ediyorum ..
Michael McGowan

4
İlk teklif, aksi takdirde doğru olan güven aralıklarıyla ilgili açık bir kaymadır. İkinci alıntı, güzel bir şekilde söylemek gerekirse, özensiz bir karışıklık olan bir hesaptan geliyor: belirsiz, yanlış veya sadece Bayesian anlamında yorumlanabilecek ifadelerle dolu. Ancak her iki teklif de yanlıştır !
whuber

@whuber Ben ikincisine bir karışıklık demezdim ... Ben ona Frequentist yorumlamanın Bayesian yorumunu derdim :)
Michael McGowan

1
@Michael Sloppiness örneği, CLT'nin "nüfusun ortalamalarının sonsuz sayıda tekrarlanan tahminlerinin hala normal bir dağılım izleyeceğini" ima ettiğini iddia eden bir gerçekçiliktir. Fikirlerin sadece teknik olmayan bir izleyici kitlesine iletilmesi için kişinin yanlış olması gerekmez .
whuber

2
@whuber, sadece küçük bir günahtan alıntı yaptığın cümleyi düşünüyorum. Ana hata, CLT'nin t dağıtımı içermemesidir.
camsı

Yanıtlar:


23

Cevaplanması gereken bir soru bu bağlamda "muhtemel" ne anlama geliyor?

Eğer olasılık (bazen eşanlamlısı olarak kullanıldığı gibi) anlamına gelirse ve katı frekansçı tanımları kullanıyorsak, gerçek parametre değeri değişmeyen tek bir değerdir, yani bu noktanın olasılığı (olasılık)% 100 ve hepsidir. diğer değerler% 0'dır. Yani neredeyse hepsi% 0'da eşit oranda muhtemeldir, ancak aralık gerçek değeri içeriyorsa, diğerlerinden farklıdır.

Eğer bir Bayesian yaklaşımı kullanırsak, CI (Credible Interval) posterior dağılımdan gelir ve aradaki farklı noktalardaki olasılığı karşılaştırabilirsiniz. Posterior aralıkta tamamen tekdüze olmadıkça (teorik olarak mümkün sanırım, ama bu garip bir durum olur), o zaman değerler farklı olabilir.

Güvene benzer olması muhtemel kullanıyorsak, bunu şu şekilde düşünün:% 95 güven aralığı,% 90 güven aralığı ve% 85 güven aralığı hesaplayın. Gerçek değerin% 95 aralığının içindeki bölgede bulunduğundan% 5 emin olacağız, ancak% 90 aralığının dışında, gerçek değerin o bölgede düşmesi muhtemel% 5 olduğunu söyleyebiliriz. Aynısı% 90 aralığında ancak% 85 dışında kalan bölge için de geçerlidir. Bu nedenle, her değerin eşit olması muhtemelse, yukarıdaki 2 bölgenin boyutunun tam olarak aynı olması gerekir ve aynı bölge için% 10'luk bir güven aralığı içinde ancak% 5'lik bir güven aralığı dışında kalır. Aralıklar kullanılarak yapılan standart dağıtımların hiçbiri bu özelliğe sahip değildir (tek tip bir çekişli özel durumlar hariç).

Bunu bilinen popülasyonlardan çok sayıda veri setini simüle ederek, ilgilenilen güven aralığını hesaplayarak, sonra gerçek parametrenin her nokta için tahmin edilen noktaya ne kadar yakın olduğunu karşılaştırarak kendinize kanıtlayabilirsiniz.


3
Olabilirlik, bu sorunun cevabında ihtiyaç duyduğu şeydir, olasılık değil, sık ya da Bayes. Olabilirlik tam olarak cevap veriyor, diğerleri ise sadece biraz büküm ve germe ile bunu yapabilir.
Michael Lew

1
@Greg Açıklamanızı beğendim. Açıkça söylemek gerekirse, argüman% 95 CI'nin "kuyruklarında" bulunan değerlerin nokta tahminine daha yakın olanlardan daha az olası (daha az olası) olduğu fikrini destekliyor, doğru mu? Cevabınız için teşekkürler.
pmgjones

1
@ pmgjones daha az muhtemel, NO, 2. paragrafa bakınız. 4. fıkra bağlamında daha az muhtemel, Evet.
Greg Snow,

2
@GregSnow 2. paragrafınız, neredeyse tam olarak, gerçek parametrenin gerçek parametre olma olasılığının% 100 olduğunu söyler. Bu tautolojinin “katı sıkça tanımların” önerdiği olduğuna gerçekten inanıyor musunuz?
rolando2

2
@ rolando2, frekansçı istatistiklerin sunabileceği çok şeyin olduğunu düşünüyorum, sadece gerçek değer değişikliklerini ima eden ve bazen aralık dışında ve bazen aralık içinde (bazen de sınırlara yakın ve bazen daha yakın olan) ortak yanlış beyanları ortadan kaldırıyordum. merkezi). Sonraki paragraflar sonra fikirler için daha doğru hissediyorum.
Greg Snow,

19

Bu harika bir soru! Sorunları anlamanıza yardımcı olacak olasılık olarak adlandırılan matematiksel bir kavram var. Fisher olasılığını icat etti, ancak olasılıktan biraz daha az istenen bir şey olarak kabul edildi, ancak olasılık olasılıktan daha 'ilkel' oldu ve Ian Hacking (1965) bunun kanıtlanamayacağı konusunda aksiyomatik olduğunu düşündü. Olasılık, tersine değil olasılığın altındadır.

Hacking, 1965. İstatistiksel Çıkarım Mantığı .

Olabilirlik, iyi bir sebep olmadan, standart istatistik kitaplarında olması gerektiğine dikkat edilmez. Neredeyse tam olarak beklediğiniz özelliklere sahip olma ihtimalinden farklıdır ve olasılık fonksiyonları ve aralıkları çıkarım için çok faydalıdır. Belki de olabilirlik bazı istatistikçiler tarafından beğenilmez, çünkü bazen ilgili olabilirlik fonksiyonlarını türetmenin 'uygun' bir yolu yoktur. Ancak, çoğu durumda olabilirlik işlevleri açık ve iyi tanımlanmıştır. Çıkarım için olasılık araştırması muhtemelen Richard Royall'ın İstatistiki Kanıt: Bir Olabilirlik Paradigması adlı küçük ve anlaşılması kolay kitabı ile başlamalıdır .

Sorunuzun cevabı, hayır, herhangi bir aralıktaki noktaların hepsinin aynı olasılığa sahip olmadığıdır. Güven aralığının kenarlarında olanlar genellikle aralığın merkezine doğru diğerlerinden daha düşük olasılıklara sahiptir. Tabii ki, geleneksel güven aralığı size özel deneyle ilgili parametre hakkında doğrudan hiçbir şey söylemez. Neyman'ın güven aralıkları 'global' olup, eldeki deneyle ilgili 'yerel' özelliklerden ziyade uzun dönem özelliklere sahip olacak şekilde tasarlanmıştır. (Mutlulukla iyi uzun süreli performans yerel olarak yorumlanabilir, ancak bu matematiksel bir gerçeklikten ziyade entelektüel bir kısayoldur.) Olabilirlik aralıkları - inşa edilebilecekleri durumlarda - eldeki deneyle ilgili olasılığı doğrudan yansıtır.


1
@suncoolsu Söz konusu aralığın açıklamanın doğru olması için bir olasılık aralığı olması gerekli değildir. Aralık yalnızca en muhtemel tahmini kapsamalıdır, böylece aralık sınırlarının her biri aralık içindeki bir noktadan daha az olasıdır. Herhangi bir sıradan güven aralığı bu gereksinimi karşılayacaktır.
Michael Lew

2
@ pmjones Bir% 95 CI DOST, CI'nin sınırlarına yönelik değerlerin, ortadaki değerlerden gerçeğe yakın olup olmadığını söylemez. CI'ler, popülasyondan tekrarlanan örnekleme hakkında açıklamalar yapar. Uzun vadede (yani, tekrarlanan örneklemeden sonra), her bir örnek için oluşturulan bu CI'lerin% 95'i gerçek değeri kapsayacaktır. Bu nedenle, iki önemli gözlem vardır 1) Verilen bir CI için gerçek değer hakkında hiçbir şey söyleyemez 2) CI, genel bir Bayesian eleştirisi olan gözlenen veriler hakkında hiçbir şey söylemez.
suncoolsu

1
@MichaelLew Olabilirlik ilkesi yararlıdır, ancak şunu söylüyorum (LW'dan alıntı yapmak) “Gerçekten de, sık sık yapılan bütün çıkarımların LP'yi ihlal ettiği, yani LP'ye bağlı kaldığımızda sık sık çıkarımdan vazgeçmemiz gerekir.” CI sıkça bir fikir olduğu için LP'yi ihlal ediyor (ki bu temel bir şey diyor).
suncoolsu 21:12

1
@suncollsu Soru, güven aralığının tek başına ve başka herhangi bir istatistiksel kaygı duymadan , kendi içindeki parametre değerlerinin gerçekleşme olasılığı hakkında bir şey söyleyip söylemediği değildir . Bu, aralık içindeki parametre değerlerinin olasılığı ile ilgilidir. Olabilirlik işlevi soruyu yanıtlar ve güven aralığı olabilirlik ilkesini ihlal etse bile bu cevap doğrudur. (Benim önceki yorumumu tekrar oku. İçeriğini tamamen görmezden gelmiş gibisin.)
Michael Lew

2
@ rolando2 Neyman'ın% 95 güven aralığı, yöntemin kullanıldığı durumlarda% 95'te gerçek parametreyi içerecek şekilde tasarlanmıştır. Kesin olarak konuşursak, özgüven, herhangi bir bireysel aralığa değil, her bir aralığa ve bu bireysel deneyde size dünyanın durumu hakkında hiçbir şey söylemez. Daha fazla ayrıntı için bu soruya cevabımı görün: stats.stackexchange.com/questions/8844/…
Michael Lew

18

Birinin bana CI95 içindeki tüm değerlere, nüfus değerinin potansiyel göstergesi olarak eşit güvende bulunmam gerektiğini söylediğini varsayalım . (Kasıtlı olarak "muhtemel" ve "muhtemel" terimlerinden kaçınıyorum.) 95'te özel olan nedir? Hiçbir şey: tutarlı olmak için, CI96, CI97, ve CI99.9999999 içindeki tüm değerlere eşit güvende bulunmak zorunda kalacağım. CI'nin kapsamı sınırına yaklaştığında, neredeyse tüm gerçek sayılar dahil edilmelidir. Bu sonucun akıl almazlığı ilk iddiamı reddetmeme yol açacaktı.


4
Bu harika bir cevap! Olası CI'lere yaklaşmanın etkilerini düşünmeliydim. Bunu yazdığın için teşekkürler!
pmgjones

2

Bir güven aralığı tanımı ile başlayalım. Bundan% 95'lik bir güven aralığı olduğunu söylersem , o doğaya ait ifadelerin zamanın% 95'inde gerçek olacağı ve zamanın% 5'inde yanlış olacağı anlamına gelir . Ben do not ille ben yaklaşık% 95 eminim anlamına bu özel açıklamada. % 90 güven aralığı daha dar ve% 80 daha dar olacak. Bu nedenle, gerçek değerin ne olduğunu merak ederken, belirli bir güven aralığının kenarına yaklaştıkça değerlerinde daha az güvenirim.

Yukarıdakilerin hepsinin nitel olduğunu, özellikle “güven” olduğunu unutmayın. (Sezgisel bagajımızdan farklı olabilecek matematiksel bagajlar taşıdıklarından, bu ifadede "güven" veya "olasılık" teriminden kaçındım.) Burada solucanlar olabilir.

Box, Hunter & Hunter'ın klasik metni ("Deneme İstatistikleri", Wiley, 1978) de yardımcı olabilir. Bkz. "Güven Aralıkları Kümeleri", s. 113, ff.


Kısmen kavramlarda ve kısmen anlambilimde uğraştığımız için, ikinci cümlenizde, hangi ifadelerin doğru olacağını belirtmeden "... o doğanın ifadeleri doğru olacak ..." demiştiniz.
rolando2
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.