Güven aralıklarını yorumlama konusunda açıklama mı?


47

"Güven seviyesi " güven aralığı ile güven aralığı nosyonu hakkındaki şu anki anlayışım , güven aralığını birçok kez (yeni bir örnekle her seferinde) hesaplamaya kalkıştığımızda, doğru parametrenin değerini içermesidir . saati.1 - α1α1α

Bunun "gerçek parametrenin bu aralıkta yatma olasılığı" ile aynı olmadığını fark etmeme rağmen, açıklığa kavuşturmak istediğim bir şey var.

[Büyük Güncelleme]

% 95 güven aralığını hesaplamadan önce, hesapladığımız aralığın gerçek parametreyi kapsaması% 95 olasılık vardır. Güven aralığını hesapladıktan ve belirli bir aralık elde ettikten sonra , artık bunu söyleyemeyiz. Gerçek parametrenin ya yatacağından% 95 emin olduğumuza dair sıkça olmayan bir argüman bile yapamıyoruz ; Çünkü yapabilseydik, bunun gibi karşı örneklerle çelişirdi: Kesin olarak güven aralığı nedir?[ a , b ][a,b][a,b]

Bunu olasılık felsefesi hakkında bir tartışma yapmak istemiyorum; bunun yerine, belirli aralığını görmenin neden ve niçin bu aralığı görmeden önce sahip olduğumuz% 95 olasılığını nasıl ve niçin değiştirdiğinin (neden değişmeyeceğinin) kesin, matematiksel bir açıklamasını arıyorum . "Aralığı gördükten sonra, olasılık nosyonunun artık bir anlam ifade etmeyeceğini" iddia ediyorsanız, o zaman tamam , mantıklı olduğu bir olasılık yorumunda çalışalım .[a,b]

Daha kesin:

Bir bilgisayarı% 95 güven aralığını hesaplayacak şekilde programladığımızı varsayalım. Bilgisayar bazı sayıları çarpıyor, aralık hesaplıyor ve şifreyi girene kadar aralık göstermeyi reddediyor. Şifreyi girmeden ve aralığı görmeden önce (ancak bilgisayar zaten hesapladıktan sonra), aralığın gerçek parametreyi içerme olasılığı nedir? Bu% 95'tir ve bu kısım tartışmaya açık değildir : bu, bu belirli soru için ilgilendiğim ihtimalin yorumlanması (bastırdığım önemli felsefi meseleler olduğunun farkındayım ve bu kasıtlı).

Ancak şifreyi yazıp bilgisayar bana hesapladığı aralığı gösterdiğinde, aralığın (aralığın gerçek parametreyi içermesi) olasılığı değişebilir. Bu olasılığın asla değişmediği iddiası, yukarıdaki örnek ile çelişir. Bu karşı örnekte, olasılık% 50'den% 100'e değişebilir, ancak ...

  • Olasılığın% 100 veya% 0 dışında bir şeye dönüştüğü bir örnek var mı (EDIT: öyleyse ne?)?

  • Belirli aralığın aralığını gördükten sonra olasılığın değişmediği bir örnek var mı (yani, gerçek parametrenin da kalma olasılığı hala% 95'tir)?[ a , b ][a,b][a,b]

  • Bilgisayarın tükendiğini gördükten sonra olasılık genel olarak nasıl (ve neden) değişiyor ?[a,b]

[Düzenle]

Tüm harika cevaplar ve faydalı tartışmalar için teşekkürler!


1
Bu bazı ilginç noktalar sağlayabilir: en.wikipedia.org/wiki/Credible_interval
nico

P (E | C) = 1 ve P (E | C ') = 0 olduğuna karar vermeyin. Neden gerçek aralık gerçek parametre değerini içermiyorsa, bunun sonuncunun bunun dışında olduğunu belirtiyorsunuz?
camsı

"Gerçek aralık" veya "ikincisi" ile ne demek istediğinizi anlamadım. Lütfen açıklar mısın?
Elliott

@nico Link için teşekkürler. Asıl sorumun amacı "benim argümanım bir güven aralığının Bayesian tarafından kabul edilebilir bir aralık olarak yorumlanabileceğini gösteriyor gibi görünmüyordu, ancak durum böyle değil, bu yüzden mantığımın nesi yanlış". Ancak şunu itiraf etmeliyim ki, "aralığın [bilinmeyen] true parametresini içerme olasılığı" ya da 1'dir. Bana göre bu, "madalyonun düşme olasılığı var, çevirdim ama bakmadan önce, ya 0 ya da 1"; Neden 1/2 olmadığını anlamıyorum.
Elliott

@Elliot: Schrödinger'in kedisi akla geliyor :) Size doğru bir açıklama yapmak için yeterince uzman değilim, ama bunun için bir cevap görmeyi çok isterim. Not: Ve madalyonun aynı zamanda kenara düşebileceğini de unutmayalım!
nico,

Yanıtlar:


28

Bence asıl sorun, frekansçı istatistiklerin yalnızca uzun çalışma frekansı olan bir şeye olasılık atayabileceğidir. Bir parametrenin gerçek değerinin belirli bir aralıkta olup olmadığı uzun bir çalışma frekansına sahip olmasa da, deneyi yalnızca bir kez yapabiliriz, bu nedenle ona sıkcı bir olasılık atayamazsınız. Sorun, bir olasılık tanımından doğar. Olasılık tanımını bir Bayesçi olanla değiştirirseniz, o zaman sorun uzun süredir devam eden frekansları tartışmaya bağlı olmadığınız için anında kaybolur.

Burada ilgili bir soruya (yanağında kırılma) cevabımı görün :

" Bir Frequentist, olasılıkların olayların gerçekleştiği uzun dönem frekansları temsil ettiğine inanan bir kişidir; gerekirse, uzun vadedeki frekanslar hakkında anlamlı bir şekilde konuşabilmesi için kendi durumunuzun rastgele bir örnek olarak kabul edilebileceği hayali bir popülasyon icat edecektir. Ona belirli bir durum hakkında bir soru soruyorsun, doğrudan bir cevap vermeyecek, bunun yerine bu (muhtemelen hayali) nüfus hakkında bir açıklama yapacak.

Güven aralığı olması durumunda, normalde sormak istediğimiz soru (örneğin kalite kontrolünde bir sorun yaşamadıkça) "bu veri örneğine verildiğinde, parametrenin gerçek değerini olasılıkla içeren en küçük aralığı döndür X". Bununla birlikte, bir deneyci bunu yalnızca bir kez yapıldığı için yapamaz ve bu nedenle bir olasılık atamak için kullanılabilecek uzun dönem frekanslar yoktur. Bu nedenle, frekans uzmanı, yaptığınız deneyin rastgele bir örnek olarak kabul edilebileceği (gerçekleştirmediğiniz) bir deney popülasyonu icat etmelidir. Daha sonra frekans uzmanı, belirli bir deney hakkında sormak istediğiniz soruya doğrudan bir cevap vermek yerine, bu hayali deney popülasyonu hakkında dolaylı bir cevap verir.

Temel olarak bir dil problemidir, bir popülasyonun sıkça tanımlanması, basitçe belirli bir aralıkta yer alan bir parametrenin gerçek değerinin olasılığının tartışılmasına izin vermez. Bu, sık sık istatistiklerin kötü veya faydalı olmadığı anlamına gelmez, ancak sınırlamaları bilmek önemlidir.

Büyük güncelleme ile ilgili olarak

“% 95'lik bir güven aralığı hesaplamadan önce, hesapladığımız aralığın gerçek parametreyi kapsayacak şekilde% 95 olma olasılığı olduğunu” söyleyebileceğimizden emin değilim. sık sık bir çerçevede. Burada, parametrenin gerçek değerinin, belirli bir yöntem tarafından oluşturulan güven aralıklarında yer aldığı uzun çalışma frekansının, parametrenin gerçek değerinin, belirli numune için güven aralığında kalması olasılığı olduğu da, açık bir çıkarım vardır. veri kullanacağız. Bu tamamen makul bir çıkarımdır, ancak parametrenin gerçek değerinin belirli bir veri örneği için oluşturduğumuz güven aralığında yatma sıklığı olmaması gibi, sık aralıklı bir sonuç değildir. sadece bir veri örneğimiz var.

Bununla birlikte, "% 95'in gerçek a parametresinin [a, b] 'de olacağından emin olduğumuzu"% 100 yaptığımıza dair olmayan bir argüman tartışması yapabiliriz ", bu tam olarak bir Bayesian güvenilir aralığının ne olduğunu ve birçok problem için Bayesian güvenilir aralığının ne olduğunu sık sık güven aralığı ile tam olarak örtüşmektedir.

“Bunu olasılık felsefesi hakkında bir tartışma yapmak istemiyorum”, ne yazık ki bu kaçınılmazdır, istatistiğin gerçek değerinin güven aralığındaki gerçek değerinin doğrudan bir sonuç olup olmadığına dair sıkça bir olasılık atayamazsınız. sık sık olasılık felsefesi. Frekans uzmanları, yalnızca uzun dönem frekansları olan şeylere olasılıklar atayabilirler; Bu sıkça felsefeyi yanlış yapmaz, ancak bir olasılık tanımının getirdiği sınırları anlamak önemlidir.

"Şifreyi girmeden ve aralığı görmeden önce (ancak bilgisayar zaten hesapladıktan sonra), aralığın gerçek parametreyi içerme olasılığı nedir? Bu% 95'tir ve bu bölüm tartışma için hazır değildir:" Bu yanlıştır ya da en azından böyle bir açıklama yaparken, sık sık istatistiklerin çerçevesinden çıktınız ve uzun vadede bir frekanstan ziyade, bir ifadenin gerçeğinde bir dereceye kadar inatçılık içeren bir Bayesian çıkarımı yaptınız. Ancak, daha önce de söylediğim gibi, tamamen makul ve doğal bir çıkarım.

Şifreye girmeden önce veya sonra hiçbir şey değişmedi, çünkü niether olayına sık sık bir olasılık atanabilir. Frekansist istatistikler, belirli olaylarla ilgili ifadelerin uygunluğunun dereceleri hakkında sıkça soru sormak istediğimizden oldukça sezgisel olabilir, ancak bu, sıkça yapılan istatistiklerin emri dışındadır ve sıkça yapılan işlemlerin çoğu yanlış yorumlanmasının kaynağı budur.


2
Evet, anladığım nokta bu değil, ikinci ifade aslında bu parayla ilgili bir açıklama değil. Bu, çoğu insanın kendi madeni paramızla ilgili bir açıklama olarak yanlış düşündüğü hayali bir madeni para popülasyonuyla ilgili bir ifadedir. Ancak bu sıçramayı yaparken, olasılıkla ilgili Bayesian sezgisini uyguluyoruz ve gerçekte bir güven aralığının ne olduğunu görmezden geliyoruz. Sık sık bir olasılık tanımından uzaklaşmamız şartıyla madalyonun durumuna bir olasılık atamakta hiçbir sorun yoktur.
Dikran Marsupial

2
Açıklığa kavuşturmak için, “zamanın başlangıcının birçok ayrı örneğini hayal edin; bunların başlarının yarısını üretmeyi beklersiniz” demek, kesinlikle doğru, sıkça muhakemedir. Bununla birlikte oradan "bu parçacıklı madalyonun da 0,5 olması ihtimali" olduğu için, sadece bir defa ve sadece bir kez olabileceği için uzun çalışma frekansına sahip olmayan bir şeye olasılık uygulanmamaktadır. Bayesçi olasılık, bir önermenin uygunluğuyla ilgili bir açıklama olduğundan (bu, bir popülasyondaki uzun çalışma frekansına dayanabilir) olduğu için Bayesçi mantıklı bir şekilde mükemmeldir.
Dikran Marsupial

1
Her iki soruya da cevabı, başa çıkacak hayali bir madeni para nüfusunun oranı hakkında bir açıklama olurdu. Ancak, insanlar genellikle yardımcı olmaktan hoşlandıklarından (dolaylı cevaplar genellikle bu kadar yardımcı olmuyor) ve ayrıca sıkça istatistiklerin karşı-sezgisel olduğu ve sıklıktan kaçınmak için bu noktanın etrafında durması muhtemel olduğu için, bunun açıklığa kavuşturulmaması muhtemeldir. karışıklığı. Belirli bir çeviriyle ilgili olasılıksal bir statü oluşturmak için sabitlenmişse, iyi bir frekans uzmanı cevap vermeyi reddedebilir - sık görüşme istatistiklerinin sınırları dışında kalır.
Dikran Marsupial

1
Temelde, frekans uzmanı aslında sorunuzu yanıtlamaz, bir madeni para popülasyonu hakkında bir açıklama yapar ve bu belirli bir çevirme üzerine bir baş olasılığının örtük popülasyondaki oranla aynı olduğu sonucuna varmanızı sağlar. . Ama bu senin Bayesçi çıkarımın olurdu, onun değil.
Dikran Marsupial

1
@Aaron Elbette, birçok şey için "olasılık ya 0 ya da 1" diyebilirsiniz, ancak bu cevap bize kesinlikle hiçbir şey getirmez (örneğin, bir oyuna ne kadar bahis oynamamız gerektiği ya da ne kadar olacağına dair somut bir soruyu yanıtlamak istiyorsak) ya da bir uzay mekiği fırlatmamalıyız. Ayrıca, "olabilecek" şeyler şunlardır: (1) yazı tura kafaları indirdi ve sen kapladın, (2) yazı tura girdi ve sen kapladın; Denemelerin saygısız ve örtü "denilen" hayali bir popülasyonunda ", yaklaşık% 50'si kafa görmenize neden oluyor.
Elliott

14

Büyük güncelleme, büyük yeni cevap. Bu noktayı net bir şekilde ele almaya çalışmama izin verin, çünkü problem burada yatıyor:

“Eğer aralığı gördükten sonra, olasılık nosyonunun artık bir anlam ifade etmeyeceğini” iddia ediyorsanız, o zaman tamam, mantıklı olduğu bir olasılık yorumunda çalışalım. ”

Olasılık kuralları değişmez ama evren için modeliniz değişir. Bir olasılık dağılımı kullanarak bir parametre hakkındaki önceki inançlarınızı ölçmeye istekli misiniz? Verileri makul bir şekilde gördükten sonra bu olasılık dağılımını güncellemek mi? Eğer öyle düşünürseniz, gibi ifadeler yapabilirsiniz . Önceden yaptığım dağıtım, doğanın gerçek durumuyla ilgili belirsizliğimi temsil edebilir , yalnızca genel olarak anlaşıldığı gibi rastgelelik değil - yani, bir sayıdaki kırmızı top sayısına önceden bir dağılım atadıysam, bu sayı sayılmaz sanırım kırmızı topları rastgele. Sabit, ama ben bu konuda kararsızım.P(θ[L(X),U(X)]|X=x)

Bunları da dahil olmak üzere birkaç kişi, ancak rasgele bir değişkeni çağırmak istemiyorsanız, o zaman ifadesi değildir. anlamlı. Sık , sabit bir miktar olarak kabul ediyorum VE ona bir olasılık dağılımı atayamam. Neden? Çünkü sabittir ve olasılık yorumum uzun vadeli frekanslar açısındandır. Vazoda kırmızı topların sayısı hiç değişmez. budur . Birkaç topu çıkarırsam rastgele bir örneğim olur. Bir sürü rastgele örnek alırsam ne olacağını sorabilirim - yani, hakkında konuşabilirimP ( θ [ L ( X ) , U ( X ) ] | X = x ) θ θ θ P ( θ [ L ( X ) , U ( X ) ] )θP(θ[L(X),U(X)]|X=x)θθθP(θ[L(X),U(X)]) çünkü aralık numuneye bağlıdır (bunun için bekleyin!) rastgele.

Ama bunu istemiyorsun. İstediğiniz - gözlemlenen (ve şimdi sabitlenmiş) örneklem ile oluşturduğum bu aralığın parametre içermesi olasılığı nedir? Bununla birlikte, bir kez kondisyon sonra, sıkça, rasgele hiçbir şey kalmadı ve ifadesinde yok' anlamlı bir şekilde mantıklı değil.X = x P ( θ [ L ( X ) , U ( X ) ] | X = x )P(θ[L(X),U(X)]|X=x)X=xP(θ[L(X),U(X)]|X=x)

hakkında bir açıklama yapmanın ilkeli yolu (IMO), (önceki) olasılık dağılımına sahip bir parametre hakkındaki belirsizliğimizi ölçmek ve Bayes Teoremi ile bu bilgiyi yeni bilgilerle güncelleyin. Gördüğüm diğer her yaklaşım Bayes'e cüretkar bir yaklaşım. Kesinlikle sıkça bir bakış açısıyla yapamazsınız.P(θ[L(X),U(X)]|X=x)

Bu, geleneksel frekansçı prosedürleri Bayes bakış açısıyla değerlendiremeyeceğiniz anlamına gelmez (genellikle güven aralıkları tekdüze öncelikler altında sadece güvenilir aralıklardır) veya Bayesyen tahmin ediciler / güvenilir zamanları sıkça bir bakış açısıyla değerlendirmenin değerli olmadığı söylenemez. (Bence olabilir). Klasik / frekansçı istatistiklerin faydasız olduğunu söylemek değildir, çünkü değildir. İşte bu, ve daha fazlasını yapmaya çalışmamalıyız.

Evrendeki inançlarınızı temsil etmek için bir parametreye önceden bir dağılım vermenin makul olduğunu düşünüyor musunuz? Yaptığın yorumlarından anlaşılıyor; Tecrübelerime göre çoğu insan aynı fikirdeydi (yorumumda @G. Jay Kerns'in cevabına yaptığım küçük şakaydı). Öyleyse, Bayesian paradigması, hakkında açıklama yapmak için mantıklı ve tutarlı bir yol sağlar . Sıkcı yaklaşım basitçe değildir.P(θ[L(X),U(X)]|X=x)


1
(+1), yine çok iyi yapıldı ve ölü merkez noktasını tespit edin.

+1 Yukarıdaki gibi yorum (bkz. G. Jay Kerns'in cevabı); bu gerçekten yardımcı oldu.
Elliott,

Bounty schmounty :) Bunu yararlı bulduğuna sevindim.
JMS

11

Tamam, şimdi konuşuyorsun! Önceki cevabımı silmek için oy kullandım, çünkü bu büyük güncellenen soru ile ilgili hiçbir anlamı yok.

Bu yeni, güncellenmiş soruda, ortodoks frekans yorumlaması altında,% 95 güven aralıklarını hesaplayan bir bilgisayarla, sorularınızın cevapları:

  1. Hayır.
  2. Hayır.
  3. Aralık gözlendiğinde, artık rastgele değildir ve değişmez. (Belki aralık .) Ama da değişmedi ve hiç değişmedi. (Belki de .) Olasılık% 95'ten% 0'a değişmektedir, çünkü bilgisayarın% 7'yi hesapladığı aralıkların% 95'i, ancak aralıklarının% 100'ü 7'yi kapsamaz.θ θ = 7 [ 1 , 3 ][1,3]θθ=7[1,3]

(Bu arada, gerçek dünyada, deneyci bilir asla bilemez deneyci demektir bakılmaksızın geçerlidir olasılık Kapaklar sıfır veya biridir. (S) o sadece can bunun biri ya da diğeri olması gerektiğini söyleyin.) Buna ek olarak, deneyci bilgisayarın aralıklarının% 95'inin kapsadığını söyleyebilir , ancak bunu zaten biliyorduk.[ 1 , 3 ] θ θθ=7[1,3]θθ

Sorunuzun ruhu, gözlemcinin bilgisine ve bunun, nerede 'nin yalanı ile ilgili olduğuna dair ipuçlarını tutar . Eğer senin, henüz görmeden aralığını hesaplayarak bilgisayar hakkında, şifre bahsediyorduk yüzden (muhtemelen) 'dir vb . Yorumlarınıza, cevapların 0 veya 1 olduğunu taahhüt etmek zorunda kalmanın tatmin edici / uygunsuz göründüğünü gördüm, sonuçta, neden% 87 ya da , hatta% 99 olduğuna inanamıyoruz ? ? Ancak bu tam olarak güç - ve aynı anda Aşil'in topuğu - sık sık çerçevenin: gözlemcinin öznel bilgisi / inancı ilgisizdir. Tek önemli olan uzun süreli bir göreceli frekanstır. Ne fazla ne eksik.15 / 16θ15/16

Son bir BTW olarak: olasılık yorumunu değiştirirseniz (özellikle bu soru için yapmamayı seçtiniz), o zaman yeni cevaplar:

  1. Evet.
  2. Evet.
  3. Olasılık değişir çünkü olasılık = öznel bilgi veya inanç derecesi ve gözlemcinin bilgisi değişti. Daha önceki / posterior dağılımlarla bilgiyi temsil ediyoruz ve yeni bilgiler elde edildikçe, eski morflar (Bayes Kuralı üzerinden).

(Ancak tam açıklama için, açıkladığınız kurulum öznel yorumlama ile çok iyi uyuşmuyor. Örneğin, bilgisayarı açmadan önce genellikle% 95 oranında güvenilir bir aralığa sahibiz, daha sonra bilgisayarı ateşliyor ve bilgisayarı vermek için kullanıyoruz. bize öncekinden çok daha zayıf olan% 95 posterior güvenilir aralık.


Tekrar! :) Aferin.
JMS,

3
Ben sadece Bayesian olasılığının yorumlanmasının ille de sübjektif olmadığını vurgulamalıyım, bu gerçekten sık sık yaklaşımın bir gücü değildir. Amaç Bayes yaklaşımı "madeni para iniş olasılığı" sorununa yaklaşırsa, bilgisiz bir önceliği kullanmak hiç öznellik içermez. Frekansist yaklaşımın gerçek gücü, tekrarlanan denemeler ve uzun süreli frekanslardan bahsetmenin doğal olduğu kalite kontrol gibi sorunlarda yatmaktadır. Sadece belirli olaylar hakkında soru sorduğunuzda zorluk çeker.
Dikran Marsupial

@JMS, teşekkürler. @Dikran, 544 karakterle bilgisayar ekranındaki küçük bir kutudan bahsetmek zor. Kısaca: Sizinle "Bayesian" kelimesinin "öznel" ile eşanlamlı olmadığı konusunda hemfikirim. Ve herhangi bir yaklaşımın gerçek gücünün gerçekte yattığını saptamaya çalışmanın bir anlamı yok. Alt satır: Hepimiz uzun vadeli bir nispi frekansta hemfikir olabiliriz, ancak çoğu zaman posteriorunuz benimkinden farklı olacaktır.

2
@Dikran Marsupial İyi bir noktaya değindiniz. Ben sadece eski oyuncak problemlerini gerçek uygulamalı modellemeye geçirdiğimizde, gerçekten de önemli olan öznelliğin, önceki dağıtımların kendileri olmak zorunda olmadıklarını, olasılıkları nasıl belirttiğimizle geldiği durumudur. (Bu gözlemler gerçekten değişebilir mi? Gaussian? vb). Bu şekilde öznellik, Bayesci ve sıkça olduğu gibi, model tabanlı istatistiklerin büyük bir kısmına dahil edilir.
JMS

+1 Güzel cevap için teşekkürler. Bu kesinlikle bir ödülü hakediyor, ancak siyasi olmaktan kaçınmak için, en sonunda, aşırı oy kullanmaya başladım.
Elliott

6

İki kuruşumu atacağım (eski cevapların bir kısmını yeniden sindirebilirim). Bir frequentist için, kendisi aralık güven iki boyutlu rastgele değişken özünde geçerli: eğer sen deneyini gelen milyarlarca kez yinelemek istiyorum, sana aralık güven olur tahmin her zaman farklı olacaktır: (Her seferinde yeni bulunan verilerden hesapla yani) . Dolayısıyla, aralığın iki sınırı rastgele değişkenlerdir.

Öyleyse,% 95'lik bir CI (bu CI'ye yol açan tüm varsayımlarınız doğruysa) bu rasgele değişkenler grubunun vakaların% 95'inde gerçek değeri (çok sık kullanılan bir ifade) içereceği güvencesinden başka bir şey ifade etmez.

Standart normal dağılımdaki ortalama 100 beraberlik için güven aralığını kolayca hesaplayabilirsiniz. Daha sonra, bu standart normal dağılımdan 10000 kat 100 değer çiziyorsanız ve her seferinde ortalamanın güven aralığını hesaplarsanız, aslında 0'ın orada yaklaşık 9500 kat olduğunu göreceksiniz.

Eğer gerçeği var (gerçek verilerden) sadece bir kez güven aralığı oluşturulan gerçekten olmanın gerçek değerli olasılığını azaltır mı olduğunu göre 0 veya 1 için aralık, ancak a kadar güven aralığı olasılığını değişmez gerçek değeri içeren rastgele değişken.

Yani, sonuç olarak: olasılığı herhangi gerçek değerini içeren için (yani ortalama olarak) gerçek değerini (% 95) içeren% 95 güven aralığı değil değişikliği yapar ve ne belirli bir aralık olasılığını yapar (CI ya da her neyse) (0 veya 1). Bilgisayarın bildiği aralığın olasılığı, ancak siz aslında 0 ya da 1 değil (çünkü belirli bir aralıktır), ancak siz bilmediğinizden (ve sıklıkta bir şekilde, bu aynı aralığı yeniden hesaplayamazsınız). aynı veriden tekrar tekrar birçok kez), tek yapmanız gereken herhangi bir aralığın olasılığıdır.


Komik tarafı notu: Bu sitenin yazım denetleyicisi, sıkça yazılan kelimeyi, kıvırcık altını çizmeye layık bulur. Bu site gizlice bayesanlar tarafından yönetiliyor mu? Sanırım öyle değil, çünkü
bayesanlar

4

Güven aralığının “gerçek parametrenin aralık içinde kalma olasılığını” belirtmemesinin nedeni, aralık belirtildikten sonra, paramater ya içindedir ya da yoktur. Bununla birlikte, örneğin% 95'lik bir güven aralığı için, değeri içeren bir güven aralığı oluşturma% 95 şansınız vardır. Bu kavraması oldukça zor bir kavram, bu yüzden onu iyi ifade etmiyor olabilirim. Daha fazla açıklama için http://frank.itlab.us/datamodel/node39.html adresine bakın .


2
Bir bilgisayarı bir güven aralığı hesaplamak için programladığınızı, ancak çıktıya bakmadığınızı varsayalım. Çıktıyı görmeden önce, aralığın doğru parametreyi içerme ihtimalinin% 95 olduğunu biliyorsunuzdur (tıpkı bir madeni para çevirme sonucunu görmeden önce olduğu gibi,% 50 kafa şansı olduğunu biliyorsunuzdur). Daha sonra çıktıya bakmak, bu durumu değiştirir , ilk etapta doğru parametreyi bilmemeniz koşuluyla (jeton çevirme sonucuna bakmanın kafaların olasılığını% 50'den 1'e değiştirdiğine katılıyorum. veya 0)?
Elliott,

Dahası, bir ayrım olduğu konusunda hemfikir olsam da, yukarıdaki "argüman" ın neyin aynı olduğunu gösteren yanlış olduğunu merak ediyorum.
Elliott,

2
@Elliott Sorularınız bu benzetmeyle aynı görünüyor: adil bir yazı tura aldınız. Ergo, kafaların olasılığı% 50'dir. Şimdi yazı tura bakıyorsunuz ve kafalar. Bu hangi şekilde kafaların olasılığını değiştirir? Cevap, öyle olmamasıdır, çünkü olasılık, sonuçlara değil madeni para sayma prosedürüne atıfta bulunur. Bana bahsettiğiniz karşı örnek aynı şekilde çalışıyor gibi görünüyor: prosedür parametrenin kapsanması için% 50 şansa sahip olabilir, ancak aslında parametrenin gerçekten kapsandığını doğrulamak mümkün olmuştur. Ne olmuş yani?
whuber

Adil bir madalyonun başkan olma olasılığını değiştirmekten bahsetmiyorum; Bunun yerine, bu belirli madalyonun kafa olması olasılığını değiştirmekten bahsediyorum. Çarptıktan sonra ve bakmadan önce, söz konusu olasılığın% 50 olduğunu iddia ediyorum, çünkü bu tür vakaların yaklaşık yarısı kafalı bir madeni para içeriyor. Öte yandan, baktıktan ve kafaları gördükten sonra, bu tür vakaların% 100'ünde kafaları yukarı çıkan bir madeni para var (madalyonun üstüne baktığımda ve kafaları göremediğimde kuyruklu vakalar ortadan kalktı).
Elliott,

Durumdan sonra, parametrenin kapsandığını doğrulamanın mümkün olabileceğini kabul ediyorum. Cevabım "ne olmuş?" "yani yukarıdaki tartışmam (asıl soruda) yanlış olmalı ve neyin yanlış olduğunu merak ediyorum".
Elliott,

4

Bir frekans uzmanının, belirli bir numune için güven aralığında yatan bir istatistiğin gerçek (popülasyon) değerinin herhangi bir olasılığı olduğunu söyleyebileceğini sanmıyorum. Ya öyle ya da değil, ancak belirli bir olay için uzun süreli bir sıklık yok, sadece istatistiksel bir prosedürün tekrarlanan performansını alarak elde edeceğiniz olayların popülasyonu yok. Bu nedenle, “inşa edilen güven aralıklarının% 95'i istatistikin gerçek değerini içerecektir” gibi ifadelere bağlı kalmamız gerekiyor, ancak “değerin gerçek değerin bu hesap için hesaplanan güven aralığında yatma olasılığı” yok. Numune". Bu, p'nin herhangi bir değeri için doğrudur, basitçe, bir olasılığın gerçekte ne olduğunun sıkça tanımlanmasıyla mümkün değildir. Bir Bayesian olsa güvenilir bir aralık kullanarak böyle bir açıklama yapabilir.


3

E[a,b]

E~(L(X),U(X))

Düzenleme: @G. Jay Kerns tartışmayı benden daha iyi hale getiriyor ve daha hızlı yazıyor, bu yüzden muhtemelen sadece ilerleyin :)


[a,b]

2
|

Bilmiyorum, seninki yerinde. :-)

2

E[a,b]ECCP(E|C)=P(E)P(E|C)=P(E)

P(E|C)=1P(E|C)=0


Bu belirli aralığın, [a, b] 'nin gerçek parametreyi içermesi olacağı için C'yi tanımladığımı göz önünde bulundurursam, E ve C / C' nin bağımsız olduğuna katılıyorum: C'nin meydana geldiğini bilmek, E'nin meydana geldiğini garanti eder. .
Elliott

Fakat C rastgele bir değişkendir! Her şey gerçekleştikten sonra tüm bu olayların tanımlarını değiştiriyorsunuz. Başka bir deyişle, C'yi bu özel olay olarak tanımlıyorsanız, o zaman C artık bir güven aralığı değildir.
raegtin

2
Sorun, eğer C, aralığın denemenin bu özel çalışmasında gerçek parametreyi içermesi durumunda, uzun bir çalışma sıklığına sahip değildir (bu belirli çalışma yalnızca bir kez olabilir) ve bu nedenle atayamazsınız. ona sıkça bir olasılık. Bu nedenle sıkça güvenme aralığının tanımı, çoğaltılmış deneylerin popülasyonu anlamındadır. Bayesian muhakemesini sıkcı bir ortama uyguluyor görünüyorsunuz ve olasılık tanımları arasında yanlış bir eşleşme var.
Dikran Marsupial

İşte ona bakmanın başka bir yolu. Yaptığınız şey şudur: Bir güven aralığı [a, b] elde etmek için bir hesaplama yapın. Bu özel güven aralığı [a, b] 'nin gerçek parametreyi içerdiği olay olarak C'yi tanımlayın. Ayrıca, E'nin bu özel aralığın [a, b] gerçek parametreyi içerdiği olayı olarak tanımlayın. Böylece, E ve C aynı olay!
raegtin

Aslında yaptığın şey bu. Aşağıdakileri yaptığınızı düşünüyor gibi görünüyorsunuz (ki değilsiniz): [a, b] aralığını almak için hesaplama # 1'i çalıştırın. Bu belirli aralığın [a, b] doğru parametre içerdiği olay olarak E'yi tanımlayın . Ardından, hesaplama # 1'i unutun ve C'yi, diğer hesaplanan herhangi bir aralığın [a ', b'] doğru parametre içerdiği bir olay olarak tanımlayın. Bu durumda, E ve C bağımsızdır.
raegtin

2

Burada çok fazla açıklama var, onları okumak için zamanım yok. Ancak temel sorunun cevabının kısa ve tatlı olabileceğini düşünüyorum. Verilerde koşulsuz olan bir olasılık arasındaki farktır. Veri toplamadan önce 1-alfa olasılığı, iyi tanımlanmış prosedürün parametreyi içerme olasılığıdır. Verileri topladıktan ve oluşturduğunuz belirli aralığı öğrendikten sonra, aralık sabittir ve bu nedenle parametre bir sabit olduğundan, bu koşullu olasılık ya 0 ya da 1'dir. Ancak, parametrenin gerçek değerini bilmediğimizden bile Verileri topladıktan sonra hangi değerin olduğunu bilmiyoruz.

Yazının Michael Chernick tarafından uzatılması form yorumlarını kopyaladı:

Mükemmel tahmin olarak adlandırılabilecek bir patolojik istisna vardır. X (n) = pX (n-1) + tr tarafından verilen birinci dereceden otoregresif bir sürecimiz olduğunu varsayalım. Durağan olduğundan p'nin 1 veya -1 olmadığını ve mutlak değerde <1 olduğunu biliyoruz. Şimdi en birbirinden bağımsız olarak karma bir dağılım ile dağıtılıyor, en = 0 olan bir pozitif olasılık q var.

Mükemmel tahmin olarak adlandırılabilecek bir patolojik istisna vardır. X (n) = pX (n-1) + tr tarafından verilen birinci dereceden otoregresif bir sürecimiz olduğunu varsayalım. Durağan olduğundan p'nin 1 veya -1 olmadığını ve mutlak değerde <1 olduğunu biliyoruz.

Şimdi en, bağımsız bir şekilde karışık bir dağılımla dağıtılmış bağımsızdır, en = 0 olan bir pozitif olasılık q vardır ve 1-q olasılıkla kesinlikle sürekli bir dağılıma sahiptir (yoğunluğun 0'dan uzak bir aralıkta sıfır olmadığını söyleyin. zaman serilerinden ardışık olarak ve p (X (i) / X (i-1) olarak tahmin edilen her bir değer çifti için veri toplar) şimdi, ei = 0 olduğunda, oran tam olarak p'ye eşit olacaktır.

Q sonunda 0'dan büyük olduğundan, oran bir değeri tekrarlayacaktır ve bu değer p parametresinin tam değeri olmalıdır çünkü eğer 0 olmayan ei değeri değilse, 0 ve ei / x (i -1) tekrar etmeyecek.

Bu yüzden sıralı durdurma kuralı, oran tam olarak tekrarlanıncaya kadar örneklemektir, daha sonra tekrarlanan değeri p'nin tahmini olarak kullanın. Yaptığınız herhangi bir aralık p olduğu için, bu tahminde ortalanmış olan, gerçek parametreyi dahil etme ihtimaline 1 sahiptir. Bu pratik olmayan patolojik bir örnek olsa da, hata dağılımı için ihtiyaç duyduğumuz özelliklere sahip durağan stokastik süreçler bulunmaktadır.


2
Bu birkaç yorum sırasında açıklanan örneği cevabınıza eklemeyi düşündünüz mü?
Makro

@Michael Ben ikinci Macro'nun yorumunu yapacağım. Lütfen yorumların genellikle diğer kullanıcılarla etkileşimde bulunmanın bir yolu olduğunu düşünün (örneğin, açıklama istenirken vb.) Ve her durumda bazen ' Stack Exchange'de üçüncü sınıf vatandaşlar ' olarak görüldüğünü unutmayın . Ancak, en son değiş tokuşumuzu takiben, bu yorum serisine nasıl devam edeceğinize karar vermenize izin vereceğim. Bu sözler burada bulunan bir dizi yorum için de geçerlidir .
chl

Cevaplara yorum koymuyorum çünkü birileri cevabın soruyu gerçekten cevaplamadığına karar verdiğinde, özellikle içlerinde çok fazla tartışması olan cevapları reddetmek gibi bir politika var gibi görünüyor. Yani cevaplar cevap vermek ve yorumların altında yorum yapmaktır. Yorumlarım karakter sınırını aşıyor, bu yüzden birkaç kullanıyorum.
Michael Chernick

@MichaelChernick Böyle bir politika yoktur, bu yüzden yorumlarınızı yazıya dahil ettim.

1
@MichaelChernick, bu siteyi yaklaşık bir yıldır düzenli olarak gönderiyorum ve moderatörlerin baskıcı olduğunu veya sitenin kurallarının kafa karıştırıcı olduğunu öne süren hiç kimseyi duymadım. Karşılaştığınız sorunlar: yayınlarınız, SSS'de açıkça tartışılan şeylerdir.
Makro

1

Hala yardımcı olabilecek birçok soru ve cevapla ilgili iki gözlem.

Kargaşanın bir kısmı, bu arada, 1940'lara kadar kesin bir matematiksel temel üzerinde olmayan, olasılık teorisinin daha derin bir matematiğine sarılmaktan geliyor. Örnek uzayları, olasılık alanlarını vb. Oluşturan şeylere girer.

İlk önce, bir yazı turası çevirdikten sonra% 0 olasılık olduğunu biliyoruz, eğer baş gelirse yazı gelmedi. Bu noktada olasılık hakkında konuşmak mantıklı değil; ne oldu ve biz bunu biliyoruz. Olasılık gelecekte bilinmeyenle ilgilidir, günümüzde bilinmeyenlerle ilgilidir.

Sıfır olasılığın gerçekte ne anlama geldiğiyle ilgili küçük bir sonuç olarak, şunu göz önünde bulundurun: adil bir sayımın, yukarı gelme ihtimalinin 0.5 ve yukarı gelme ihtimalinin 0.5 olduğunu varsayarız. Bu , sonuçların MECE (karşılıklı olarak özel ve tamamen ayrıntılı) olması nedeniyle, yazı veya yazı yazma % 100 şansına sahip olduğu anlamına gelir . Bununla birlikte, kafaları ve kuyrukları telafi etmede yüzde sıfır bir değişime sahiptir : 'Kafalar' ve 'kuyruklar' kavramımız, birbirini dışlayan olmalarıdır. Bu nedenle, bu yüzde sıfır şansa sahiptir çünkü 'yazı tura atmayı' düşündüğümüz (veya tanımladığımız) imkansızdır . Ve fırlatmadan önce ve sonra imkansızdır.

Tanım gereği, değil bu bir başka doğal sonucu, bir şey olarak imkansız olduğu olası. Gerçek dünyada, avukatların "bu belgeyi imzalamanız ve unutmanız mümkün değil mi?" Diye sormasından nefret ediyorum. Çünkü sorunun cevabı her zaman sorunun cevabıdır 'evet'. Bu konuda, cevabı da "evet" sorusudur, "kayıtsızlaştırma yoluyla Remulak 4 gezegenine nakletmeniz ve bir şey yapmaya zorlamanız mümkün değil mi? Olasılık çok düşük olabilir, fakat imkansız olmayan bir şey mümkün. Düzenli olasılık konseptimizde, yazı tura atmaktan bahsettiğimizde, başa çıkabilir; kuyrukları gelebilir; ve hatta ayakta durabilir veya (bir şekilde, uyuşturup yörüngeye çekilirken bir uzay gemisine gizlice girmişiz gibi) sonsuza dek havada yüzer. Ancak, fırlatmadan önce veya sonra, Aynı zamanda kuyruklar: Onlar, deneyin örnek uzayında karşılıklı olarak dışlanmış sonuçlardır ('olasılık örnek uzayları' ve 'sigma-cebirleri' konusuna bakın).

İkincisi, tüm bu Bayesci / Sıklıkçı felsefe felsefesinde güven aralıklarıyla ilgili olarak, eğer sıkça davranıyorsa, frekanslarla ilgili olduğu doğrudur. Bu nedenle, örneklenmiş ve tahmin edilen bir ortalama için güven aralığının% 95 olduğunu söylediğimizde, 'gerçek' değerin sınırlar arasında bulunduğundan% 95 emin olduğumuzu söylemiyoruz. Bu deneyi tekrar tekrar yaparsak, zamanın% 95'inin ortalamanın gerçekten de sınırlar arasında olduğunu bulacağımızı söylüyoruz. Bununla birlikte, bir koşuyla yaptığımız zaman zihinsel bir kısayol alıyoruz ve “% 95 haklı olduğumuzdan emin olduğumuzu” söylüyoruz.

Nitekim, bir deneye dayanan bir hipotez testinde standart kurulumun ne olduğunu unutmayın. Bir bitki büyüme hormonunun bitkilerin daha hızlı büyümesini sağlayıp sağlamadığını bilmek istiyorsak, belki ilk önce 6 aydan sonra bir domatesin ortalama büyüklüğünü belirleriz. Sonra tekrar ederiz, ancak hormonla birlikte ortalama büyüklüğü elde ederiz. Bizim sıfır hipotezi 'hormon çalışmaları vermedi' ve biz sınamak o . Ancak, eğer test edilen bitkiler ortalama olarak% 99'luk bir güven içinde, daha büyükse, bu “bitkiler nedeniyle ve ne kadar doğru tartığımızla ilgili her zaman rastgele bir değişiklik olacağı anlamına gelir; yüzlerce zaman. "


1

Mesele önceki ve arka ihtimalin karışıklığı veya belki de rastgele değişkenlerin eklem dağılımını bilmemenin memnuniyetsizliği olarak nitelendirilebilir.

Klima

n1nXYXYP(X=xY=y)=1/(n(n1))x,yN:={1,,n}xyP(X=x)=1/nP(Y=x)=1/nxN

tP(X=x)=1/nxNxNX=xP(X=x|Y=t)=P(X=xY=t)/P(Y=t)xt1/(n1)x=t0X=xY=tX=xX=xY=tP(X=x)=P(Y=x)=1/nxN

Kanıtlara şart koşmamak, kanıtları görmezden gelmek demektir. Bununla birlikte, olasılıksal modelde sadece neyin ifade edilebilir olduğunu şartlandırabiliriz. Örnekteki iki top ile olan örneğimizde, hava koşullarına veya bugün nasıl hissettiğimize şart koyamıyoruz. Böyle bir deneyle ilgili kanıt olduğuna inanmak için bir nedenimiz varsa, bu kanıtı resmi olaylar olarak ifade etmemize izin vermek için önce modelimizi değiştirmeliyiz.

CC=1X<YP(C=1)=1/2tP(C=1|Y=t)=(t1)/(n1)P(C=1|Y=1)=0C=1P(C=1|Y=n)=1C=1P(C=1)=1/2

Güven aralığı

X=(X1,,Xn)n(l,u)γXluRnθRP(l(X)θu(X))γ

C(l,u)C=1l(X)θu(X)P(C=1)γ

x=(x1,,xn)RnxiXiiC=1δ:=P(C=1|X=x)01(C=1X=x)((l(x)θu(x))X=x)l(x)θu(x)δ=0l(x)θu(x)X=xδ=1l(x)u(x)xδ{0,1}

P(C=1)γC=1x[l(x),u(x)][l(x),u(x)]θγ, bu kanıtı kabul etmek ve aynı zamanda onu görmezden gelmek anlamına gelir.

Daha Fazla Bilgi, Daha Az Bilmek

δXYxRP(X=x)P(Y=x)P(X=xY=y)x,yR(X,Y)

Y=7XP(X=x)x(x,7)xRxP(X=x)Y=7Y=77P(X=x)X=xP(X=x|Y=7)=P(X=xY=7)/P(Y=7)

YX


0

Knicks'in xbar - 2sd (x) ve xbar + 2sd (x) arasında attığı olasılığı geçmişte verilen bazı oyunlarda. . Bazı oyun örneklerinde verilen puanlar hakkında veri toplarsam ve bu aralığı hesaplarsam, geçmişte belirli bir günde o aralıkta kazanma olasılıkları kesinlikle sıfır veya birdir ve oyun sonucunu bulmak için google’a gidebilirsiniz. Frekansist için sıfır olmayan veya bir olasılık sürdüren tek nosyon tekrarlanan örneklemeden gelir ve belirli bir numunenin aralık tahmininin gerçekleştirilmesi ya bunun gerçekleştiği ya da o numunenin aralık tahmini verilmemiş olduğu sihirli noktadır. . Şifreyi girdiğiniz nokta bu değildir,

Dikran'ın yukarıda tartıştığı şey buydu ve cevabını oyladım. Tekrarlanan numunelerin dikkate alınmadığı nokta, yukarıdaki örnekte olduğu gibi şifreyi yazdığınızda veya sonucumdaki örneğindeki sonucu google yaparken, ayrık olmayan olasılıkların elde edilemez hale geldiği sıklık paradigmasındaki noktadır. Knicks oyunu, ancak örnek sayı sayınız = 1.


0

Modelleme

S=(Ω,Σ,P)EΣP(E)ESS

Adım (1) bir miktar boşluğa izin verebilir. Modellemenin uygunluğu bazen belirli olayların olasılıklarını sezgisel olarak beklediklerimizle karşılaştırarak test edilebilir. Özellikle, belirli marjinal veya koşullu olasılıklara bakmak, modellemenin ne kadar uygun olduğu hakkında bir fikir edinmeye yardımcı olabilir.

X1,,XnDist(θ)θR

Güven Aralığı Tahmincisi

γLRRnP(L(X)θR(X))γX=(X1,,Xn)L(X)R(X)xRnL(x)θR(x)

Tercihler

γ1γ2γ1<γ2Kazanıldıklarında ilk kazanandan daha yüksek bilet olma olasılığı. Gözlemleri oluşturan rastgele işlemlerin olasılıksal özelliklerine dayanan farklı gözlemlere (bu örneklerde iki bilet) ilişkin tercih iyidir. Not: Biletlerden herhangi birinin kazanan bilet olma olasılığının yüksek olduğunu söylemediğimizi unutmayın. Eğer böyle bir şey söylersek, konuşmacı bir anlamı olan "olasılık" ile bir anlamı olabilir, bu yüzden burada en iyi şekilde kaçınılmalıdır.

0.95

Basit Bir Öncelikli Örnek

θP(θ=0)=P(θ=1)=1/2ϑRθ=ϑX1,,XnN(ϑ,1)L,RγϑRP(L(X)ϑR(X)|θ=ϑ)γP(L(X)θR(X))γ

xRn(X1,,Xn)θL(x)R(x)P(L(x)θR(x)|X=x)fμnμσ=1

P(L(x)θR(x)|X=x)={f0(x)f0(x)+f1(x)if L(x)0R(x)<1f1(x)f0(x)+f1(x)if 0<L(x)1R(x)1if L(x)0 and 1R(x)0else
γθL(X)θR(X)γ

θxx{μ0,μ1}={0,1}

P(θ=μ0|X=x)=fμ0(x)fμ0(x)+fμ1(x)

0

"Gerçek parametrenin bu güven aralığında kalma olasılığı" diyebilirsek, o zaman numunenin boyutunu hesaba katamazdık. Örnek ne kadar büyük olursa olsun, ortalama aynı olduğu sürece, güven aralığı eşit genişlikte olacaktır. Ancak, "bunu 100 kez tekrarlarsam, o zaman 95 olguda gerçek parametrenin aralık dahilinde kalmasını beklerim" dediğimizde, örneklem büyüklüğünün boyutunu ve tahmimizin ne kadar emin olduğunu göz önünde bulunduruyoruz. . Örneklem büyüklüğü arttıkça, ortalama tahminde bulunacak değişkenlik azalır. Bu yüzden o kadar fazla değişmeyecek ve prosedürü 100 kez tekrarlarken, 95 olguda gerçek parametrenin aralık içinde olduğundan emin olmak için geniş bir aralığa ihtiyacımız yok.


Güven aralığının sık bir kavram olduğunu unutmayın.
Michael Chernick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.