Güven aralıkları yararlı mı?


11

Sıklık istatistiklerinde,% 95 güven aralığı, sonsuz sayıda yinelenirse zamanın% 95'inde gerçek parametreyi içerecek olan aralık üreten bir prosedürdür. Bu neden faydalı?

Güven aralıkları genellikle yanlış anlaşılmaktadır. Bunlar , parametrenin içinde olduğundan% 95 emin olabileceğimiz bir aralık değildir (benzer Bayesian güvenilirlik aralığı kullanmıyorsanız). Güven aralıkları bana bir yem ve geçiş gibi geliyor.

Düşünebileceğim bir kullanım örneği, parametrenin bu değer olduğu yönündeki sıfır hipotezini reddedemeyeceğimiz değerler aralığını sağlamaktır. P değerleri bu bilgileri sağlamaz mı, daha iyi olur mu? Bu kadar yanıltıcı olmadan mı?

Kısacası: Neden güven aralıklarına ihtiyacımız var? Doğru yorumlandıklarında nasıl faydalı olurlar?



Bayes güvenilirlik aralığı, parametrenin içinde olduğundan% 95 emin olabileceğimiz bir aralık değildir.
Sextus Empiricus

@MartijnWeterings: Öncekinizden% 100 emin değilseniz.
Xi'an

Bir parametre zaman Xi'an @ çalışır uygun rastgele değişken olarak gereken% 100 kesindir ve bir deney, bir ortak sıklık dağılımı numune gibidir , P (θ , yani siz Bayes kuralı kullanabilirsiniz: P ( İçeride ISTV melerin RWMAIWi'nin | x ) = Açık 'önceki' olmadan P ( θ , x ) / P ( x ) . Sabit olduğu düşünülen bir parametre için aynı değildir. Sonra arka inançlar, X ve θ 'nin eski ortak frekans dağılımını da' güncellemenizi 'gerektirir.P(θ,x)P(θ|x)=P(θ,x)/P(x)Xθ. % 100 emin olan 'önceki inançları' güncellediğini iddia etmek biraz saçma.
Sextus Empiricus

Yanıtlar:


10

Güven aralığı rastgele olarak değerlendirildiği sürece (yani, verileri henüz görmediğimiz bir dizi rastgele değişken olarak ele alma perspektifinden bakıldığında), gerçekten de bu konuda faydalı olasılık ifadeleri yapabiliriz. Özellikle, θ parametresi için seviye 1α bir güven aralığınız olduğunu ve aralığın L ( x ) U ( x ) sınırları olduğunu varsayalım . Sonra şunu söyleyebiliriz:θL(x)U(x)

P(L(X)θU(X)|θ)=1αfor all θΘ.

Sıkça yapılan paradigmanın dışına çıkmak ve herhangi bir önceki dağıtım için marjinalize etmek θ üzerine karşılık gelen (zayıf) marjinal olasılık sonucunu verir:

P(L(X)θU(X))=1α.

Verileri X=x sabitleyerek güven aralığının sınırlarını sabitlediğimizde, artık bu olasılık ifadesine itiraz etmiyoruz, çünkü şimdi verileri düzelttik. Bununla birlikte, güven aralığı rastgele bir aralık olarak ele alınırsa, bu olasılık ifadesini gerçekten yapabiliriz --- yani, olasılık 1α ile θ parametresi (rastgele) aralığın içine düşecektir.

Sıklık istatistiklerinde, olasılık ifadeleri, sonsuz tekrarlanan denemelere göre göreli frekanslarla ilgili ifadelerdir. Ancak bu, sıklık paradigmasındaki her olasılık ifadesi için geçerlidir , bu nedenle itirazınız göreceli frekans ifadelerine yönelikse, bu güven aralıklarına özgü bir itiraz değildir. Eğer sıklık paradigmasının dışına çıkarsak, bu olasılık ifadesini marjinal olarak (yani veriler üzerinde koşullu değil) yaptığımız sürece, bir güven aralığının hedef parametresini istenen olasılıkla içerdiğini meşru bir şekilde söyleyebiliriz ve böylece güven aralığını ele alırız rastgele anlamda.

Başkalarını bilmiyorum, ama bu bana oldukça güçlü bir olasılık sonucu ve bu aralık için makul bir gerekçe gibi görünüyor. Kendimi Bayes yöntemlerine daha kısmi davranıyorum, ancak güven aralıklarını (rastgele anlamda) destekleyen olasılık sonuçları, koklanmayacak güçlü sonuçlardır.


1
"Sıkça yapılan paradigmanın dışına çıkmak" tam olarak sorun değil mi? Genel olarak, bir olasılıkla ilgili bir parametrenin gerçek değerini içeren bir aralık isteriz. Hiçbir sıklık analizi bize bunu veremez ve bunu Bayes analizi olarak dolaylı olarak yeniden yorumlamak yanlış anlamalara yol açar. Soruyu Bayesce güvenilir bir aralıkta doğrudan cevaplamak daha iyidir. Kalite kontrol gibi art arda "deneyler" yaptığınız güven aralıkları için kullanımlar vardır.
Dikran Keseli

Bu, Bayesci olarak dolaylı olarak yeniden yorumlama meselesi değildir (ikincisi, verilerin posterior elde edilmesi için şart koşacaktır). Cevap sadece OP'ye güven aralığı hakkında yararlı olasılık ifadeleri yapabileceğimizi gösteriyor. Sıkça yapılan paradigmaya daha genel itirazlara gelince, bunlar iyi ve iyidir, ancak güven aralıklarına özgü itirazlar değildir.
Ben - Monica

1
Yukarıdaki olasılık ifadelerinden de görebileceğiniz gibi, buna bir a priori baktığımız sürece CI'nin bir olasılıkla parametreyi içerdiğini garanti edebiliriz .
Ben - Monica

1
Sıkça yapılan paradigmadan çıktınız, ancak Bayesci bir çerçeveye geçmediyseniz, hangi çerçeve? Sıklığa karşı bir itiraz ifade etmiyordum, gerçekten sormak istediğiniz soruya en doğrudan cevap veren çerçeveyi kullanmanız gerektiğine inanıyorum. Güven ve güvenilir aralıklar farklı soruları cevaplar.
Dikran Marsupial

1
@Dikran: Olasılık ifadesi yazılı gibi duruyor ve saf bir matematik ifadesidir. Buna nasıl itiraz edebileceğinizi gerçekten görmüyorum.
Ben - Monica'yı eski durumuna döndür

5

Yukarıdaki @Ben ile hemfikirim ve bir Bayesyan ile Frequentist aralığın aynı durumda nerede olacağına dair basit bir örnek sunacağımı düşündüm.

Paralel montaj hatlarına sahip bir fabrika düşünün. Bir hattı durdurmak pahalıdır ve aynı zamanda kaliteli ürünler üretmek isterler. Zaman içinde hem yanlış pozitif hem de yanlış negatiflerden endişe ediyorlar. Fabrika için bu ortalama bir işlemdir: yanlış pozitiflere karşı hem güç hem de garantili koruma önemlidir. Güven aralıkları ve tolerans aralıkları fabrika için önemlidir. Bununla birlikte, makineler hizadan çıkar, yaniθΘ ve algılama dişli sahte olayları gözlemleyeceksiniz. Ortalama sonuç önemlidir, ancak belirli bir sonuç operasyonel bir ayrıntıdır.

Bunun karşı tarafında tek bir ürün veya tek bir ürün satın alan tek bir müşteri var. Montaj hattının tekrarlama özelliklerini umursamıyorlar. Satın aldıkları tek ürünle ilgileniyorlar. Müşterinin NASA olduğunu hayal edelim ve bir spesifikasyonu karşılamak için ürüne ihtiyaçları var.γΓ. Satın almadığı parçaların kalitesini umursamıyorlar. Bir çeşit Bayes aralığına ihtiyaçları var. Ayrıca, tek bir başarısızlık birçok astronotu öldürebilir ve milyarlarca dolara mal olabilir. Satın alınan her bir parçanın spesifikasyonları karşıladığını bilmeleri gerekir. Ortalama ölümcül olurdu. Satürn V roketi için, yüzde bir kusur oranı Apollo uçuşları sırasında 10.000 kusurlu parçayı ima ederdi. Tüm görevlerde% 0 kusur istediler.

Fabrikada olduğu gibi numune alanında çalışırken bir güven aralığına sahip olmanızdan endişe ediyorsunuz. Örnek alan yaratmaktadır. Parametre alanında çalışırken, müşterinin yaptığı gibi güvenilir aralıklar için endişeleniyorsunuz. Sizinkinin dışındaki gözlemleri önemsemiyorsanız, o zaman Bayesisiniz. Görülmemiş, ancak görülebilen örnekleri önemsiyorsanız, o zaman bir Frequentistsiniz.

Uzun vadeli ortalama veya belirli bir olayla ilgileniyor musunuz?


NASA aslında Bayes aralıklarına göre parça satın alıyor mu? Ne demek istediğini anlıyorum, ama gerçekten yapıyorlar mı?
Aksakal

@Aksakal bilmiyorum. Juran, elbette, NASA'da kalite güvencesi üzerinde harika bir çalışma yazdı, ancak test sürecinin okuduğumdan beri on yıldan fazla olduğu için tartışıldığını hiç hatırlayamıyorum. W Edwards Deming'in güvenilir aralıklar lehine güven aralıklarına karşı olduğunu biliyorum, ama yine bu doğrudan doğruya değil. Benim tahminim ve ben tanıyacak insanları tanıyorum ama şu anda sormak zor, Frequentist yöntemleri kullanıyorlar çünkü çoğu insanın eğitim aldığı şey bu. Sahip olduğunuz çekiç kullanıyorsunuz.
Dave Harris

Yine de "çekiç" midir? Belki de işlerin mühendislikteki şekliyle bir ilgisi vardır?
Aksakal

@Aksakal Ben buna kanaat getiremiyorum.
Dave Harris

Bir şirketin parça yaptığını, α düzeyinde kompozit hipotez testi H 0 : γ > Γ onları hatalar için test ettirdiğinizi varsa: x hatasız geçer ve y başarısız olur. NASA'ya makul bir garanti verebilirsiniz. Testi yanlışlıkla geçebilecek maksimum ürün miktarı (hatalı olarak yanlış kabul edilir) n α'dır . X eşya sattığınızı bilerek, satılan parçanın aslında alternatif hipotez γ Γ ile uyumlu olmadığı maksimum olasılığını hesaplayabilirsiniz . nαH0:γ>ΓxynαxγΓ
Sextus Empiricus

4

Tarafından unutmayın sıkı , güven aralığı tanımı onu ise onlar, yani tamamen anlamsız olması mümkündür, ilgilenilen parametresi hakkında bilgilendirici değil. Bununla birlikte, pratikte, genellikle çok anlamlıdırlar.

[0,1]UminUmaxUmin,UmaxUmin<Umax[0.01,0.011]pp .

Öte yandan, çoğu güven aralığı daha kullanışlı bir şekilde oluşturulmuştur. Örneğin, bunun bir Wald Aralığı prosedürü kullanılarak oluşturulduğunu söylersem, biliyoruz ki

p^ ˙ N(p,se)

sep^p


2

Güven aralıkları sadece yararlı değil, aynı zamanda fizik gibi bazı alanlarda da gereklidir. Ne yazık ki, CI'lerle ilgili en fazla gürültü, genellikle sosyal "bilimler" ve diğer bilim benzeri disiplinler bağlamında, Frequentists ile sahte tartışmalarda yakalanan Bayeslilerden geliyor.

Fizikte elektrik yükü gibi bir miktarı ölçtüğümü varsayalım. Ben her zaman, genellikle standart bir sapma olan değerin belirsizliğini ölçmek isterim. Fizikte hatalar genellikle Gauss olduğundan, bu doğrudan CI'ye çevrilir. Bununla birlikte, hatalar Gaussian olmadığında, biraz karmaşıklaşır, bazı integrallerin değerlendirilmesi gerekir. Genellikle çok ezoterik bir şey yoktur.

İşte Parçacık fiziğinde CI ve tanımı konusunda kısa bir tanıtım:

böyle bir aralığın çok sayıda tekrarlanan deneyde parametrenin gerçek değerini içereceği zamanın kesiti hakkında nicel ifade

Not, Fizik "tekrarlanan deneylerde" genellikle bir hazır anlama sahip olduğu: o en farz Eğer kağıt aslında tekrar deneyler can ve olurdu aslında gözlemlemek o kısmını. Dolayısıyla, CI'nin sizin için neredeyse gerçek bir anlamı vardır ve ölçümün belirsizliği hakkındaki bilgileri ifade etmenin bir yoludur. Bu bir düşünce deneyi değil, sübjektif bir görüş değil, sizin ya da olasılıklarla ilgili duygularım vb. Değil. Deneylerden tasarlayabildiğiniz ve denemenizi yeniden üretirken gözlemleyebilmem gereken şey bu.


1

Bu konu Frequentist ve Bayesian tartışmalarına hızla dönüştü ve bu kolayca çözülemez. Her iki yaklaşımdaki matematik sağlamdır, bu yüzden her zaman felsefi tercihlere iner. Olasılığın nispi sıklığının limiti olarak olasılığın sıkça yorumlanması, büyük sayıların güçlü kanunu ile doğrulanır; tercih ettiğiniz olasılık yorumundan bağımsız olarak, bir olayın nispi frekansı olasılık 1 ile olasılığına yakınlaşacaktır.

Sık sık güven aralıkları gerçekten Bayes inandırıcı aralıklardan daha zordur. Bilinmeyen bir miktarı rastgele bir değişken olarak ele alarak, Bayesians bir aralığın bu miktarı bir miktar olasılıkla içerdiğini iddia edebilir. Frekansçılar bazı miktarları rastgele değişkenler olarak ele almayı reddederler ve sadece sabitleri içeren herhangi bir denklem sadece doğru veya yanlış olabilir. Bu nedenle, bilinmeyen bir sabiti tahmin ederken, frekans uzmanları olasılıkları dahil etmek için bunları bir RANDOM aralığıyla sınırlamalıdır. Bazı olasılıklarla rastgele bir değişken içeren bir aralıktan ziyade, bir frekansçı yöntem, bazıları bilinmeyen sabiti içeren birçok farklı olası aralık üretir. Kapsama olasılığı oldukça yüksekse, belirli bir aralığın bilinmeyen sabiti içerdiğini iddia etmek makul bir inanç sıçramasıdır (not,

Bir Bayesci, herhangi bir bilinmeyen miktarı rastgele bir değişken olarak ele almada Frequentist balks kadar inanç sıçramasına karşı duracaktı. Sıkça yapılan Neyman yapım yöntemi aslında bu tür inanç sıçramalarıyla utanç verici bir meseleyi ortaya çıkardı. Aktif olarak önlemeden (bir yaklaşım için Feldman ve Cousins, 1997'ye bakınız), nadir sonuçlar bir dağıtım parametresi için BOŞ güven aralıkları oluşturabilir. Böyle bir inanç sıçraması çok mantıksız olurdu! Bu örneği sıkça kullanılan yöntemlerle alay etmek için kullanan birkaç Bayesli gördüm, ancak frekansçılar tipik olarak "iyi çoğu zaman doğru bir aralık alıyorum ve yanlış varsayımlar yapmadan" yanıt veriyorlar. Bayes / frekansçı çıkmazın yöntemlerini uygulayan çoğu kişi için önemli olmadığını belirteceğim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.