Olasılıklardaki hata çubuklarının bir anlamı var mı?


25

İnsanlar sık ​​sık bazı olayların% 50-60 yaşanma şansı olduğunu söylüyor. Bazen insanların olasılık atamalarında açık hata çubukları verdiğini bile görüyorum. Bu ifadelerin herhangi bir anlamı var mı ya da sadece doğası gereği bilinmeyen bir şey için belirli bir sayı seçerken dilbilimsel bir rahatsızlık duygusu mu var?


1
Hesaplamalı öğrenme teorisindeki Muhtemelen Yaklaşık Doğru çerçeve, bunu yapmaz mı, tipik olarak olasılıkına sahip bir sınıflandırıcı hata oranına bir sınır vermez mi? Anlamsız bir kavram olsaydı, (son derece zeki) CoLT halkının onu tanıyamadıklarından şüpheliyim! 1δ
Dikran Marsupial

5
@DikranMarsupial PAC öğrenmedeki hatalar olasılıkların kendileri üzerinde değildir (bu soru hakkında sorulur), veriler üzerinde değildir. Yani, bir algoritmanın çıktısını, muhtemelen olasılıkla , cevabın gerçek değerin mesafesi içinde olduğunu ispatlayabilirsek Muhtemelen Yaklaşık olarak Doğru diyoruz . 1δε
Ayrık kertenkele

@Discretelizard, ancak bir sınıflandırma ayarında, bu bir hata oranına bağlı değil mi (bu bir hata olasılığıdır)? CoLT'a baktığımdan beri çok uzun zaman oldu!
Dikran Marsupial

1
@DikranMarsupial PAC-öğrenme için genel ortamda, 'yaklaşık' kısmı, 'olasılığını' değil, hatanın 'büyüklüğünü' ölçer. PAC sınırları için bir motivasyon, örneğin beklenen riskten daha ayrıntılı bir analiz elde etmektir. Sınıflandırma ayarlarında bunun değiştiğini sanmıyorum, ancak PAC'nin anlamlı olması için sınıflar arasında tanımlanmış bir 'mesafe' (veya kayıp fonksiyonu) olması gerekiyor. (daha özel ikili sınıflandırma durumunda, hata yapmanın tek bir yolu vardır, bu nedenle yaklaşık kısım bu durumda mantıklı olmaz)
Ayrık kertenkele

Yanıtlar:


36

Bilinen olasılıklardan bahsetmek mantıklı olmaz , örneğin adil para ile kafa atma olasılığı tanım gereği 0,5'tir. Ancak, ders kitabı örneğinden bahsetmiyorsanız, kesin olasılık asla bilinmez, sadece bunu yaklaşık olarak biliyoruz.

Farklı hikaye, verilerden olasılıkları tahmin ettiğinizde, örneğin satın aldığınız 12563 bilet arasından 13 kazanan bilet gözlemlediniz , bu verilerden 13/12563 olma olasılığını tahmin ediyorsunuz. Bu, numuneden tahmin ettiğiniz bir şeydir, bu nedenle belirsizdir, çünkü farklı numunelerle farklı değerleri gözlemleyebilirsiniz. Belirsizlik tahmini olasılıkla ilgili değil, tahminiyle ilgili.

Başka bir örnek, olasılık sabit olmadığında ancak diğer faktörlere bağlı olduğunda verilebilir. Araba kazasında ölme ihtimalinden bahsettiğimizi söyleyin. Doğrudan ve dolaylı olarak araba kazalarına yol açan tüm faktörler üzerinde marjinalleştirilen tek bir değer olan "küresel" olasılığı düşünebiliriz. Diğer taraftan, risk faktörleri göz önüne alındığında, olasılıkların popülasyon arasında nasıl değiştiğini düşünebilirsiniz.

Olasılıkların kendilerinin rastgele değişkenler olarak kabul edildiği daha pek çok örnek bulabilirsiniz , bu yüzden bunlar sabitlenmeye göre değişir.


1
Bir olasılık tahmininin hesaplanması, lojistik bir gerileme gibi bir şeyle yapıldıysa, bu "hata çubuklarının" tahmin aralıklarına atıfta bulunduğunu varsaymak da doğal olmaz mıydı? (Daha çok yükselteceğiniz ilk noktaya açıklık olarak soruyorum, +1 açıkçası)
usεr11852 diyor Reinstate Monic

1
@ us11112 gerçek duruma bağlı olarak güven aralıkları, tahmin aralıkları, en yüksek yoğunluklu bölgeler vb. Cevabı çok geniş verdim, çünkü birçok senaryoda "değişken" olasılıklarımız var ve farklı şekillerde değişiyorlar. Ayrıca bunları farklı senaryolarda farklı şekilde yorumlayabilirsiniz.
Tim

1
"Bilinen" olasılıklar bile çok küçük hata çubukları için kısa yoldan olabilir. Tahminen, bir madeni para çevirmenin belki de% 50.00000 dışında kalan küçük hata çubuklarını elde etmek için yeterli deneme ile% 50.00001 -% 49.99999 olduğunu gösterebilir. Asimetrik bir madeni para için bile ihtimalin kesin olması gerektiğini öneren hiçbir fiziksel yasa yoktur, ancak hata çubukları, herkesin umrunda bile olmayacak kadar küçüktür.
Nükleer Wang

5
@NuclearWang, OP'lerin "adil para" ifadesini kullanmasından kaynaklanmaktadır. Tanım olarak, adil bir madeni para için P (HEADS) 0,5'tir. Adil bir para matematiksel bir yapıdır. Bu noktayı vurgulamak için "fizik yasalarına göre" yerine "tanımı" yazan bir düzenleme öneririm.
De Novo GoFundMonica'yı

2
@DeNovo aynı stat.columbia.edu/~gelman/research/published/diceRev2.pdf fiziksel paraları için de geçerlidir , ancak evet, bu tartışmaya başlamaması için "adil" dedim
Tim

23

Xkcd'den en alakalı örnek :

görüntü tanımını buraya girin

İlgili başlıkla:

... 1.68'lik bir etki büyüklüğü (% 95 CI: 1.56 (% 95 CI: 1.52 (% 95 CI: 1.504 (% 95 CI: 1.494 (% 95 CI: 1.488) (% 95 CI: 1.485 (% 95 CI: 1.482) (% 95 CI: 1.481 (% 95 CI: 1.4799 (% 95 CI: 1.4791 (% 95 CI: 1.4784 ...


Bu, olasılıklardaki hata çubuklarının fazlalık olduğu anlamına mı geliyor?
BalinKingOfMoria

12
Şaka yapıyorum, bu, hata çubuklarının kesinliğinin belirsiz olduğu ve belirsizliğin değerlendirilmesinin sonsuz bir gerilemede kendisinin belirsiz olduğu anlamına gelir.
Xi'an,

7
Bu yüzden, tabloyu, istatistikteki hataları değerlendirmenin temel zorluğuyla (ve güzel mücadelesiyle) alakalı ve derinlemesine bağlantılı görüyorum.
Xi'an,

14
Bu şekil , bir olasılık üzerindeki belirsizlikle ilişkili olabilecek meta-belirsizliği göstermektedir , çünkü belirsizliğin kendisi bir olasılık dağılımının genişliğinin bir ölçüsüdür, ancak yazınız bunu hiçbir şekilde açıklamıyor; Aslında XKCD çizgi romanı, yanlış yayılma ile (yanlış olan), sorunun yapmadığı bir şey yapması gerektiğini öne sürüyor.
gerrit

6

İki yorum biliyorum. İlk Tim tarafından söyleniyordu: Biz gözlenen sahip X dışına başarılar Y biz denemeleri biz sürecin olasılığını tahmin edebilir IID inanıyorum eğer öyleyse, denemeler X/Y , bazı hata barları ile örneğin düzenin 1/Y .

İkincisi, “yüksek dereceli olasılıklar” veya üretim süreci hakkındaki belirsizlikleri içerir. Örneğin, ben bir zanaatkarın kumarbaz, tarafından imal elimde param var demek 0.5 olasılık 60% -heads sikke yaptı ve birlikte 0.5 olasılık 40% -heads sikke yaptı. En iyi tahminim, madalyonun geldiği% 50 şans, ancak büyük hata çubukları var: "gerçek" şans,% 40 veya% 60.

Başka bir deyişle, deneyi milyar kez çalıştırmayı ve X/Y (aslında sınırlayıcı kesir) başarılarının oranını almayı hayal edebilirsiniz . En azından Bayes bakış açısıyla, bu sayı etrafında örneğin% 95'lik bir güven aralığı vermek mantıklı geliyor. Yukarıdaki örnekte, mevcut bilgiler göz önüne alındığında, bu [0.4,0.6] . Gerçek bir madeni para için, belki de [0.47,0.53] veya başka bir şey olabilir. Daha fazlası için bakınız:

Daha Yüksek Mertebe Olasılıklara İhtiyacımız Var mı ve Varsa Ne Demek? Judea Pearl. UAI 1987. https://arxiv.org/abs/1304.2716


4

Tüm ölçümler belirsiz.

Bu nedenle, herhangi bir olasılık ölçümü de belirsizdir.

Olasılığın ölçülmesindeki bu belirsizlik görsel olarak bir belirsizlik çubuğuyla gösterilebilir. Belirsizlik çubuklarına sıklıkla hata çubukları olarak değinildiğini unutmayın. Bu yanlış ya da en azından yanıltıcıdır, çünkü belirsizlik gösterir ve hata göstermez (hata, ölçüm ile bilinmeyen gerçek arasındaki farktır, bu nedenle hata bilinmemektedir; belirsizlik, alındıktan sonra olasılık yoğunluğunun genişliğinin bir ölçüsüdür. ölçüm).

İlgili bir konu meta-belirsizliktir . Belirsizlik, bir posteriori olasılık dağılım fonksiyonunun genişliğini tarif eder ve A Tipi belirsizlik durumunda (tekrarlanan ölçümlerle tahmin edilen belirsizlik), belirsizlik konusunda bir belirsizlik kaçınılmazdır; metrologistler, metrolojik uygulamanın bu durumda belirsizliği arttırmayı istediğini söylediler (IIRC, eğer belirsizlik N tekrarlanan ölçümlerin standart sapması ile tahmin edilirse, bir sonuçta ortaya çıkan standart sapma N ile çarpılmalıdır.NN2 ), esasen bir meta-belirsizliktir.


3

Olasılık üzerindeki bir hata çubuğu nasıl ortaya çıkabilir? Diyelim ki prob(A|Θ=θ,I) . Eğer I ima Θ=θ0 , daha sonra prob(Θ=θ|I)=δθθ0 ve

prob(A|I)=θprob(A|Θ=θ,I)δθθ0=prob(A|Θ=θ0,I)

ΘIprob(Θ=θ|I)prob(A|I)AΘ=θΘA

prob(A,Θ=θ|I)=prob(A|Θ=θ,I)prob(Θ=θ|I)prob(A|I)=θprob(A|Θ=θ,I)prob(Θ=θ|I)

Bu nedenle, bir olasılığa hata çubukları eklemek, rahatsızlık parametrelerine belirsizlik eklemeye benzer, bu olasılığı değiştirebilir ancak belirsiz hale getiremez.


1

Olasılık olasılığına sahip olmak istediğiniz çok sık durumlar vardır. Örneğin, gıda güvenliği konusunda çalıştığınızı ve botulinum sporlarının çimlenme olasılığını (ve böylece ölümcül toksini ürettiğini) yiyecek hazırlama adımlarının (örn. Pişirme) ve kuluçka süresinin / sıcaklığının (cf kâğıt). Gıda üreticileri daha sonra bu modeli güvenli "son kullanma" tarihleri ​​belirlemek için kullanmak isteyebilir, böylece tüketicinin botulizm riski uygun şekilde küçüktür. Bununla birlikte, model sonlu bir eğitim örneğine uygundur, bu nedenle çimlenme olasılığının 0,001'den küçük olduğu bir kullanım tarihi seçmek yerine 0,001'den daha düşük bir tarih seçmek isteyebilirsiniz. Çimlenme olasılığının 0,001'den az olduğundan% 95 emin olabilirsiniz. Bu, Bayesian bir ortamda yapılması oldukça doğal bir şey gibi görünüyor.


0

tl; dr - Belirli bir tahminciden gelen tek seferlik tahmin, tek bir olasılık olarak azaltılabilir. Ancak, bu sadece önemsiz durum; Olasılık yapıları, sadece tek bir olasılık dışında bir bağlamsal ilişki olduğunda ne zaman anlamlı olabilir.


Başlarına rastgele madeni para çıkarma şansı% 50'dir.

Adil bir madeni para olup olmaması önemli değil; En azından bana değil. Madeni para, bilgili bir gözlemcinin daha bilinçli tahminler yapmak için kullanabileceği önyargıya sahip olsa da,% 50 oran tahmin etmek zorunda kalacağım.

HeadsTails50%50%.
First flipSecondflipHeadsTailsHeads25%25%Tails25%25%,
Same sidetwiceHeadsand Tails50%50%.

PHeads,

HeadsTailsPHeads1PHeads.
First flipSecondflipHeadsTailsHeadsPHeads2PHeads(1PHeads)TailsPHeads(1PHeads)(1PHeads)2,
Same sidetwiceHeadsand Tails12PHeads(1PHeads)2PHeads(1PHeads).
PHeads,50%,

Demek aynı şey değil mi?

İki Başlı veya Kuyruklu kazanma ihtimalinin, tamamen adil bir madalyonun özel durumu dışında her zaman birinden daha yüksek olduğunu ortaya koyuyor. Bu nedenle, olasılığın kendisinin belirsizliği yakaladığını varsayarsak, tabloyu düşürürseniz, öngörüleriniz uzatıldığında saçma olur.

PHeads

50%",probably about 50%".

Ve söylemeye çalıştığım şey kabaca:

50%.


İnsanlar sık ​​sık bazı olayların% 50-60 yaşanma şansı olduğunu söylüyor.

Onlarla oturup, onların tüm verilerini, modellerini vb. Çözdüyseniz, daha iyi bir sayı ya da ideal olarak tahminde bulunma kabiliyetlerini daha sağlam bir şekilde yakalayan daha iyi bir model oluşturabilirsiniz.

PKafalar=50%


0

Sadece hata çubuklarının önemli olduğunu, ancak verilen örnekte her şeyin muhtemelen neredeyse anlamsız olduğunu iddia ediyorum .
Örnek, bir dereceye kadar kesinlik derecesinin üst ve alt sınırlarının olasılık aralığı olduğu bir güven aralığı olarak yorumlanmasına katkıda bulunur. Bu önerilen cevap bu yorumlamayı ele alacaktır. Çoğunluk kaynağı - https://www.amazon.com/How-Measure-Anything-Intangibles-Business-ebook/dp/B00INUYS2U


Örnek, verilen bir güven düzeyinde, cevabın% 60'ın üzerinde olmasının ve eşit derecede% 50'nin altında olmasının muhtemel olmadığını söylüyor. Bu o kadar kullanışlıdır ki,% 55'lik bir swag ayrıca% +/- 5 aralığına swagging işlemine "binme" ye benzer. Tanıdık bir şekilde yuvarlak sayılar hemen şüphelenilir.
Bir güven aralığına varmanın bir yolu, seçili bir güven seviyesine karar vermektir - en% 90 diyelim - ve olayın tahminimizden daha düşük veya daha yüksek olmasına izin verdik, ancak bunun sadece% 10'luk bir şansı olduğuna izin veriyoruz. "doğru" cevap aralığımızın dışında kalıyor. Bu nedenle, "bu üst sınırdan daha büyük olma özelliğine uygun cevabın sadece 1/20 şansı var" ve alt sınır için de benzer şekilde yüksek bir sınır olduğunu tahmin ediyoruz. Bu, bir ölçüm şekli olan “kalibre edilmiş tahmin” ile veya diğer ölçüm şekilleriyle yapılabilir.
Ne olursa olsun, A) meselesi, baştan beri belirsizliğimizle ilgili bir belirsizlik olduğunu itiraf etmek ve B) ellerimizi şeye atmaktan, bir karışıklık olarak adlandırmaktan ve sadece% 5'in üzerinde ve altında dokunmaktan kaçının. Bunun yararı, seçilen bir dereceye kadar titiz olan bir yaklaşımın matematiksel olarak hala geçerli olan, matematiksel olarak ifade edilebilecek bir dereceye kadar sonuç verebilmesidir: "Doğru cevabın bu iki sınır arasında uzanması% 90 şansı ..." Düzgün bir şekilde oluşturulmuş bir güven aralığı (CI) olup, diğer hesaplamalarda da kullanılabilir.
Dahası, kendinize güven vererek, tahminlere göre sonuçları karşılaştırarak ve tahmin yöntemini geliştirmek için ne bulduğumuza göre hareket ederek tahmine ulaşmak için kullanılan yöntemi ayarlayabiliriz. Hiçbir şey mükemmel yapılamaz, ancak birçok şey% 90 etkili yapılabilir.
% 90 CI’nin OP’de verilen örneğin alanın% 10’unu içerdiği ve% 90’ını ihmal ettiği gerçeğiyle ilgisi olmadığını unutmayın. Boeing 747-100'ün
kanat açıklığı % 90 CI nedir? Eh,% 95’in 300 ft’ten daha fazla olmadığından eminim ve eşit olarak 200 ft’ten az olmadığından eminim. Bu yüzden kafamın üstünden 200% 90 CI vereceğim -235 feet.
Not "merkezi" bir tahmin olmadığını. CI, tahminler artı geçiştirme faktörleri ile oluşturulmaz. Bu yüzden hata çubuklarının belirli bir tahminden daha önemli olduğunu söylüyorum.


Bununla birlikte, bir aralık tahmini (yukarıdaki her şey) mutlaka doğru şekilde hesaplanmış bir hatayı içeren bir nokta tahmininden daha iyi değildir (bu noktada benim hatırladığımın ötesinde - sadece sık sık yanlış yapıldığını hatırlıyorum). Ben sadece aralıklarla ifade edilen birçok tahminin - yuvarlak sayılarla çoğu aralığın - aralık veya nokta + hata tahminleri yerine point + fudge olma tehlikesini taşıyacağımı söylüyorum .


Bir doğru kullanımı noktası + hatasının:

"Bir makine bardaklara sıvı dolduruyor ve bardakların içeriği 250 g sıvı olacak şekilde ayarlanması gerekiyor. Makine her bardağı tam olarak 250.0 g ile dolduramadığından, ayrı bardaklara eklenen içerik bir miktar değişkenlik gösteriyor. ve rastgele bir X değişkeni olarak kabul edilir. Bu değişimin normal olarak 250 g'lık bir ortalama sapma ile 2.5 g'lık bir standart sapma ile dağıldığı kabul edilir Makinenin uygun şekilde kalibre edilip edilmediğini belirlemek için Sıvı bardaklar rastgele seçilir ve bardaklar tartılır. Elde edilen ölçülen sıvı kütleleri X1, ..., X25, X.

Anahtar nokta: Bu örnekte, hem ortalama hem de hata, tahmin edilen / ölçülen değil, belirtilir / varsayılır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.