XKCD’nin Frequentists’i ve Bayesians çizgi romanının nesi yanlış?


113

xkcd çizgi roman numarası 1132

Bu xkcd çizgi roman (Frequentists vs. Bayesians) , açıkça yanlış bir sonuç çıkaran sıkça istatistikçi ile dalga geçiyor .

Ancak bana göre, mantığının standart frekansçı metodolojiyi takip etmesi anlamında gerçekten doğru olduğu görülüyor.

Öyleyse benim sorum şu: "Frekansist metodolojiyi doğru şekilde uyguluyor mu?"

  • Eğer hayırsa: bu senaryoda doğru, sıkça bir çıkarım ne olurdu? Sık kullanılan metodolojideki güneş stabilitesi hakkındaki "önceki bilgiler" nasıl birleştirilir?
  • Varsa: wtf? ;-)


5
Hem frekans hem de Bayes bakış açısından çok yanlış olduğunu düşünüyorum. Her birinin en büyük eleştirisi: Birincisi, P değerleri sonuçta sezgiseldir ve istatistiksel problem, veri ve deney dahil bir çok şeyin özellikleridir. Burada, bu üç soru için bu üçü de haksız bir şekilde temsil edilmektedir. İkincisi, "Bayesian" Bayesian olması gerekmeyen bir karar teorik yaklaşım kullanır. Yine de komik.
Momo

5
İstatistik aleminden çıkarmak için .... güneş nova gidecek kadar büyük değil. QED, Bayesian haklı. ( Güneş bunun yerine Kırmızı Dev olacak )
Ben Brocka

3
Özellikle @Glen et alii, Randall Munroe'nin Gelman'a
jthetzel

2
Buradaki sık istatistikçinin aptal olmasının sebebi, sık görülmesi değil, makinenin nasıl çalıştığını açıkça bilmesi, bu nedenle bunun uygun olmayan bir ölçüm olduğunu bilmesi - ve yine de bir çıkarım yapmasıdır.
rvl

Yanıtlar:


44

Asıl mesele, ilk denemenin (Sun nova) tekrarlanamamasıdır, bu da bir olayı ne kadar sıklıkla verdiğimizi tahmin edebileceğimizi tahmin eden olasılığı yorumlayan sıkça metodoloji için son derece uygun değildir. Buna karşılık, bayesyen olasılık, önceden var olan tüm bilgileri veren inanç derecemiz olarak yorumlanır, bunu bir kerelik olaylar hakkında sağduyulu mantık için uygun hale getirir. Zar atma deneyi tekrarlanabilir, ancak herhangi bir sıkıntının ilk denemenin etkisini kasıtlı olarak görmezden gelmesi ve elde edilen sonuçların önemi konusunda kendinden emin olması pek olası değildir.

Her ne kadar yazar, tekrarlanabilir denemelere ve önceklerine güvensizliklerine sık sık güveniyor olsa da, deneysel düzeneğin sıkcı metodolojiye uygunluğunu vermemesine rağmen, bu çizgi romanın gerçek temasının sıkıcı olmayan bir metodoloji değil, genel olarak uygun olmayan metodolojiyi kör ettiğini söyleyebilirim. Komik olup olmadığı size kalmış (benim için) ama iki yaklaşım arasındaki farkları açıklığa kavuşturmaktan daha yanıltıcı olduğunu düşünüyorum.


1
(+1) Frekansizmdeki bu güçlü ve kritik tekrarlanabilirlik varsayımına ilişkin güzel bir referans, Bilimde İstatistiksel Çıkarım (2000) , bölüm 1'dir. (Hangisinin asıl olduğunu söylemenin zor olduğu birçok konu olmasına rağmen )

36
Tekrarlanabilirlik argümanı ile çok hızlı değil ... Birincisi, tekrarlanabilir deney Nova gerçeğini gidiş makinesinin değil güneş sorgulaması olan bu çıkarımın sabit fakat bilinmeyen nesne edilir. Sorgulama deneyi kesinlikle tekrar edilebilir ve eğer birkaç kez daha olsaydı, sıkça kullanılan strateji kolayca makul görünebilirdi.
conjugateprior

6
İkincisi, yine de, tekrarlanabilirlik işinde çok katı olmamalı, çoğu zaman deneysel olmayan durumlarda hiç bir şey çıkarılamamasına şaşırıp kalmış. Bir an için 'güneş novaya gidiyor' aday olayı kabul et. Ben fizikçiyim ama "güneş novaya gidiyor" olayının çok sık meydana geldiği (buralarda değil) bu yüzden bana bir tekrar gibi geliyor. Her durumda, David Cox gibi (“İstatistiklerin Temelleri” nde) halk neşeyle şunun gibi şeyler söyler: “tasarlanan tekrarlar neredeyse her zaman varsayımsaldır . Bu tek başına dezavantajsız görünüyor”.
conjugateprior

7
Güneşi, prensipte sadece kuantum bir aynaya sahip olsaydık, denemeyi tekrarlayabileceğimiz, paralel evrenlerdeki güneş popülasyonundan rastgele bir örnek olarak görebiliriz! ; o)
Dikran Marsupial 13:12

2
Neden patlayan güneş kontrolü tekrarlanabilir değil? Her sabah kontrol ediyorum ve havaya uçmadı.
GKFX

27

Frekanscı bit görebildiğim kadarıyla bu kadar makul:

Let güneş patlamamış olduğu hipotez olabilir ve H 1 sahip olduğu hipotezi olmak. Bu nedenle p değeri sonucu altında gözlemleme olasılığıdır ("evet" diyen makine) . Makinenin, nötrinoların bulunmadığını doğru bir şekilde tespit ettiğini varsayarsak, o zaman makine altında "evet" , bunun nedeni, makinenin bize iki altı yuvarlanmanın sonucu olarak bize . Bu yüzden p-değeri 1/36'dır, bu nedenle normal yarı-Fisher bilimsel uygulamasından sonra, bir sık ​​görüşmeci boş hipotezi % 95 anlamlılık düzeyinde reddeder .H0H1H 0H0H0

Ancak, boş hipotezi reddetmek, alternatif hipotezi kabul etme hakkınız olduğu anlamına gelmez, bu nedenle sık görüşmeci sonuçları analizle gerekçelendirilmez. Sık sık yapılan hipotez testleri, sahtekârlık fikrini (bir nevi) somutlaştırır, hiçbir şeyin doğru olduğunu ispatlayamazsınız, sadece ispat edemezsiniz. Öyleyse iddia etmek istiyorsan , doğru olduğunu kabul ve sadece tutarsız olduğunu gösterebilirsen devam et . Ancak bu, doğru olduğu anlamına gelmez , sadece testten kurtulduğu ve en azından bir sonraki teste kadar uygulanabilir bir hipotez olarak devam ettiği anlamına gelir .H 0 H 0 H 1H1H0H0H1

Bayesian aynı zamanda sadece sağduyudur, bahis yaparak kaybedecek bir şey olmadığını belirtmiştir. Yanlış-olumlu ve yanlış-olumsuz maliyetler hesaba katıldığında (Neyman-Peason?), Uzun vadeli kazanç açısından en iyi strateji olduğu sonucuna varacağına inanıyorum.

Özetlemek gerekirse: Hem frekans hem de Bayes dili burada özensizleşiyor: Uygun anlamlılık düzeyi, yanlış-pozitif / yanlış-negatif maliyetler veya problemin fiziğini göz önünde bulundurmadan bir tarifi takip etmek için sıklık . Bayesian, önceliklerini açıkça belirtmediği için özensiz davranıyor, ancak daha sonra sağduyu kullanarak kullandığı öncelikler açıkça doğru (makinenin güneşin patlamasıyla aslında yatması çok daha muhtemeldir), sloppiness belki de mazeretli.


4
Boş hipotezi reddetmek, basitçe gözlemlemenin H0 doğru olması ihtimalinin düşük olması anlamına gelir. Bu temelde H1'i “kabul etmemelisiniz” çünkü temel olarak H1'in doğru olması gerektiğini söyler, çünkü gözlemler H0 doğruysa muhtemel değildir. Bununla birlikte, gözlemlerin H1 (muhtemelen boş ritüeli görmezden gelir) altında olma olasılığı düşük olabilir ve H1 a a priori'den (boş ritüeli görmezden gelen) daha düşük olabilir. Hipotezleri kabul etmek, sıkça yapılan bir testin Bayesian testi olarak yorumlanmasına doğru kaygan bir eğimdir, bu genellikle daha az basit vakalarda yanlış anlamalara neden olur.
Dikran Marsupial

4
Sadece yorumunuzu tökezledi. Glassy'nin de sorduğu soru aynı. Yorumunuza itiraz etmek isterim; eğer hipotezleriniz bütün olay alanını kapsıyorsa, burada “Güneş neye gitmedi”, “Güneş neye gitmedi”}, “Neyi reddetme” noktasını anlamada zorluk çekiyorum. Güneş nova gitti "otomatik olarak yol açmaz" Güneş nova gitmedi ". Bir ifadeyi yanlış ilan etmek, olumsuzlamanın doğru olması gerektiği anlamına gelir. Mümkünse bu noktanın açık bir şekilde açıklandığı bazı güvenilir referans metinleri hazırlarsanız çok iyi olur. Daha fazla bilgi edinmek isterim.
anlam

3
Sıfır hipotezini reddetmek değil otomatik olarak alternatif hipotezi ile devam etmek mantıklıdır sadece, boş hipotez muhtemelen yanlış olduğu anlamına gelir. Bu, (kısmen) sıkça hipotez testi, hipotezlerin önceki olasılıklarını hesaba katmadığındandır. Daha temel olarak, herhangi bir belirli hipotezin gerçeğine bir olasılık atamak için sık kullanılan yöntemler kullanılamaz, bu nedenle "sıfır hipotezini reddedebiliriz" ile "sıfır hipotezi muhtemelen yanlıştır" arasındaki bağlantı tamamen özneldir; Görebiliyorum.
Dikran Marsupial

2
Bu benim açımdan, H1'i kabul edip etmediğimize dair karar özneldir ve “H0'ın reddedilmesi genellikle H1'in kabul edilmesine yol açar ” testinin sonucunun gerekli bir sonucu değildir . Sorun, karar vermeniz gereken bilgilerin [P (H0), P (H1), P (Z | H1)] testinde görünmemesidir. Temel olarak, bu bilgilerin bir kısmı eşiğin belirlenmesinde kısmen dahil edilmiştir, ancak bu genellikle eksiktir ve çoğu kez dengesiz ve haksız bırakılmıştır. Öncelikleri hala sık sık testlerde, eşit derecede öznel, ancak kapalı kalıyor - her iki dünyanın da en kötüsü! ; o)
Dikran Marsupial

3
@Dikran, son sözler birbirinizi iyi anlaşılması ve yorumlar bölümünü kötüye durdurmak sanırım, ama bir: Ne olursa subjektif H1 kabul seçmek subjektif seçim reddetmek için benim dayalı H0 [amip-reddetmek] subjektif seçilmiş dayalı benim P (H1) 'in subjektif uzman değerlendirmesi. "H1'i amip-reddedebildiğim için H1'i kabul etmeye mecbur değilim" demek, dilsel bir anlam ifade etmiyor. Ancak "H1'i% 5 seviyesinde reddedebildiğim için H1'i kabul etmeye mecbur değilim" demiştim. Benim asıl nokta: % 5 seviyesinde H0 reddetmek mümkün reddetme . α
amip

25

Bu sonuç neden "yanlış" gibi görünüyor? Bayes, sonucun karşı sezgisel göründüğünü söyler çünkü güneşin ne zaman patlayacağına dair “önceden” inançlarımız vardır ve bu makinenin sağladığı kanıtlar bu inançları ortadan kaldırmak için yeterli değildir (çoğunlukla nedeniyle belirsizlik nedeniyle bozuk para çevirme). Ancak sık görüşmeci böyle bir değerlendirme yapabilir, inanç yerine veri bağlamında bunu yapması gerekir.

Paradoksun asıl kaynağı, yapılan sık istatistiksel istatistik testinin mevcut tüm verileri hesaba katmamasıdır. Çizgi romandaki analizde bir sorun yok, ancak sonuç garip görünüyor çünkü güneşin uzun süre patlamayacağını biliyoruz. Ama bunu nasıl biliyoruz? Çünkü güneş patlayacağı zaman sınırlayabilecek ölçümler, gözlemler ve simülasyonlar yaptık. Bu nedenle, tam bilgimiz bu ölçümleri ve veri noktalarını dikkate almalıdır.

Bir Bayesian analizinde, bu bir önceliği inşa etmek için bu ölçümleri kullanarak yapılır (bununla birlikte, ölçümleri önceliğe çevirme prosedürü iyi tanımlanmamıştır: bir noktada önce bir başlangıç ​​olmalı, ya da hepsi kaplumbağalarıdır). aşağı yolu "). Bu nedenle, Bayesian önceliğini kullandığında, gerçekten de frekans uzmanının p-değeri analizinin özel olmadığı birçok ek bilgiyi dikkate alıyor.

Bu nedenle, eşit temelde kalabilmek için, problemin sık ve tam bir analizi, önce bayesleri inşa etmek için kullanılan güneş patlamasıyla ilgili aynı ek verileri içermelidir. Ancak, bir öncü kullanmak yerine, bir sık ​​görüşmeci basitçe diğer ölçümleri birleştirmek için kullandığı olasılığını artıracak ve p-değeri bu tam olasılık kullanılarak hesaplanacaktı.

L=LL

Tam bir sıklıkta yapılan analiz, olasılığın ikinci bölümünün çok daha kısıtlayıcı olacağını ve p-değer hesaplamasında baskın katkı olacağını gösterir (çünkü güneş ve bu bilgilerdeki hatalar hakkında zengin bilgilerimiz vardır. küçüktür (umarım).

Pratik olarak sık sık bir hesaplama yapmak için son 500 yıldan elde edilen tüm veri noktalarının toplanıp toplanmasına gerek yoktur, bunlardan biri güneşin patlayıp patlamamasına ilişkin belirsizliği kodlayan basit bir olasılık olabilir. Bu daha sonra Bayesian'ın öncülüğüne benzeyecek, ancak felsefi olarak biraz farklı olacak çünkü bir olasılık, önceki bir ölçümü kodladığı anlamına geliyor (bir öncekinin aksine, bazı öncül inancı kodlayan). Bu yeni terim, olasılığın bir parçası olacak ve güvenilir aralıklar veya posterler oluşturmak üzere entegre edilmiş olan bayesyeninin tersine, güven aralıkları (veya p-değerleri veya her neyse) oluşturmak için kullanılacaktır.


1
Bu kabul edilen veya en çok oylanan cevap olmalıdır.
Amelio Vazquez-Reina,

11

ptTPrÖb[Tt|'H0]Tχ2p0,1/36,2/36,...

Tabii ki, bu "sık sık" yaklaşımı bilimsel değildir, çünkü sonuç pek çoğaltılamaz. Güneş süpernovaya girdiğinde süpernova olarak kalır, bu yüzden dedektör tekrar tekrar "Evet" demeye devam etmelidir. Bununla birlikte, bu makinenin tekrar tekrar çalıştırılmasının tekrar "Evet" sonucu vermesi muhtemel değildir. Bu, kendilerini titizlikle sunmak isteyen ve deneysel sonuçlarını yeniden üretmeye çalışan alanlarda tanınıyor ... ki, anladığım kadarıyla,% 5 (her yerde orijinal makalenin yayınlanması saf tip bir hataydı) ve Bazı tıbbi alanlarda% 30-40 civarında bir yerde. Meta-analiz milleti sizi daha iyi sayılarla doldurabilir, bu sadece zaman zaman istatistik gevreği boyunca rastladığım vızıltıdır.

"Uygun" sıklık perspektifinden bir diğer sorun, bir kalıbın yuvarlanmasının güç = anlamlılık seviyesine sahip en düşük güçlü test olmasıdır (düşük değilse;% 5 anlamlılık düzeyi için% 2.7 güç, bununla ilgili bir şey değildir). T-testleri için Neyman-Pearson teorisi bunun bir UMPT olduğunu göstermek için acı çekiyor ve bir çok yüksek kaş istatistiki teorisi (zorlukla anladığım kadarıyla kabul etmeliyim), güç eğrilerini türetmeye ve verilen zaman koşullarını bulmaya adamıştır. Test, verilen bir sınıftaki en güçlü sınavdır. (Kredi: @Dikran Marsupial yorumlardan birinde iktidar konusunu dile getirdi.)

Bunun sizi sıkıntıya sokup sokmadığını bilmiyorum ama Bayesci istatistikçisi burada matematik bilmeyen ve kumar sorunu olan biri olarak gösteriliyor. Düzgün bir Bayesian istatistikçisi önceliği düşünür, nesnellik derecesini tartışır, postereri çıkarır ve verilerden ne kadar öğrendiklerini gösterirdi. Bunların hiçbiri yapılmadı, bu yüzden Bayesçi süreci en sık olduğu kadarıyla basitleştirildi.

Bu durum, kanser konusuna yönelik klasik taramanın bir göstergesidir (ve biyoistatistlerin bunu benden daha iyi tanımlayabildiğinden eminim). Kusurlu bir enstrüman ile nadir bir hastalığın taranması sırasında, pozitiflerin çoğu yanlış pozitif olarak ortaya çıkmaktadır. Akıllı istatistikçiler daha pahalı ve daha doğru biyopsilerle ucuz ve kirli tarayıcıları takip etmeyi daha iyi bilirler.


2
İlk paragrafınızı doğru anlarsam, eşiğin (komikte 0,05) çok yüksek olduğunu söylüyorsunuz. Çizgi roman iki yerine beş zar olsa, eşiği yeterince düşük olarak kabul eder miydin? Yine de eşiğe nasıl karar veriyorsunuz?
ShreevatsaR

9
Bayes istatistikçisinin, sadece güneş patlaması ihtimalinin makinenin yatma ihtimalinden çok daha küçük olduğunu düşündüğümü düşündüm (bu nedenle, mutlaka bahşişsiz bir kumarbaz değil).
josh

8
Daha
doğrusu

6
Bence buradaki nokta, frekansçı istatistikçilerin, analizin gerçek amacını düşünmeden bir tarif izliyor olmasıdır. "Bayesian" denilen şey aslında bir Bayesian değil, yalnızca sağduyularını kullanan biri. Bilim dergilerinde aşağıdaki pek çok kör tarif örneği vardır, bu yüzden karikatür komiktir.
Dikran Marsupial

3
Test istatistiğinin olmaması, bence sorun değil. Bir test istatistiği verilerin sadece bir fonksiyonudur. Böylece kimlik işlevi, yani burada referansın kendisi, en azından prensipte işe yaramış gibi görünüyor.
conjugateprior

6

Bu çizgi romanda yanlış olan bir şey yok ve sebebin istatistikle ilgisi yok. Bu ekonomi. Eğer frekansçı doğruysa, Dünya 48 saat içinde yaşanamaz bir yer olacak. 50 doların değeri etkin bir şekilde boş olacaktır. Bunu tanıyan Bayesian, normal durumda yararının 50 $ olduğunu ve marjinal olarak güneş patlaması durumunda hiçbir şey olmadığını bilerek bahsi yapabilir .


Bayesian istatistiklerini açık bir şekilde "bir kayıp fonksiyonunu minimize etmek" olarak modellediği için bu "istatistiklerle ilgisi var";)
Fabio Beltramini

5

Artık CERN, nötrinoların ışıktan daha hızlı olmadığına karar vermiştir - elektromanyetik radyasyon şoku, nötrino değişikliği fark edilmeden önce dünyaya çarpacaktır. Bu en azından (çok kısa vadede) muhteşem auroral etkilere sahip olacaktır. Böylece karanlık olması gökyüzünün aydınlatılmasını engellemez; ay aşırı derecede parlıyordu (bkz. Larry Niven'in "Tutarsız Ayı") ve yapay uydular gibi görkemli flaşlar buharlaştı ve kendiliğinden yandı.

Sonuçta - belki de yanlış test? (Ve daha önce olmuş olsa da - posteriorun gerçekçi bir şekilde belirlenmesi için yeterli zaman olmazdı.


1
O zaman, güneşin patladığı hipotezini reddetmek için tüm sebepler. :-)
ShreevatsaR

Öyleyse, yazarların “doğrulayıcı çalışmalara ihtiyaç var” dediği makalenin sonunda ne kastedilmektedir?
DW

Aslında, bu raslantı yeniden gözden geçirme net çıkarım başlığındadır. Makine güneşin dönüp gitmediğini algılar . Algılamada hata olasılığı yoktur. Nötrino bitinin önemi yoktur. Buna göre, istatistikler öyledir ki, makine "hayır", "hayır", "hayır" ... 'a 1/36 yanlış cevap verme (evet), istatistiği sona erdiren bir kereye mahsus olmak üzere cevap verir. süreç meydana gelir - bu aynı zamanda 1/36 oranında yanlış rapor edilme şansına da sahip olacaktır (hayır), eğer makine 8 tuhaf dakikalık aralıkta sorgulanırsa, yeryüzünde belirginleşmesi gerekir.
SimonN

4

@GeorgeLewis ile Frequentist yaklaşımın yanlış olduğu sonucuna varmak için erken olabileceğine katılıyorum - daha fazla veri toplamak için nötrino detektörünü birkaç kez daha deneyelim. Öncelikle uğraşmana gerek yok.


2

Buradaki tüm ayrıntılı cevaplar arasında kaybedilebilecek daha basit bir nokta, frekanserin tek bir örneğe dayanarak kararını vermesidir. Uygulamada bunu asla yapmazsınız.

Geçerli bir sonuca ulaşmak, istatistiksel olarak anlamlı bir örneklem büyüklüğü gerektirir (veya başka bir deyişle, bilimin tekrarlanabilir olması gerekir). Bu nedenle pratikte frekans uzmanı, makineyi birçok kez çalıştıracak ve daha sonra elde edilen veriler hakkında bir sonuca varacaktı.

Muhtemelen bu, makineye aynı soruyu birkaç kez daha sormayı gerektirir. Muhtemelen makine sadece yanlış ise her 36 kereden 1'i net bir şekilde ortaya çıkacaktır. Ve bu düzenden (tek bir okumadan ziyade tek bir okumadan), frekans uzmanı güneşin patlayıp patlamamasına ilişkin (oldukça doğru, söyleyebilirim) bir sonuç çıkartacaktır.


4
"İstatistiksel olarak anlamlı örneklem büyüklüğü" ile ne demek istiyorsunuz?
Momo

@Momo - Tek bir örnekten daha fazlası, bu kesin. İmkansız bir sonuç gözlemlemek ve daha sonra, tesadüf olmadığından emin olmak için ilk önce gözlemi tekrarlamadan imkansız olanın gerçekleştiğine karar vermek geçerli değildir. İstatistiksel olarak anlamlı bir örneklem büyüklüğünü temsil eden kesin bir sayı veya kesin bir sayı belirlemek için bir algoritma istiyorsanız, muhtemelen bir istatistikçi sağlayabilir; ama ben istatistikçi değilim.
Kasım'da

3
Örneklem büyüklüğü 1 ile ilgili belirli bir problemin olduğunu düşünmüyorum, sorun şudur, sorun testin istatistiksel bir güce sahip olmamasıdır (yani test yanlış olduğunda boş hipotezi asla reddetmeyecektir). Bununla birlikte, bu, makalede "istatistiksel ritüel" (ve H1'in gerçekte ne olduğu ya da sorunla ilgili önceki bilgiler) sorununu göz ardı eden “boş ritüel” ile ilgili bir sorunu ortaya koymaktadır.
Dikran Marsupial

1
@Dikran Bu mümkün olan en iyi cevaplardan biridir! Çizgi filmdeki "frekansçı" ile ilgili sorun , önce testin özelliklerinin gerekli değerlendirmesini yapmadan belirli bir istatistiksel ritüelin takip edilmesidir. (Bu karar için ne gibi bir kayıp fonksiyonunun olması gerektiğini göz önünde bulundurarak analizinizi bile uzatabilirsiniz.) Bu şekilde karikatür, istatistiksel prosedürler uygulayan tüm insanları, onları anlamadan veya varsayımlarını kontrol etmeden düzgünce büker.
whuber

2

Sorunuzun cevabı: "Frekansist metodolojiyi doğru şekilde uyguluyor mu?" hayır, kesinlikle sıkça yaklaşan bir yaklaşım uygulamıyor. Bu problemin p değeri tam olarak 1/36 değil.

İlk önce, söz konusu hipotezlerin

H0: Güneş patlamamış,

H1: Güneş patladı.

Sonra,

p-value = P ("makine evet döner" | | Güneş patlamamıştır).

Bu olasılığı hesaplamak için, "makine evet döndürür" ifadesinin "nötrino detektörünün Güneş patlamasını ölçer ve doğru sonucu söyler VEYA nötrino detektörü Güneş patlaması ve bize yalan söylemez" e eşdeğer olduğunu not etmeliyiz.

Zar atmanın nötrino dedektör ölçümünden bağımsız olduğu varsayılarak, p-değerini şu şekilde hesaplayabiliriz:

p0 = P ("nötrino dedektörü Güneş patlayanı ölçer" | Güneş patlamamıştır),

Sonra, p değeri

p-değeri = p0 x 35/36 + (1-p0) x 1/36 = (1/36) x (1+ 34 x p0).

Bu problem için, p değeri 1/36 ile 35/36 arasında bir sayıdır. P değeri 1/36 eşittir ve sadece p0 = 0 ise. Yani, bu çizgi filmdeki gizli bir varsayım, Güneş patlamazsa, dedektör makinesinin Güneş patlamasını asla ölçmeyeceğidir.

Ayrıca, devam eden bir anova patlamasının dış delilleri hakkında daha fazla bilgi verilmelidir.

Herşey gönlünce olsun.


1

Frekansçı yaklaşımında herhangi bir sorun görmüyorum. Boş hipotez reddedilirse, p-değeri tip 1 hatanın olasılığıdır. Bir tip 1 hatası gerçek bir boş hipotezi reddediyor. Bu durumda 0,028'lik bir p değerine sahibiz. Bu, şimdiye kadar yapılan bu p-değeri ile yapılan tüm hipotez testlerinde kabaca yüzün 3'ünün gerçek bir boş hipotezi reddedeceği anlamına gelir. Yapım gereği bu durumlardan biri olurdu. Sıklık yapanlar bazen gerçek boş hipotezi reddedeceklerini veya sahte boş hipotezini (Tip 2 hataları) koruyacaklarını, başka türlü iddia etmediklerini kabul ederler. Ayrıca, uzun vadede hatalı çıkarımlarının sıklığını kesin olarak ölçmektedirler.

Belki de bu sonuca daha az kafa karıştırıcı bir şekilde bakmak hipotezlerin rollerini değiştirmektir. İki hipotez basit olduğu için bunu yapmak kolaydır. Boş değer, güneşin nova gittiğini gösteriyorsa, p değeri 35/36 = 0,972 olur. Bu, güneşin novaya gittiği hipotezine karşı kanıt olmadığı anlamına gelir, bu nedenle bu sonucu temel alarak reddedemeyiz. Bu daha makul görünüyor. Eğer düşünüyorsan. Neden birileri güneşin Nova'ya gittiğini varsayar ki? Sana rica ediyorum Güneş patlaması düşüncesi çok saçma görünüyorsa, neden kimse böyle bir deney yapsın ki?

Sanırım bu sadece bir deneyin önceden faydalı olduğunu değerlendirmek zorunda olduğunu gösteriyor. Örneğin, bu deney tamamen işe yaramaz, çünkü zaten gökyüzüne bakmaktan zaten bildiğimiz bir şeyi test ediyor (ki bu kesinlikle etkili bir şekilde sıfır olan bir p değeri üretir). İyi bir deneme tasarlamak iyi bilim üretmek için bir gerekliliktir. Denemeniz zayıf bir şekilde tasarlanmışsa, hangi istatistiksel çıkarım aracını kullanırsanız kullanın, sonuçlarınızın faydalı olma olasılığı yoktur.


Tabii ki, ancak Bayesian hala verilen veri / deney sonuçları ile makul bir sonuç çıkartabilir . Bazen bir deneyi tekrarlayamaz veya istediğiniz şekilde tasarlayamazsınız.
Amelio Vazquez-Reina,

Bu oldukça önemli bir nokta, Bayesian çıkarımı, olağanüstü sonuçların istatistiksel ağırlığa sahip olmasını zorlaştıran önceki deneyimleri kolaylıkla birleştirebilir (Bizi istatistiksel şansa karşı korur). Ancak, bu aynı zamanda Bayesian çerçevesindeki işe yaramaz bir deneydir. Birincisi o kadar güçlüdür ki, bu deneydeki hiçbir sonuç onu değiştiremez. Öncelik çok güçlü ise. Neden değişiklik yapma şansı olmayan bir deneme yapılıyor? Zayıf öncelikler göz önüne alındığında (Muhtemelen verilerle değiştirilebilir), Bayesian ve Frequentist yöntemlerin genellikle "karşılaştırılabilir" sonuçlar verdiğini düşünüyorum.
Jose Garmilla

0

Sık kullanılan metodolojideki güneş stabilitesi hakkındaki "önceki bilgiler" nasıl birleştirilir?

Çok ilginç bir konu.

İşte sadece bazı düşünceler, mükemmel bir analiz değil ...

Bayesian yaklaşımının bilgi vermeyen bir önceyle kullanılması, tipik olarak frekansçı ile karşılaştırılabilir istatistiksel bir çıkarım sağlar.

Bayesian neden güneşin patlayamadığına dair güçlü bir inanca sahip? Çünkü herkesin, güneşin başlangıcından beri hiç patlamadığını biliyor.

Konjugatlı bazı basit istatistiksel modellerde, bir önceki dağılımın kullanılmasının, şişirici olmayan bir önceki ve ön denemelerden türetilen posterior dağılımın kullanılmasıyla eşdeğer olduğunu görmekteyiz.

Yukarıdaki cümle, Frequentist'in, modeline ön deneylerin sonuçlarını dahil ederek Bayesian olarak sonuçlandırması gerektiğini ileri sürer. Ve Bayesçanın gerçekte yaptığı şey bu : önceliği ön deneyler konusundaki bilgisinden geliyor!

N-xbenbenxbenθxbenxben=1ben=1,...,N-

N-+1xbeny={Evet}Pr(xN-+1=0)θθx1,...,xN-y1N-y={Evet}θθ

'H0={güneş patlamamış}


“Başından beri güneşin hiç patlamadığını herkes olarak biliyor” geçişi, milyonlarca hindiyi ( Meleagris gallopavo ) tüketilen yakın bir Amerikan tatili hakkında bir akla getiriyor . Zaman geçtikçe, her gün herhangi bir zeki hindi, Kasım ayının ortasındaki kader (ve tamamen beklenmedik şekilde) gününe kadar beslenip bakımını yapacağını "herkes olarak bilir"! Benzer bir şekilde, güneşin istikrarına olan güvenimiz, güvenmemiz gereken tek şeyin insanın gözlemini görece kısa tarihçesi olması durumunda düşük olmalıdır.
whuber

@whuber Bu mesajı size özel olarak göndermeyi tercih ederdim. Yorumunuzla tartışma konusu arasında bir bağlantı var mı? Bana fikirler getiren ben miyim bilemiyorum, ancak cevaplarım hakkında yorumda bulunduğunuzu düşündüğümü defalarca düşündüm. OP'nin ortaya koyduğu alıştırma bir karikatürün yorumlanması ve cevabımı gerçek bir mesele hakkında konuşuyormuşum gibi eleştirdiğinizi hissediyorum. Son zamanlarda takdir etmedim ve cevaplarımın arkasındaki muhtemel bir "niyet" i neden uyandırdığınızı hala anlamadım.
Stéphane Laurent

Herhangi bir eleştiri yoktu, ima edildi ya da amaçlandı: bazen bir yorum gerçekten sadece bir yorumdur. Yanıtınızda ima edilen ancak yanıtlanmayan önemli soruları vurgulamaya çalıştı. Bunu kişisel ya da saldırı olarak algıladığın için üzgünüm. BTW, bu ise gerçek bir soru: sorar frequentist metodoloji "önceden bilgi" ... entegre etmek nasıl? Bu soru, Hume'ün endüktif çıkarım eleştirisini uyandırıyor ve istatistik felsefesinin yanı sıra, istatistik felsefesindeki konulara da değiniyor. Bazı dikkatli düşünmeye değer!
whuber

Şöhretinizin önemli bir kısmının cevaplarınız için oylarımdan kaynaklandığına da değinmeye değer olabilir - bu da size karşı tarafımda sistematik bir davranış olmadığının somut kanıtı olarak sunuyorum.
whuber

2
Hayır, yorumunuzu anladım. Yorumunuzun Fransızca Google çevirisi zaten çok garip, ancak becerilerimi İngilizce ile garip Google çevirileri birleştirerek doğru bir çeviri alabiliyorum. Muhtemelen gelecek ay daha rahatlayacağım.
Stéphane Laurent

0

Bu elbette sıkça yapılan bir 0.05 seviye testtir - sıfır hipotezi, sıfır hipotezi altında zamanın% 5'inden daha az reddedilir ve alternatifin altındaki güç bile harikadır.

Öte yandan, önceki bilgiler bize belirli bir zamanda süpernovaya giden güneşin pek olası olmadığını, ancak şans eseri yalan söylemenin daha muhtemel olduğunu söylemektedir.

Alt satır: çizgi roman ile ilgili gerçekten yanlış bir şey yok ve uygunsuz hipotezleri test etmenin yanlış bir keşif oranının yüksek olduğunu gösteriyor. Ek olarak, muhtemelen teklif edilen bahislerin değerlendirmesinde dikkate almak için önceden bilgi almak istersiniz - bu yüzden bir Bayesian posterior karar analizi ile birlikte bu kadar popüler.


-2

Benim görüşüme göre, daha doğru bir frekans analizi şu şekilde olacaktır: H0: Güneş patladı ve makine doğruyu söylüyor. H1: Güneş patlamamış ve makine yalan söylüyor.

Buradaki p değeri = P'dir (güneş patladı). p (makine doğru söylüyor) = 0.97. P (güneş patladı)

İstatistikçi, ikinci olasılığın doğasını bilmeden hiçbir şey yapamaz.

P'nin (güneş patladığını) 0 olduğunu bilmemize rağmen, güneş benzeri yıldızlar süpernovaya patlamaz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.