20.000 tosse'dan 10.000 başlığın neden geçersiz veriler önerdiğine dair istatistiksel tartışma


11

Diyelim ki tekrar tekrar adil bir para atıyoruz ve kafa ve kuyruk sayısının kabaca eşit olması gerektiğini biliyoruz. Toplam 20 atış için 10 kafa ve 10 kuyruk gibi bir sonuç gördüğümüzde, sonuçlara inanıyoruz ve madalyonun adil olduğuna inanmaya meyilliyiz.

Toplam 20000 tosse için 10000 kafa ve 10000 kuyruk gibi bir sonuç gördüğünüzde, aslında sonucun geçerliliğini sorgularım (deneyci verileri sahte yaptı mı), bunun daha olası olmadığını bildiğim için, 10093 kafa ve 9907 kuyruk.

Sezgimin arkasındaki istatistiksel argüman nedir?

Yanıtlar:


21

Adil bir para olduğunu varsayarsak, 10000 kafa ve 10000 kuyruk sonucu 10093 kafa ve 9907 kuyruk sonucundan daha olasıdır.

Bununla birlikte, gerçek bir deneycinin eşit sayıda kafa ve kuyruk elde etme olasılığının düşük olduğunu söylediğinizde, dolaylı olarak Bayes teoremini çağırıyorsunuz demektir. Gerçek bir deney hakkındaki önceki inancınız, Prob'un (20000 fırlatılmasında kafa sayısı = 10000 | Deneyi yapan kişinin sahte olmadığı göz önüne alındığında) 0'a yakın olmasıdır. Böylece, 'Kafa sayısı = 10000' Prob hakkında posterior (Experimenter taklit etmiyor | 10000 başlığın gözlemlenen sonucu) da 0'a yakındır. Böylece, deneyi yapan kişinin verileri taklit ettiği sonucuna varırsınız.


Çok iyi açıkladı! Bayes teoremi yaklaşımına ne güzel bir örnek.
Tal Galili

1
@Srikant: bu önceden resmi olarak tanımlanamaz. Her halükarda, N = 20000 olduğunda, X'in değeri ne olursa olsun ve öncekiniz ne olursa olsun, Prob (kafa sayısı = X | deneyi sahte değildir) her zaman sıfır civarındadır. Yani herhangi bir sayı için posteriorunuz daima 0'a yakındır. Bunun Bayes teoremi ile ne ilgisi olduğunu anlamıyorum.
Joris Meys

Bütün bunlar, tanrıyı kanıtlamaya çalışan delikanlıdan geldi. Zarif, gerçekten.
Brandon Bertelsen

1
Bunu daha genel bir perspektife koymak, kabul ettiğim nokta, Bayes teoreminin burada iş başında olmasıdır. Özellikle, hile ve dürüst deneyciler için alternatif olasılıklar (farklı üretken süreçlere karşılık gelir) vardır. Hile oluşturmak, sezgisel ve dolayısıyla azımsanmayacak şekilde hile yapan cheater sürecine göre arka çıkarımdır.
konjugateprior

1
@Srikant @whuber: kombinatoryaller ... haklısın. Bu durumda elbette saçma olan tek tip bir olasılıkla başladım. My bad
Joris Meys

12

Srikant'ın açıklamasını seviyorum ve bence Bayesci fikir muhtemelen böyle bir soruna yaklaşmanın en iyi yolu. Ama işte Bayes olmadan görmenin başka bir yolu: (R'de)

dbinom(10, size = 20, prob = 0.5)/dbinom(10000, 20000, 0.5)

ki bu benim sistemimde yaklaşık 31.2. Başka bir deyişle, her iki durumda da adil bir madeni para ile bile 20.000'den 10'unu görmek, 20.000'den 10.000'ini görmek 30 kat daha fazladır. Bu oran örnek boyutu arttıkça sınırsız olarak artar.

Bu bir çeşit olasılık oranı yaklaşımıdır, ama yine de, bağırsakta, bu Bayes yargısının her şeyden daha fazla çağırdığı gibi geliyor.


Neden oran? Neden sadece kesin çekiş olasılığının son derece düşük olduğunu belirtmiyorsunuz?
Andy W

5
Belirli bir olasılığın bağlamdan düşük olduğu iddiası inandırıcı değildir. Tam olarak boyum kadar uzun olma ihtimalim (her ne olursa olsun) sıfır. Ve evet, yüksekliği sonsuz hassasiyetle tanımlamak bile sorunlu, yada, yada, yada ... Demek istediğim, varoluşun girdabı sonsuz olasılık olaylarıyla her zaman değişiyor! 20.000 üzerinden 10.000 - bağlam dışı - beni hiç şaşırtmıyor. Sayısal olasılığının ne olduğuna bakılmaksızın.

9

Bir sübjektivist Bayes argüman pratikte size anlama konusunda gidebiliriz (istatistiksel açıdan) tek yolu sezgi düzgün konuşan - - Bir konu olan, psikolojik soruşturma değil, istatistiksel bir tane. Bununla birlikte, bir araştırmacının verileri taklit ettiğini iddia etmek için Bayesci bir yaklaşım kullanmak patentsizdir ve bu nedenle geçersizdir. Bunun mantığı tamamen daireseldir: "sonuç hakkındaki önceki inançlarıma dayanarak, sonucunuzu inanılmaz buluyorum ve bu yüzden hile yapmış olmalısınız ." Böyle mantıksız bir kendi kendine hizmet argümanı, bir mahkeme salonunda veya bir emsal inceleme sürecinde açıkça ortaya çıkmayacaktır.

Bunun yerine, Ronald Fisher'in Mendel'in deneylerini eleştirmesinden bir ipucu alabilir ve resmi bir hipotez testi yapabiliriz. Tabii ki sonuca bağlı olarak post-hoc bir hipotezi test etmek geçersizdir . Ancak deneylerin inanılması için çoğaltılması gerekir: bu bilimsel yöntemin bir ilkesidir. Dolayısıyla, sahte olduğunu düşündüğümüz bir sonucu gördükten sonra, gelecekteki (veya ek) sonuçları test etmek için uygun bir hipotez formüle edebiliriz . Bu durumda kritik bölge, beklentiye son derece yakın bir dizi sonuç içerecektir. Örneğin, bir testα=% 5 seviyesi, 9,996 ile 10,004 arasındaki herhangi bir sonucu şüpheli olarak görecektir, çünkü (a) bu koleksiyon varsayılan "sahte" sonuçlarımıza yakındır ve (b) sahte olmayan hipotez ( mahkemede kanıtlanmış suçluya kadar masum!) , bu aralıktaki bir sonuç yalnızca% 5 (aslında% 5.07426) olma şansına sahiptir. Dahası, bu görünüşte ad hoc yaklaşımı, sadece gözlenen oran ile beklenen oran arasındaki sapmayı kareye alarak, ardından tek kuyruklu bir testte Neyman-Pearson lemmasını çağırarak ki-kare bağlamında (a la Fisher) koyabiliriz . düşük kuyruk ve Binom dağılımına Normal yaklaşımın uygulanması .

Her ne kadar böyle bir test sahte olduğunu kanıtlayamasa da, sadece sezginize dayanarak istenmeyen ve desteklenmeyen varsayımlar yapmadan iddialarının güvenilirliğini değerlendirmek için bu deneyciden gelecek raporlara uygulanabilir . Bu, mükemmel bir şekilde masum olabilecek ve o kadar şanssız olduğu birisini ima etmek için Bayesci bir argümanı çağırmaktan çok daha adil ve titizdir;


5

Bence sezgin kusurlu. Görünüşe göre tek bir "çok özel" sonucu (tam olarak 10000 kafa) bir dizi sonuçla (10000'e yakın tüm "özel olmayan" kafa sayısı) karşılaştırıyorsunuz. Ancak, "özel" tanımı psikolojimize dayalı keyfi bir seçimdir. İkili 10000000000000 (ondalık 8192) veya Hex ABC (ondalık 2748) - bu da şüpheyle özel olacak mı? Joris Meys'in yorumladığı gibi, Bayes argümanı, herhangi bir sayıda başkan için esasen aynı olacaktır, bu da her sonucun şüpheli olacağını ima etmektedir.

Argümanı biraz genişletmek için: bir hipotezi test etmek istiyorsunuz ("deneyci sahte oluyor") ve sonra bir test istatistiği (kafa sayısı) seçersiniz. Şimdi, bu test istatistiği size hipoteziniz hakkında bir şeyler söylemek için uygun mu? Bana göre, seçilen test istatistiği bilgilendirici değil (hipotezde sabit bir değer olarak belirtilen bir parametrenin fonksiyonu değil). Bu, "aldatma" ile ne demek istediğinize geri döner. Bu, deneyi yapan kişinin jetonu istediği gibi kontrol ettiği anlamına gelirse, bu test istatistiğine yansıtılmaz. Sanırım ölçülebilir bir gösterge bulmak için daha kesin olmanız ve böylece soruyu istatistiksel bir teste uygun hale getirmeniz gerekiyor.


+1, Ama ikna olmadım. 10.000 civarında özel olan şey, madalyonun adil olduğu hipotezi altında beklenen kafa sayısına tam olarak eşit olmasıdır. Bu gerçek, herhangi bir psikoloji veya sayı temsil sisteminden bağımsızdır. Bu yanıttaki analiz, diyelim ki, 20,005 jetonun çevrildiği ve 10.000 başın (ve dolayısıyla 10,005 kuyruk) kaydedildiği ve birisinin "sezgisinin" taklitinin gerçekleştiği bir durum hakkında bir fikir verebilir.
whuber

Tam olarak katılıyorum - cevabınızda belirttiğiniz gibi - her şey hipotezin a priori tanımına bağlıdır: önceden "deneyi taklit ederek", şu sayıda kafa için bir sonuç elde etmek anlamına geldiğini beklenen değere yakın "ise, bu bir test istatistiği olarak" kafa sayısı "olan bir istatistiksel test için temel oluşturur. Bununla birlikte, böyle bir a priori açıklama olmadan, "taklit" ve "kafa sayısı için özel değer" anlamı bulutlu kalır ve birbirleriyle ne yapmaları gerektiği açık değildir.
caracal

4

Çektiğiniz sonuç, hile yapma olasılığınıza ve palet yalancı olduğunda x kafalarının bildirilme olasılığına bağlı olarak ÇOK bağlı olacaktır.

En fazla kütleyi P (10000 kafa rapor | yalan söyleme) üzerine koymak bence biraz sezgisel. Muhabir naif değilse, bu tür sahte verileri rapor eden kimseyi hayal edemiyorum (büyük ölçüde orijinal yayında bahsettiğiniz nedenlerden dolayı; çoğu insan için çok şüpheli.) Para gerçekten haksız ve palet rapor ederse hatalı veriler, daha sonra raporlanan sonuçlardan önce daha makul (ve çok yaklaşık) bir ayrık üniforma olabilir bence (X kafaları rapor | yalan) = 1/201 tamsayıları için {9900, ..., 10100} ve P (x kafa bildirildi | yalan söyleme) = diğer tüm x için 0. Diyelim ki yalan söyleme olasılığınız 0,5. O zaman bazı posterior olasılıklar:

P (yalan söyleme | 9900 kafa bildirildi) = P (yalan söyleme | 10100 kafa bildirildi) = 0.70;

P (yalan söyleme | 9950 kafa bildirildi) = P (yalan söyleme | 10050 kafa bildirildi) = 0.54;

P (yalan söyleyen | 10000 kafa bildirildi) = 0.47.

Adil bir madeni paradan bildirilen en makul sayıda kafa şüpheye yol açacaktır. Sadece posterior olasılıkların önceliğinize ne kadar duyarlı olduğunu göstermek için, önceki hile olasılığı 0.10'a düşürülürse, posterior olasılıklar olur:

P (yalan söyleme | 9900 kafa bildirildi) = P (yalan söyleme | 10100 kafa bildirildi) = 0.21;

P (yalan söyleme | 9950 kafa bildirildi) = P (yalan söyleme | 10050 kafa bildirildi) = 0.11;

P (yalan söyleyen | 10000 kafa bildirildi) = 0.09.

Bence orijinal (ve yüksek puanlı cevap) biraz genişletilebilir; hiçbir şekilde verilerin ön bilgi dikkate alınmadan tahrif edildiğine karar vermemelisiniz. Ayrıca, sadece bunu sezgisel olarak düşünerek, arkaya yatma olasılıklarının, paletin yalan söylediği (daha önce koyan öncelikler hariç) bildirilen kafaların önceki dağılımından ziyade önceki yalan olasılığından daha fazla etkileneceği düşünülmektedir. palet yalancı göz önüne alındığında az sayıda kafadaki kütleleri, örneğin örneğim gibi.)


Bunun çok iyi bir yanıt olduğunu düşünüyorum, ama ikinci paragrafınıza katılmıyorum. Srikant'ın orijinal koşullu olasılığının tersine sezgisel olduğunu düşünmüyorum ve sadece cevaplanması zor bir soru olduğu için buna karşı bir argüman değil. Ayrıca, gösteri amaçları için yararlı olmasına rağmen, 9900 ila 10100 arasında tekdüze olma olasılığınızın hiç mantıklı olduğunu düşünmüyorum.
Andy W

2

Bayes açıklaması için, yalan söyleyen bir madeni para paletinin bildirilen sonuçlara önceden olasılık dağılımına ve daha önce yalan söyleme ihtimaline ihtiyacınız vardır. Yalan dağılımı altında rasgele döndürülenden çok daha yüksek bir değer gördüğünüzde, posterior uzanma olasılığınız çok daha yüksektir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.