10 dakikadan daha kısa sürede gençler için hipotez testini nasıl açıklayabilirim?


18

Bir yıldan uzun süredir bir saatlik bir "istatistiklerin tadı" dersi veriyorum. Her seferinde farklı bir grup çocuk geliyor ve onlara ders veriyorum.

Sınıfın teması, 10 çocuğa (koka-kola içmeyi seven) bir tanesi koka-kola ve diğeri pepsi içeren iki (işaretsiz) bardak verildiği bir deney yapmamızdır. Çocuklardan tadı ve kokusuna göre hangi bardağın koka-kola içeceği olduğunu tespit etmeleri istenir.

Daha sonra onlara çocukların tahmin edip etmediklerine veya (veya en azından yeterince) gerçekten tadı tatma yeteneğine sahip olup olmadıklarına nasıl karar vermeleri gerektiğini açıklamam gerekiyor. Her 10 başarıdan 10'u yeterince iyi mi? 10 üzerinden 7 ne olacak?

Bu sınıfa onlarca kez (farklı varyasyonlarda) verdikten sonra bile, kavramın sınıfın çoğunun alacağı şekilde nasıl ele alınacağını bildiğimi hala hissetmiyorum.

Vb hipotez test etme, boş hipotezi, alternatif hipotez, ret bölgeleri kavramı açıklanabilir konusunda herhangi bir fikir varsa (!) Basit ve sezgisel bir şekilde - Nasıl olduğunu isterim.


1
Bazen "neden" düşünmek "nasıl" hakkında daha iyi bir anlayış elde etmenize yardımcı olur, böylece stats.stackexchange.com/questions/6966/…
Tim

5
(+1) Sanırım 10 dakikalık tanımınızın ne olduğuna bağlı !
kardinal

1
Birkaç hafta önce, stat.stackexchange.com/a/130772 adresinden bu soruyu - ya da en azından beğendiği gibi - cevaplamaya başladım . Bu konu bunun bir kopyası değil mi?
whuber

1
@cardinal - Kelimenin tam anlamıyla 10 dakika demek istiyorum. Bu tür bir konu ve arka planı olmayan insanlar için - bu ÇOK kısa süredir. --------------- Sevgili Whuber - Cevabınızı sevdim, ancak olasılık ve yoğunluk ile alan arasındaki ilişkiyi bilen öğrenciler için harika olurdu. Bunlar öğrencilere öğretilen kavramlardır, ancak lise öğrencilerine değil. Hipotez testlerini tam olarak anlamalarını istemiyorum, ancak her reddetme bölgesinin ne anlama geldiğine karar vermeleri için bir fikir edinmeleri için yeterli tutmak için.
Tal Galili

4
Açıklama için teşekkürler Tal. Hala diğer ileti dizisinin sorunuzun kopyası olduğunu belirtiyorsunuz, ancak orada yeterli bir yanıt görmediniz. Sorunuzu bundan ayırt etmenin iyi bir yolu, yorumunuzda yapmaya başladığınız gibi, fuarın seviyesi ve izleyicinin bildiklerini varsaydığımız hakkında özel gereksinimler sağlamak olacaktır.
whuber

Yanıtlar:


10

Bence onlara bir kişi hakkında coca-cola ve pepsi arasındaki farkı söyleyebilmenin gerçekten ne anlama geldiğini düşündüklerini sormalısınız. Böyle bir kişi başkalarının yapamayacağı şeyi yapabilir mi?

Çoğu böyle bir tanıma sahip olmayacak ve istenirse bir tane üretemeyecektir. Bununla birlikte, bu ifadenin anlamı, istatistiklerin bize verdiği şeydir ve “istatistiklere bir tat” sınıfınızla getirebileceğiniz şey budur.

İstatistiğin noktalarından biri, "coca-cola ve pepsi arasındaki farkı söyleyebileceği birine ne demek" demek için kesin bir cevap vermektir.

Cevap: kör bir testte bardakları sınıflandırmak için bir tahmin makinesinden daha iyidir. Tahmin makinesi farkı söyleyemez, sadece her zaman tahmin eder. Tahminleme makinesi bizim için yararlı bir buluştur çünkü yeteneğinin olmadığını biliyoruz . Tahminleme makinesinin sonuçları faydalıdır, çünkü test etme yeteneğimizden yoksun birinden ne beklememiz gerektiğini gösterirler.

Bir kişinin koka-kola ve pepsi arasındaki farkı söyleyip söyleyemediğini test etmek için, kişinin kör testteki fincan sınıflandırmalarını bir tahmin makinesinin yapacağı sınıflandırma ile karşılaştırması gerekir. Sadece tahmin makinesinden daha iyiyse, farkı söyleyebilir.

Öyleyse, bir sonucun başka bir sonuçtan daha iyi olup olmadığını nasıl belirlersiniz? Ya neredeyse aynılarsa?

İki kişi az sayıda bardağı sınıflandırırsa, sonuçlar hemen hemen aynı ise, birinin diğerinden daha iyi olduğunu söylemek gerçekten adil değildir . Belki de kazanan bugün şanslıydı ve yarın yarın tekrarlanırsa sonuçlar tersine dönecekti?

Güvenilir bir sonuç elde edersek, az sayıda sınıflandırmaya dayanamaz, çünkü o zaman şans sonuca karar verebilir. Unutma, yeteneğe sahip olmak için mükemmel olmak zorunda değilsin, sadece tahmin makinesinden daha iyi olmalısın. Aslında, sınıflandırma sayısı çok azsa, her zaman koka-kola'yı doğru bir şekilde tanımlayan bir kişi bile tahmin makinesinden daha iyi olduğunu gösteremeyecektir. Örneğin, sınıflandırılacak tek bir fincan varsa, tahmin etme makinesinin bile tamamen doğru sınıflandırma şansı yüzde 50 olacaktır. Bu iyi değil, çünkü bu, denemelerin yüzde 50'sinde, iyi bir koka-kola tanımlayıcının tahmin makinesinden daha iyi olmadığı sonucuna varabiliriz. Çok haksız.

Ne kadar çok bardak sınıflandırılırsa, tahmin etme makinesinin ortaya çıkamaması için o kadar fazla fırsat ve iyi koka-kola tanımlayıcısının göstermesi için o kadar fazla fırsat olur.

10 fincan başlamak için iyi bir yer olabilir. O zaman bir insan makineden daha iyi olduğunu göstermek için kaç doğru cevap vermelidir?

Onlara ne tahmin edeceklerini sorun.

Sonra makineyi kullanmasına ve ne kadar iyi olduğunu bulmasına izin verin, yani tüm öğrencilerin bir dizi on tahmin oluşturmasına izin verin, örn. akıllı telefonda bir zar veya rastgele bir jeneratör kullanarak. Pedagojik olmak için, tahminlerin değerlendirileceği on doğru cevap dizisi hazırlamalısınız.

Tüm sonuçları tahtaya kaydedin. Sıralanan sonuçları tahtaya yazdırın. Bir istatistikçinin koka-kola ve pepsi arasındaki farkı söyleme yeteneğini kabul etmeden önce bir insanın bu sonuçların yüzde 95'inden daha iyi olması gerektiğini açıklayın. % 95 en kötü sonuçları en üst% 5 sonuçlardan ayıran çizgiyi çizin.

Daha sonra, birkaç öğrenciye 10 fincan sınıflandırmayı deneyin. Şimdiye kadar, öğrenciler farkı anlayabileceklerini kanıtlamak için kaç hakkın olması gerektiğini bilmelidir.

Bütün bunlar gerçekten 10 dakika içinde mümkün değil.


2
Teşekkürler Hans. Cevabınızı birkaç nedenden dolayı seviyorum. 1) Çünkü masaya "çocukların bir tahmin makinesi ile rekabet etmesi" için yeni bir fikir getiriyorsunuz. Düşüncemin zihnimi geçtiğini itiraf ediyorum, ancak cevabınız bunun sıfır hipotezinin teorik dağılımı ile rekabet etmelerinden daha iyi çalışabileceği fikrimi güçlendiriyor. 2) Çünkü önerdiğiniz her şeyin 10 dakika içinde
yapılamayacağını

2
Teşekkürler Tal. a) Tahmin makinasının teorik dağılımdan çok daha sezgisel olduğunu düşünüyorum. b) Umarım hipotez testi için 10 dakikadan fazla zaman ayırabilirsiniz.
Hans Ekbrand

Neden% 95, ha ha?
Mark L. Stone

2

Soda ile çalışmak eğlenceli geliyor ve makul bir hipotez testi bilgisine sahip olduğunuzda, gençlerin gazlı içecekler arasındaki farkı gerçekten söyleyip söyleyemediklerinin testi mantıklı. Sorun şu soru olabilir: "aslında gazlı içecekler arasındaki farkı söyleyebilir misiniz?" gençlerin zihninde "kim iyi ve kim sodaları test etmede kötü?" gibi birçok başka şeyle karıştırılıyor, "aslında gazlı içecekler arasında fark var mı?"

Hiç gençlere istatistik öğretmedim, ama her zaman yüklü bir kalıp veya önyargılı bir madeni para kullanmayı hayal ettim. Daha ilginç öl, ama istatistiksel olarak daha zor. Madeni para örneğinde, madeni para ya adil ya da adil değildir. Paraları çevirmekte iyi olmak yok. Kafaları mı yoksa kuyrukları mı olduğuna karar vermek yok.

Eğer 100 $ kazanan için bir bozuk para çevirirsek ve kafa gelirse (kazanırsınız!) Diyebilirim ki, "Hey. Bu madalyonun adil olup olmadığını nasıl bilebilirim? "Oh evet? Kanıtla" diyorsun. Oldukça bariz çözüm, kuyruktan daha fazla kafa olup olmadığını görmek için bozuk parayı tekrar tekrar döndürmektir. Biz çeviririz ve kafalar yukarı çıkar. “Ahha! Diyorum. Seee! Kafalara doğru önyargılı!” Ve bunun gibi.

İyi önyargılı paralar mevcut değildir, ancak önyargılı zarlar vardır - Amazon'dan bir tane satın alabilirsiniz. Eğer öğrencilere bir miktar rulo kazanabilirlerse bir ödül verebilirsiniz. Ama kazanacağını biliyorsun. Kızgın olacaklar. Diyorsun ki, tamam, eğer bu kalıbın önyargılı olduğunu kanıtlayabilirsen, sana ödülü vereceğim, yani% 95 güven.

Sonra sodaya geçin. Ödül bir soda partisi bile olabilir! "Hey, merak ediyorum kola ve pepsi arasındaki farkı söyleyebilir misiniz ..."


6
" Sikkeleri çevirmekte iyi olmak yok. " - Persi Diaconis'in başlarını isteyerek çevirdiğini düşünüyorum.
Glen_b

Ha. şimdi gidip iyi olmaya çalışacağım!
tim.farkas

1
Diaconis bir istatistikçi ve sihirbazdır. Youtube'da (istediği zaman kafaları çevirerek) gösteren videolar var.
Glen_b

Selam Tim. Güzel noktalar getiriyorsun, ama sorumu doğrudan ele almıyorlar. Öğrencilerinizin 10 sınavdan x'ini doğru bir şekilde aldıkları göz önüne alındığında (bir test tada göre doğru markayı seçiyor) - bu kararı verirken neden iyi / kötü olduğuna karar verdiğinizi nasıl açıklayabilirsiniz?
Tal Galili

Yine bozuk para çevirme kullanabilirsiniz. Tek bir tat alırlar ve doğru yaparlarsa, çok ikna edici değildir, çünkü bir madeni para çevirirseniz, zamanın% 50'si "doğru" olmalıdır! iki kez doğru yaparsanız, şans eseri elde etme olasılığı iki kafayı çevirmekle aynıdır = .5 * .5 = .25. Arka arkaya 3 kez .125, 4 .0625, 5 .0313'tür. İstediğiniz güven düzeyini seçmelisiniz. % 50 yeterli mi? nasıl% 25? R. Fisher% 95'inin yeterince iyi olduğunu söylüyor ve birçok bilim insanının kullandığı şey bu. Buna teknik olarak işaret testi denir. Aşağıya bakınız.
tim.farkas

2

Hedef atış yapan birini, namlu yönünde pelet patlaması yapan bir av tüfeğiyle düşünün.

Null Hipotezi: Ben iyi bir atıcıyım ve namlum mükemmel bir şekilde hedefte Sol değil, sağ değil, ama düz. Benim hatam 0.

Alternatif Hipotez: Kötü bir atıcıyım ve namlum hedef dışında. Hedefin hemen solunda veya hemen sağında. Benim hatam e> 0 veya e <0.

Herhangi bir ölçümün belirli bir ortalama hatası (yani standart hata) olduğundan, düz çekim yapsam bile "hedef dışı" yazan bir ölçüm mümkündür. Bana kötü bir atıcı diyebilmeniz ve Alternatif Hipotezi seçebilmeniz için, hedefime (her atış bir seri çekim / yayılma olsa bile) belirli sayıda kez “vurmamam” gerekecek.


1
CV'ye hoş geldiniz. Açıklamanızı null ve alternatif ile ilişkilendirir misiniz? Belki bazı ek tartışmalar bu motive edici olabilir. Ayrıca, bu açıklamanın uygun olmayacağı bazı null'ler ve alternatifler de vardır, bunun ne tür hipotezler için uygun bir açıklama olacağını belirtmeniz gerekebilir (örneğin nokta-boş, iki kuyruklu)
Glen_b -Restate Monica

1

Çocukların farkı söyleyemeyeceğini ve şans eseri karar veremeyeceğini varsayın. Sonra her çocuğun doğru tahmin etme şansı% 50'dir. Yani beklediğiniz (beklenen değer) bu durumda, 5 çocuk doğru ve 5 çocuk err. Tabii ki, tesadüfen olduğu gibi, 6 çocuğun hata yapması ve 4'ün doğru olması da mümkündür. Diğer tarafta, çocuklar farkı söylese bile, şans eseri bunlardan birinin hata yapması mümkündür.

Sezgisel olarak, eğer çocuklar tesadüfen tahmin ederse, tüm çocukların doğru cevabı vermesinin oldukça imkansız olduğu açıktır . Bu durumda, çocukların aslında her iki içecek arasındaki farkı tadabileceğine inanmak daha doğrudur. Başka bir deyişle, olası olayların gözlemlenmesini beklemiyoruz. Dolayısıyla, 50-50 tarama senaryosunda olanaksız bir olay gözlemlediğimizde, bu senaryonun yanlış olduğuna ve çocukların Kok ve Pepsi'yi ayırt edebileceğine inanıyoruz.

Peki "oldukça imkansız" ve "daha çok inanmak" ne anlama geliyor? Öğrencilerinizin seçmesine izin verinα: "En uçtan 50-50 hipoteziyle çelişen bir olay gözlemlersek, bu hipoteze artık inanmayacağınız en fazla hangi olasılık olabilir?" Umarım cevap vermezlerα0,00098 Onların yazın αtahtada. Sanırımα=0.05. Siz ve öğrencileriniz aynı fikirde: 50-50 senaryosuyla çelişen aşırı olayların üst% 5'ine ait bir olay gözlemlersek, artık bu senaryoya inanmıyoruz (hipotezi reddetmek).

Şimdi onlarla binom dağılımını hesaplayın. P(tüm çocuklar doğru tahmin eder)=0,00098, P(sadece bir çocuk Kola'yı Pepsi ile karıştırır)=0,01074 ve P(sadece iki çocuk karıştı)=0,05468. Açıkçası, sadece en fazla bir çocuk onları karıştırırsa, her iki içecek arasında bir fark olduğu sonucuna varacaksınız.

Bu, deneyi gerçekleştirdiğiniz andır. İkinci hatadan sonra durabileceğinizi hesaplamış olsanız bile, 10 öğrenciyle de iyice yapın. Sonra sonuçları kaydedin ve saklayın. Onlara meta analizleri açıklamak istiyorsanız sonuçlara ihtiyacınız olacaktır.

(Bu arada, tarihsel örnek, süt veya çayın önce bardağa dökülüp dökülmediğini tatmakla ilgilidir. Çay tadımı hanımefendi.)



0

Kok deneyi tadıran çocuklar, hipotez testini uygulamaya koymak için iyi bir örnektir, bununla birlikte bayan tadımı çay deneyinin eşdeğeri. Bununla birlikte, bu deneylerin değerlendirilmesi çok sezgisel değildir, çünkü sıfır hipotezi p = 0.5 ile binom dağılımını içerir ve basit değildir.

Her zamanki hipotez testine girişimde, binom dağılımındaki olasılığı tümüyle başarılı olan davayı kullanarak binom olasılığını bilmeyen insanlar tarafından bile p ^ n olarak hesaplanabilen bu dezavantajı aşmaya çalışıyorum.

En sevdiğim örnekte kavrulmuş kestaneleri seviyorum ve sokak satıcısından bir avuç satın alıyorum. Onları indirimli fiyattan alıyorum çünkü kestane% 10'unun solucan deliği olan büyük bir çantadan geliyorlar - burada avuç kesimin rastgele bir kestane örneği olması için torbanın iyi karıştırıldığını açıklamaya çalışıyorum. çanta ve satıcının beyanı, her kestanenin solucan deliği% 10'luk bağımsız bir olasılığa sahip olduğu anlamına gelir.

Kavrulmuş kestanelerimin tadını çıkarmaya başladığımda, onları tek tek alıp yemeden önce solucan delikleri için kontrol ediyorum.

İlk kestaneyi kontrol ettiğimde, bir solucan deliği görüyorum ve satıcının bana yalan söyleyip söylemediğini merak ediyorum. tahtaya. Birinden kestane aldığımda p =% 10 olduğundan şüphe etmek için bir nedenim var mı? Aynı deneyi yapanların% 10'u aynı sonucu alacaktı, bu yüzden şansımın az olduğunu düşünüyorum.

Sonra ikinci kestaneyi alıyorum ve bir de solucan deliği var. Satıcı bana yalan söylemediyse ikisinden ikisinin olasılığı sadece% 1'dir. Çok kötü bir şansım olabilirdi, ama satıcı hakkında çok şüpheliyim.

Üçüncü kestane de solucan deliğine sahiptir. Üç kestan solucanla üç kestane elde etmek, satıcının adil ve p =% 10 olduğunu varsayarsak imkansız olmaz, ancak çok olası olmaz (olasılık =% 0.1). Bu nedenle şimdi satıcının çalışmasından şüphe etmek için güçlü bir nedenim var ve şikayette bulunuyorum ve geri ödeme yapılmasını istiyorum.

Tabii ki, bu tür ardışık testlerin bazı teorik problemleri vardır, ancak bir hipotez testi fikrini göstermek önemli değildir. Aslında, bu örnekte ele alınmayan en önemli fikir, hipotez testlerinde elde ettiğimiz sonuçların olasılığını veya daha kötü bir şeyi hesapladığımızdır - örneğimde bu mümkün olan en kötü sonucu elde ederek önlendi.

Bu örneği üniversitede birinci sınıf öğrencilerle - hala teknik olarak gençler - kullandım, ancak bence genç gençler ile de iyi çalışabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.