Bir Öğretmen ve Düşünceli Bir Öğrenci Arasındaki Diyalog
Alçakgönüllülükle, bu konu için şimdiye kadar yeterli boya kalemi kullanılmadığı kanısına varıldı. Kısa bir resimli özetini sonunda görünür.
Öğrenci : p değeri ne anlama geliyor? Bir çok insan , “ bir istatistikten daha büyük ya da eşit bir örnek görme şansımızın “ boş hipotez doğruysa, “bu sonucun gözlemlenmesi olasılığı” veya “benim örneklemimin istatistiği” olduğu durumlarda hemfikir olduğumuzu kabul ediyor gibi görünüyor. [simüle edilmiş] bir dağılıma “ ve hatta “ en azından sıfır hipotezinin doğru olduğu varsayılarak hesaplanan büyüklükte bir test istatistiklerini gözlemleme olasılığı ”düştü .
Öğretmen : Düzgün bir şekilde anlaşıldığı gibi, tüm bu ifadeler birçok durumda doğrudur.
Öğrenci : Birçoğunun ne kadar alakalı olduğunu anlamıyorum. Bize boş bir hipotez ve alternatif bir hipotez mi? Bu "eşit veya daha büyük" veya "en azından büyük" veya en popüler "daha aşırı" fikirlerine nasıl katılıyorlar?H AH0HA
Öğretmen : Genel olarak karmaşık görünebileceği için somut bir örnek keşfetmemize yardımcı olur mu?
Öğrenci : Tabii. Ama mümkünse, bunu gerçekçi ama basit bir tane yapın.
Öğretmen : Bu hipotez testi teorisi, tarihsel olarak gözlemsel hataları analiz etmek için astronomların ihtiyacı ile başlamıştır, peki oradan başlamaya ne dersiniz? Bir gün, bir bilim adamının, cihazındaki ölçüm hatasını azaltma çabalarını tanımladığı bazı eski belgelerden geçiyordum. Bilinen bir pozisyonda bir yıldızın birçok ölçümünü almış ve yer değiştirmelerini bu pozisyonun önüne veya arkasına kaydetmiştir. Bu yer değiştirmeleri görselleştirmek için - biraz düzeldiğinde - buna benzeyen bir histogram çizdi.
Öğrenci : Histogramların nasıl çalıştığını hatırlıyorum: Dikey eksen, ölçümlerin göreli frekanslarının yükseklikten ziyade alanla temsil edildiğini hatırlatmak için "Yoğunluk" olarak etiketlendi .
Öğretmen : Bu doğru. "Olağandışı" veya "aşırı" bir değer oldukça küçük bir alana sahip bir bölgede bulunur. İşte bir mum boya. Alanı sadece onda biri olan bir bölgede renklenebileceğinizi düşünüyor musunuz?
Öğrenci : Tabii; bu kolay. [Şekildeki renkler.]
Öğretmen : Çok iyi! Bu alanın% 10'u bana benziyor. Bununla birlikte, histogramdaki tek önemli alanların dikey çizgiler arasındaki alanların olduğunu unutmayın: bunlar , yer değiştirmenin yatay eksen üzerindeki bu çizgiler arasında bulunma ihtimalini veya olasılığını temsil eder . Bu, tabana kadar aşağıya doğru renklendirmeniz gerektiği ve bunun alanın yarısı üzerinde olacağı anlamına geliyor, değil mi?
Öğrenci : Oh, anlıyorum. Tekrar denememe izin ver. Eğrinin gerçekten düşük olduğu yerlerde renklendirmek isteyeceğim, değil mi? İki ucunda en düşük değer. Sadece bir alanda boyamak zorunda mıyım yoksa birkaç parçaya bölmek uygun olur mu?
Öğretmen : Birkaç bölüm kullanmak akıllıca bir fikirdir. Nerede olurlar?
Öğrenci (işaret): Burada ve burada. Bu mum boya çok keskin olmadığı için, kullandığım çizgileri göstermek için bir kalem kullandım.
Öğretmen : Çok Güzel! Size hikayenin geri kalanını anlatayım. Bilim adamı cihazında bazı iyileştirmeler yaptı ve sonra ek ölçümler aldı. Birincisinin yer değiştirmesinin sadece olduğunu, bunun iyi bir işaret olduğunu düşündüğünü, ancak dikkatli bir bilim adamı olarak, çek olarak daha fazla ölçüm almaya devam ettiğini yazdı . Ne yazık ki, bu diğer ölçümler kayboluyor - el yazması bu noktada kopuyor - ve elimizdeki tek sayı, .0,10.10.1
Öğrenci : Bu çok kötü. Fakat bu, figürünüzdeki geniş yer değiştirmelerden daha iyi değil mi?
Öğretmen : Cevaplamanı istediğim soru bu. İlk olarak, olarak ne ?H0
Öğrenci : Eh, şüpheci, cihazda yapılan iyileştirmelerin herhangi bir etkisi olup olmadığını merak ederdi. İspat yükümlülüğü bilim insanına aittir: şüphecinin yanlış olduğunu göstermek isterdi. Bu, boş hipotezin bilim insanı için bir tür kötü olduğunu düşünmeme neden oluyor: tüm yeni ölçümlerin - bildiğimiz değeri de dahil olmak üzere - ilk histogram tarafından tanımlandığı gibi davranması gerektiğini söylüyor. Ya da belki bundan daha da kötüsü: daha da yayılmış olabilirler.0.1
Öğretmen : Hadi, iyi gidiyorsun.
Öğrenci : Demek ki alternatif, yeni ölçümlerin daha az yayılması, değil mi?
Öğretmen : Çok iyi! Bana daha az yayılı bir histogramın neye benzeyeceğini gösteren bir resim çizebilir misin? İşte ilk histogramın başka bir kopyası; Bunun üzerine referans olarak çizebilirsiniz.
Öğrenci (çizim): Yeni histogramı belirlemek için bir kalem kullanıyorum ve altındaki alanı renklendiriyorum. Bunu, yatay eksende eğrinin çoğunun sıfıra yakın olmasını ve alanın çoğunun (yatay) sıfır değerine yakın olmasını sağladım: daha az yayılmanın veya daha kesin olmanın anlamı budur.
Öğretmen : Bu iyi bir başlangıç. Ancak, şansı gösteren bir histogramın toplam alanın olması gerektiğini unutmayın . Bu nedenle ilk histogramın toplam alanı . Yeni histogramınızın içinde ne kadar alan var?111
Öğrenci : Sanırım yarısından az. Görüyorum ki bu bir problem, ama nasıl düzelteceğimi bilmiyorum. Ne yapmalıyım?
Öğretmen : İşin püf noktası, yeni histogramı eskisinden daha yükseğe çıkarmak, böylece toplam alanı . Burada, size göstermek için bilgisayar tarafından oluşturulan bir sürümünü göstereceğim.1
Öğrenci : Anladım: dikey olarak uzattınız, böylece şekli gerçekten değişmedi ama şimdi kırmızı alan ve gri alan (kırmızı altındaki kısım dahil) aynı miktarlarda.
Öğretmen : Doğru. Boş hipotezin (mavi renkte, yayılmış) ve alternatif hipotezin (kırmızı renkte, daha az yayılmış) bir kısmının resmine bakıyorsunuz .
Öğrenci : Alternatifin "kısmı" ile neyi kastediyorsunuz? Sadece değil mi alternatif hipotez?
Öğretmen : İstatistikçiler ve dilbilgisi karışmış gibi görünmüyor. :-) Cidden, onların bir "hipotez" ile kastettikleri, genellikle çok büyük bir olasılıklar kümesidir. Burada, alternatif (daha önce de belirtildiği gibi), ölçümlerin öncekinden daha az yayılmış olmasıdır. Ama ne kadar az ? Pek çok olasılık var. İşte, sana bir tane daha göstereyim. Sarı çizgilerle çizdim. Önceki ikisinin arasında.
Öğrenci : Görüyorum: farklı miktarlarda yayılmaya sahip olabilirsiniz, ancak yayılmanın gerçekte ne kadar olacağını önceden bilmiyorsunuz. Ama neden bu resimde komik gölgelendirmeyi yaptın?
Öğretmen : Histogramların nerede ve nasıl değiştiğini vurgulamak istedim. Alternatif histogramların sıfırdan düşük , alternatiflerin daha yüksek olduğu yerlerde kırmızı renkte gölgeledim .
Öğrenci : Bu neden önemli?
Öğretmen : Her iki kuyruktaki ilk histogramı nasıl renklendirdiğini hatırlıyor musun? [Kağıtlara bakmak.] Ah, işte burada. Bu resmi aynı şekilde boyayalım.
Öğrenci : Hatırlıyorum: Bunlar aşırı değerlerdir. Boşluk yoğunluğunun mümkün olduğu kadar küçük olduğu ve bu alanın% 10'unda renkli olan yerleri buldum.
Öğretmen : Bana bu aşırı bölgelerdeki alternatiflerden bahset.
Öğrenci : Görmesi zor, çünkü pastel boya kapladı, ancak renklendirdiğim alanlarda alternatif olma şansı neredeyse yok gibi görünüyor. Histogramları değer ekseninin tam karşısındadır ve altlarında hiçbir alan için yer yoktur.
Öğretmen : Bu düşünceye devam edelim. Eğer varsayımsal olarak, bir ölçümün kayması olduğunu söyleseydim ve sizden bu üç histogramdan hangisinin gelebileceğini seçmenizi istedi, hangisi olurdu?−2
Öğrenci : İlki - mavi olan. En yayılmış ve tek kişi o var oluşma şansı var gibi gözüküyor.−2
Öğretmen : Peki ya el yazması içindeki değer ?0.1
Öğrenci : Hmmm ... bu farklı bir hikaye. Her üç histogram da yerden oldukça üzerinde .0.1
Öğretmen : Tamam, yeterince adil. Fakat sanırım, değerin ile arasında olduğu gibi yakın bir yerde olduğunu söyledim . Bu, bu grafiklerden bazı olasılıkları okumanıza yardımcı oluyor mu?0 0,20.100.2
Öğrenci : Elbette, çünkü alanları kullanabilirim. Sadece her eğrinin altındaki alanları ile arasında tahmin etmeliyim . Ama bu oldukça zor görünüyor.0.200.2
Öğretmen : O kadar ileri gitmene gerek yok. Hangi alanın en büyük olduğunu söyleyebilir misiniz?
Öğrenci : Tabii ki, en yüksek eğrinin altındaki. Her üç alan da aynı tabana sahiptir, yani eğri ne kadar uzun olursa, tabanın altında o kadar fazla alan vardır. Bu, en uzun histogramın (kırmızı çizgi ile çizdiğim), bir yer değiştirme için en muhtemel olduğu anlamına gelir . Ben de bu nereye gittiğinizi görüyorum, fakat biraz endişeliyim: Ben bakmak gerekmez tüm histogramları tüm alternatifleri, sadece bir ya da iki burada gösterilmeyen? Bunu nasıl yapabilirim?0.1
Öğretmen : Kalıpları seçme konusunda iyisin, öyleyse söyle bana: ölçüm cihazları gittikçe kesinleştikçe histogramına ne olur?
Öğrenci : Daha da daralır - oh, o da daha uzun olmak zorundadır, bu yüzden toplam alanı aynı kalır. Bu histogramları karşılaştırmayı oldukça zorlaştırıyor. Alternatif olanlardır tüm null sağ daha yüksek aşikardır. Ancak diğer değerlerde bazen alternatifler daha yüksek, bazen daha düşüktür! Örneğin, [yakın bir değere işaret tam burada,] benim sarı histogram en yüksek olduğu kırmızı histogram en düşük olduğu ve orijinal boş histogramı aralarında olduğunu. Fakat sağ tarafta boş değer en yüksek değerdir.3 / 403/4
Öğretmen : Genel olarak, histogramları karşılaştırmak karmaşık bir iştir. Bunu yapmamıza yardımcı olmak için, bilgisayardan başka bir komplo yapmasını istedim: alternatif histogram yüksekliklerinin (veya "yoğunlukların") her birini boş histogram yüksekliğine bölerek "olasılık oranları" olarak bilinen değerler yarattı. Bunun bir sonucu olarak, daha büyük bir değer den daha az bir değer ise, alternatif, daha büyük bir olasılıktır alternatif az olduğu anlamına gelir. Yine bir alternatif daha çizdi: diğer ikisinden daha fazla yayıldı, ancak orijinal cihazdan daha az yayıldı.111
Öğretmen (devam ediyor): Alternatiflerin null'dan daha muhtemel olduğunu bana gösterebilir misiniz?
Öğrenci (renklendirme): Burada ortada olduğu açık. Ve bunlar artık histogram değil, sanırım alanlardan ziyade yüksekliklere bakmalıyız, bu yüzden yatay eksende bir dizi değeri işaretliyorum. Fakat ortasından ne kadarının renkleneceğini nasıl bilebilirim? Boyamayı nerede durdurabilirim?
Öğretmen : Kesin bir kural yok. Her şey, sonuçlarımızı nasıl kullanmayı planladığımıza ve şüphecilerin ne kadar şiddetli olduğuna bağlıdır. Ancak arkanıza yaslanın ve başardıklarınızı düşünün: artık büyük olasılık oranlarına sahip sonuçların alternatif için kanıt olduğunu ve küçük olasılık oranlarına sahip sonuçların alternatife karşı kanıt olduğunu biliyorsunuz . Sizden yapmamı isteyeceğim şey, mümkün olduğu ölçüde, sıfır hipotezi altında oluşma olasılığının az olduğu ve alternatifler altında göreceli olarak daha büyük olma şansının olduğu bir alanda renklendirmektir. Renkli hale getirdiğiniz ilk şemaya geri dönersek, sohbetimizin başlangıcında geri döndüğünüzde, sıfırın iki kuyruğunda renklendirdiniz çünkü onlar "aşırı" idi. Hala iyi bir iş çıkarırlar mı?
Öğrenci : Sanmıyorum. Boş hipotez altında oldukça aşırı ve nadir olmalarına rağmen, alternatiflerin hiçbiri için neredeyse imkansızdır. Benim yeni ölçüm olsaydı, demek rağmen, ben şüpheci tarafını ve herhangi bir iyileşme meydana geldiğini inkar düşünüyorum, her halükarda alışılmadık bir sonuçtu. Bu rengi değiştirmek istiyorum. Burada - başka bir mum boya alayım.3.03.03.0
Öğretmen : Bu neyi temsil ediyor?
Öğrenci : Sizden, orijinal histogramın altındaki alanın sadece% 10'unu çizmemi istemiştik - boş değeri tanımlayanı. Bu yüzden şimdi alternatiflerin ortaya çıkma ihtimalinin daha fazla olduğu alanın% 10'unu çizdim. Bu alanda yeni bir ölçüm yapıldığında, bize alternatife inanmamız gerektiğini söylüyor.
Öğretmen : Şüpheci buna nasıl tepki vermeli?
Öğrenci : Bir şüpheci asla yanıldığını kabul etmek zorunda değildir, değil mi? Fakat bence inancı biraz sarsılmalı. Bir ölçüm rağmen böylece Sonuçta, biz onu düzenlenmiş olabilir Sadece çekti alanı içinde olması, sadece boş true olduğunda orada olmanın% 10 şansı var. Alternatif doğru olduğunda, orada bulunma şansı daha büyük. Sana bu şansın ne kadar büyük olduğunu söyleyemem çünkü bu, bilim adamının aygıtı ne kadar geliştirdiğine bağlı. Sadece daha büyük olduğunu biliyorum. Yani kanıt şüpheci karşı olacaktır.
Öğretmen : Tamam. Öğrendiklerinizi tamamen netleştirebilmemiz için anlayışınızı özetler misiniz?
Öğrenci : Alternatif hipotezleri boş hipotezlerle karşılaştırmak için histogramlarını karşılaştırmamız gerektiğini öğrendim. Alternatiflerin yoğunluğunu sıfırın yoğunluğuna böldük: buna “olasılık oranı” diyorsunuz. İyi bir test yapmak için,% 10 gibi küçük bir rakam seçmeliyim ya da bir şüpheci sallamak için ne gerekiyorsa. O zaman olabilirlik oranının mümkün olduğu kadar yüksek olduğu değerleri bulmalı ve% 10 (veya ne olursa olsun) renkli olana kadar onları renklendirmeliyim.
Öğretmen : Peki bu boyamayı nasıl kullanırsın?
Öğrenci : Bana daha önce hatırlattığın gibi, renklendirme dikey çizgiler arasında olmalı. Renklendirmenin altında yer alan değerler (yatay eksende) sıfır hipotezine karşı kanıtlardır. Diğer değerler - peki, bütün histogramlara daha ayrıntılı bir bakış açmadan ne anlama geldiklerini söylemek zor.
Öğretmen : Yazıda değerine geri dönersek, ne sonuçlandırırsın?0.1
Öğrenci : Bu, en son renklendirdiğim alanın içinde, bu yüzden bilim adamının muhtemelen haklı olduğunu ve cihazın gerçekten geliştirildiğini düşünüyorum.
Öğretmen : Son bir şey. Sonucunuz, testin kriteri veya% "boyutu" olarak% 10 almaya dayanıyordu. Birçok insan bunun yerine% 5'i kullanmayı sever. Bazıları% 1'i tercih ediyor. Onlara ne söyleyebilirsin?
Öğrenci : Bu testleri bir kerede yapamam! Belki bir şekilde yapabilirim. Testin boyutu ne olursa olsun , bu anlamda "en aşırı" değer olan renklendirmeye başlamalı ve oradan iki yönde de dışarı doğru çalışmalıyım. Ben hemen önünde durmaktadır olsaydı aslında gözlenen açıyı hesaplar - Ben ikisinin arasında bir alanda renkli düşünüyorum ve , demek . % 5 ve% 1 insanlar hemen çok fazla renklendirdiğimi söyleyebiliyorlardı: sadece% 5 ya da% 1 renklendirmek isteselerdi yapabilirlerdi, ama kadar uzağa0.1 0.05 0.1 0.08 0.100.10.050.10.080.1. Benim yaptığım sonuca varmayacaklardı: Değişimin gerçekten gerçekleştiğine dair yeterli kanıt olmadığını söylerlerdi.
Öğretmen : Az önce bana, başlangıçta bu alıntıların gerçekte ne anlama geldiğini söyledin . Bu örnekten, daha büyük bir değere sahip olma veya hatta boş yoğunluğun küçük olduğu bir değere sahip olma anlamında "daha aşırı" veya "büyük veya eşit" veya "en azından büyük" olma niyetinde olmadıkları açık olmalıdır . Bu şeyleri tanımladığınız büyük olasılık oranları anlamında gerçekten kastediyorlar . Bu arada, hesapladığınız civarında sayıya "p-değeri" denir. Sadece tarif ettiğiniz şekilde tam olarak anlaşılabilir: göreceli histogram yüksekliklerinin analizi ile ilgili olabilir - olasılık oranları.0.08
Öğrenci : Teşekkürler. Bunları henüz tam olarak anladığımdan emin değilim, ama bana düşünmek için çok şey verdiniz.
Öğretmen : Daha ileri gitmek istersen, Neyman-Pearson Lemma'ya bir göz at . Muhtemelen şimdi anlamaya hazırsın.
özet
İletişim kutusundaki gibi tek bir istatistiği temel alan pek çok test buna " " veya " " . Bunlar boş histogramın neye benzediğini göstermenin yollarını gösteriyor, ancak bunlar sadece ipucu. Burada gösterildiği gibi, öğrenci tarafından özetlenen yapı, p değeri ile nasıl ilişkili olduğunu göstermektedir. P değeri, gözleminin boş hipotezin reddine yol açmasına neden olacak en küçük test boyutudur .t t = 0,1ztt=0.1
Ayrıntı göstermek için yakınlaştırılan bu şekilde, sıfır hipotezi düz mavi olarak çizilir ve iki tipik alternatif kesikli çizgilerle çizilir. Bu alternatiflerin sıfırdan daha büyük olma eğilimi gösterdiği bölge gölgelendirilir. Gölgeleme, alternatiflerin göreceli ihtimallerinin en yüksek olduğu yerlerde başlar ( ). Gözlem ulaştığında gölgeleme durur . P değeri, gölgeli bölgenin boş histogramın altındaki alanıdır: boşluğun doğru olduğunu varsayma şansı, olasılık oranları hangi seçeneğin gerçek olduğuna bakılmaksızın büyük olasılıkla yüksek olan bir sonucu gözlemleme şansıdır. Özellikle, bu yapı tamamen alternatif hipoteze dayanmaktadır. Muhtemel alternatifler belirtilmeden gerçekleştirilemez.t = 0,10t=0.1