En sevdiğin mesleğin zor bir istatistiksel kavram için açıklaması nedir?


36

Gerçekten karmaşık sorunlara basit açıklamalar duymaktan zevk alıyorum. Zor bir istatistiksel kavramı açıklayan en sevdiğiniz analojiniz veya anekdotunuz hangisidir?

En sevdiğim, Murray'in bir sarhoş ve köpeği kullanarak eşbütünleşme açıklaması. Murray, iki rastgele işlemin (bir gezinti sarhoş ve köpeği Oliver) nasıl birim köklere sahip olabileceğini, ancak ortak ilk farkları durağan olduğu için hala birbirleriyle nasıl ilişkili olduklarını açıklar.

Sarhoş bardan yola çıkarak, amaçsızca rasgele yürüyüş tarzında dolaşmak üzere yola çıkıyor. Ancak periyodik olarak “Oliver, neredesin?” Diye seslendiriyor ve Oliver, amaçsızca havlamasını engelliyor. Onu duyar; onu duyar. "Ah, fazla uzaklaşmasına izin veremem; beni kilitleyecek" diye düşünüyor. "Ah, fazla uzaklaşmasına izin veremem; gecenin ortasında havlamasıyla beni uyandıracak" diye düşünüyor. Her biri, diğerinin ne kadar uzakta olduğunu değerlendirir ve bu boşluğu kısmen kapatmak için hareket eder.

Yanıtlar:


18

Bir p değeri, verilerin utanç verici boş hipotez için ne kadar bir ölçüttüğünü gösterir.

Nicholas Maxwell, Veriler Önemli: Rastgele Bir Dünya için Kavramsal İstatistikler Emeryville CA: Key College Publishing, 2004.


15
  1. Dağılımınızı (histogramı) tahtadan oyup, parmağınız üzerinde dengelemeye çalıştıysanız, dağıtım şekli ne olursa olsun, denge noktası ortalama olacaktır.

  2. Dağılım grafiğinin ortasına bir çubuk koyarsanız ve çubuğu bir yaylı her veri noktasına iliştirirseniz, çubuğun dinlenme noktası regresyon çizginiz olur. [1]

[1] bu teknik olarak temel bileşenler regresyonu olacaktır. yayları sadece en az kareler olacak şekilde "dikey" hareket etmeye zorlamanız gerekir, ancak örnek her iki şekilde de açıklayıcıdır.


2
Yay kuvveti deformasyon ile orantılıdır, bu yüzden bu en küçük kareler regresyonu değil!
shabbychef

1
İyi deneme! Bahar bağlı. Örneğin, yay sabiti 1 / sigma ise, iyi çalışır;)
Neil McGuigan

2
hayır, hayır, nokta, statik dengede kuvvetlerin toplamının sıfır olacağı; eşit yay sabitlerini varsayarsak, mutlak sapmaların toplamını, yani en az kareleri değil regresyonunu minimize . Bu, yayların çubuk üzerinde serbestçe yüzmek zorunda kalacağı gerçeğini görmezden gelir, böylece deformasyon tamamen yönünde olmayacak , böylece Temel Bileşenler gibi bir şeyle sonuçlanan, ancak mutlak hatalarla sonuçlanacaktı. yL1y
shabbychef

@shabbychef: Deformasyonla orantılı olan yay kuvveti, yay enerjisinin deformasyon karesiyle orantılı olduğu anlamına gelir. Bahar enerjisi aslında dengede en aza indirgenmiş olandır. Sıfır olan kuvvetlerin toplamı kuvvet değildir veya en aza indirgenmiştir. , mutlak değerlerin toplamını en aza indirir. L 1L1L1
21’de:

12

Daha önce sarhoşun yürüyüşünü rastgele yürüyüş için, sarhoş ve köpeğini eşbütünleşme için kullandım; çok yardımcı oldular (kısmen eğlenceli oldukları için).

En sevdiğim ortak örneklerden biri, bazı önemli olasılık kavramlarını gösteren Doğum Günü Paradoksudur ( wikipedia girişi ). Bunu insanlarla dolu bir odayla simüle edebilirsiniz.

Bu arada, istatistiksel kavramları öğretmek için bazı yaratıcı yöntem örnekleri için Andrew Gelman'ın "İstatistik İstatistikleri: Bir Torba Çantası" (" içindekiler tablosuna bakınız ") şiddetle tavsiye ederim . Ayrıca istatistik öğretimi üzerine ders verdiği dersle ilgili makalesine bakınız: “Üniversite Düzeyinde İstatistik Öğretimi Kursu” . Ve üzerinde "Siyaset Bilimi, Sosyoloji, Kamu Sağlık, Eğitim, Ekonomi Yüksek Lisans Öğrencilerine Öğretim Bayes, ..." .

Bayesian yöntemlerini tanımlamak için, haksız bir madeni para kullanmak ve birkaç kez çevirmek oldukça yaygın / etkili bir yaklaşımdır.


1
Tim

11

"Sınıf içi" bir alıştırma ile örnekleme varyasyonunu ve esas olarak Merkezi Limit Teoremini göstermeyi seviyorum. Diyelim ki sınıftaki herkes 100 yaşını bir kağıda yazar. Tüm kağıt parçaları aynı boyutta ve ortalamayı hesapladıktan sonra aynı şekilde katlanmış. Bu nüfus ve ortalama yaşını hesaplıyorum. Daha sonra her öğrenci rastgele 10 adet kağıt seçer, yaşlarını yazar ve çantasına geri döndürür. (S) ortalamayı hesaplar ve çantayı bir sonraki öğrenciye iletir. Sonunda, her biri bir histogram ve bazı tanımlayıcı istatistikler yoluyla tanımlayabileceğimiz popülasyon ortalamasını tahmin eden 10 öğrenciden oluşan 100 öğrencimiz var.

Daha sonra bu sefer gösteriyi son anketlerden bazı Evet / Hayır sorusunu yineleyen 100 "fikir" kullanarak tekrarlıyoruz. Örneğin (Genel General) seçim yarın aranırsa, İngiliz Ulusal Partisine oy vermeyi düşünürsünüz. Öğrenciler bu görüşlerin 10 tanesini örneklemektedir.

Sonunda, hem sürekli hem de ikili veri içeren örnekleme varyasyonunu, Merkezi Limit Teoremini vb. Gösterdik.


10

Kesinlikle Monty Hall Sorunu. http://en.wikipedia.org/wiki/Monty_Hall_problem


1
+1 bu problem beynimi ilk okuduğumda ve düşündüğümde çarpıtmıştı - ve çözüm oldukça basit ama olasılık hakkında çok şey öğretiyor.
Sharpie

1
Monty Hall probleminin basit bir mesleğin olasılığı açıklamasından başka bir şey olmadığını düşünüyorum. Anlıyorum, ama kafamı etrafına sarmak konusunda hala zorluk çekiyorum, bunu istatistik dışı bir kişiye açıklamak ve ondan bir şey öğrenmelerini sağlamak için yeterince iyi anladım. sizin zor kavramınız veya mesleğinizin açıklaması . Yapana kadar -1.
naught101

2
Monty Hall sorununu açıklamanın kolay yolu aynı sorunu hayal etmek ama 1000 kapı ile - 999'unun arkasında bir keçi var ve sadece 1'inde arkasında bir araba var. Bir kapı seçtiğinizi söyleyin ve oyun şovu sunucusu 998 başka kapı açar ve kararınızı açmadığı bir kapıya değiştirmek isteyip istemediğinizi sorar. O arkasında araba ile kapıyı açtı olamayacağını bilerek, olur sahip diğer kapıya anahtara (veya sağ baştaki seçiminde olduğu gülünç emin olun).
Berk U.

10

1) Belirli olayların olasılığını ortaya çıkarmak için "rastgele" nin nasıl tanımlanması gerektiğinin iyi bir gösterimi:

Bir daire boyunca çizilen rastgele bir çizginin yarıçaptan daha uzun olması ihtimali nedir?

Soru tamamen çizginizi nasıl çizdiğinize bağlı. Yerde çizilen bir çember için gerçek dünyayla tanımlayabileceğiniz olasılıklar şunları içerebilir:

Dairenin içine iki rastgele nokta çizin ve bunlardan bir çizgi çizin. (İki sinek / taşın nerede düştüğünü görün ...)

Çevrede sabit bir nokta seçin, ardından dairenin başka bir yerinde rastgele bir nokta seçin ve bunlara katılın. (Aslında bu, dairenin üzerine, belirli bir nokta boyunca değişken bir açıda bir çubuk ve örneğin bir taşın düştüğü yerde rastgele bir çubuk koymaktır.)

Bir çap çizin. Rastgele boyunca bir nokta seçin ve içinden dikey bir çizin. (Çubuğu düz bir çizgi boyunca yuvarlayın, böylece dairenin karşısında durur.)

Bazı geometri yapabilecek birine (ancak mutlaka istatistik olması gerekmeyen) birine cevap vermek oldukça kolaydır (yaklaşık 2/3 ila yaklaşık 0,866 ya da öylesine).

2) Tersine tasarlanmış bir bozuk para atma: on kez atıp (söyleyerek) sonucu yazınız. Bu tam dizinin olasılığını . Küçücük bir şans, ama sadece o kendi gözlerinle olduğunu gördüm! ... Her sekans olabilir arka arkaya on kafaları dahil gelip, ama yatıyordu insanlar yuvarlak başını almak için bu çok zor. Bir encore olarak, onları 1 ile 6 arasındaki sayılarla piyango kazanma şansına sahip oldukları kadar iyi bir kombinasyona sahip oldukları konusunda ikna etmeye çalışın.(1210)

3) Tıbbi teşhisin neden kusurlu göründüğünü açıklamak. Buna sahip olanları tanımlamakta% 99,9 oranında kesin olan bir hastalık foo testi, ancak% 0,1 oranında yanlış-pozitif olarak teşhis etmekte ve buna sahip olmayanları gerçekten teşhis etmektedir (hastalık prevalansı gerçekten düşük olduğunda, gerçekten çok sık yanlış gibi görünebilir ( örneğin 1000'de 1) ancak birçok hasta bunun için test edilmiştir.

Bu, gerçek sayılarla en iyi açıklanmış olanıdır - 1 milyon insanın test edildiğini düşünün, yani 1000 hastalığa sahip, 999 doğru şekilde tanımlandı, ancak 999.000’in% 0.1’inde 999’a sahip olduğunu ancak buna sahip olmadığını söyledi. Yani, yüksek doğruluk seviyesine (% 99.9) ve düşük yanlış pozitif seviyesine (% 0.1) rağmen, sahip oldukları söylenenlerin yarısı aslında yok. İkinci (ideal olarak farklı) bir test daha sonra bu grupları ayıracaktır.

[Bu arada, sayıları seçtim çünkü kullanımı kolay, tabii ki% 100'e kadar ilave etmek zorunda değiller çünkü doğruluk / yanlış pozitif oranlar testte bağımsız faktörler.]


2
Sanırım ilk örneğiniz Bertrand'ın paradoksuna atıfta bulunuyor. Olasılıksal bir mekanı tanımlamanın farklı yollarının çok güzel illüstrasyonu!
chl

9

Sam Savage'ın Averaj Kusuru kitabı , istatistiksel kavramların iyi layman açıklamaları ile doludur. Özellikle, Jensen'in eşitsizliği hakkında iyi bir açıklaması var. Eğer bir yatırımın geri dönüşünün grafiği dışbükey ise, yani “size gülümsüyor” ise, rasgele sizin lehinizedir: ortalama getiriniz ortalama getirinizden daha fazladır.



6

Behar ve arkadaşlarının istatistik öğretimi için 25 analoji koleksiyonu vardır. İşte iki örnek:

2.9 Tüm modeller teoriktir: Evrende Mükemmel Küre Yoktur Görünüşe göre evrendeki en yaygın geometrik biçim küre. Fakat evrende matematiksel olarak mükemmel kaç alan var? Cevap hiçbiri değil. Ne Dünya, ne Güneş, ne de bir bilardo topu mükemmel bir küre değil. Öyleyse, gerçek küreler yoksa, kürenin alanını veya hacmini belirlemeye yönelik formüller ne işe yarar? Dolayısıyla genel olarak istatistiksel modellerle ve özellikle normal dağılıma sahip. En yaygın örneklerden biri yükseklik dağılımı olsa da, elimizdeki gezegendeki her yetişkinin yüksekliğine sahip olsaydık, histogram modeli, veriler cinsiyete göre kesilmiş olmasa bile, bir Gauss çan eğrisine karşılık gelmezdi. ırk veya başka bir özellik.

2.25 Artıklar Bilgi İçermemelidir: Bir Çöp Torbası Artıklar, tüm bilgileri verilerden çıkardıktan sonra kalanlardır. Hiçbir bilgi taşımamaları gerektiğinden, onları “çöp kutusu” olarak değerlendiriyoruz. Değerli (bilgi) olan ve bağımlı değişkenin davranışını daha iyi açıklamak için kullanılabilecek herhangi bir çöp atmadığımızdan emin olmak gerekir.

Diğer örnekler

  • "Örneklem Büyüklüğünün Tedavi Uygulamalarının Karşılaştırılması Üzerine Etkisi: Dürbün Büyüme"
  • "Nüfusun Boyutuna Karşı Örneklem Büyüklüğü: Çorba Tadı için Bir Kaşık"

Referanslar

  • Behar, R., Grima, P. ve Marco-Almagro, L. (2012). İstatistiksel Kavramları Açıklamak İçin Yirmi Beş Analoji. Amerikan İstatistiği, (sadece kabul edildi).

3

Eğlenceli bir soru.

Biri biyoistatistikte çalıştığımı öğrendi ve bana (temel olarak) "İstatistikler sadece yalan söyleme yolu değil mi?" Diye sordular.

(Mark Twain'in Lies, Lanet olası Yalanlar ve İstatistikler hakkındaki teklifini geri getirir)

İstatistiklerin yüzde 100 kesinlik ile, varsayımlar verilmiş ve verilmiş veriler olduğunu söyleyebilmemize izin verdiğini açıklamaya çalıştım.

Etkilenmedi.


1
"% 100 hassasiyetle, hassasiyet eksikliğimizin ne kadar büyük olduğunu söylememize izin verir"
naught101

Kesin bir hakaret değilse, @ Jeromy'nin cevabı "% 100 kesinlik" kavramının neden hurdaya atılması gerektiğini gösteriyor.
rolando2
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.