Merkezi Limit Teoreminin güzelliğini istatistikçi olmayanlara nasıl aktarırsınız?


33

Babam matematik meraklısıdır, ancak istatistiklerle pek ilgilenmez. Bu temiz olurduBazı harika istatistik parçalarını göstermeye çalışmak doğru ve CLT birinci sınıf bir adaydır. Merkezi limit teoreminin matematiksel güzelliği ve etkisini istatistikçilere nasıl aktarırsınız?


Bir hızlı düşünce 68-95-99.7 kuralını ( en.wikipedia.org/wiki/68-95-99.7_rule ) bir şekilde tartışmaya sokmaktır .
raegtin

Yanıtlar:


16

CLT ile en çok sevdiğim şey, uygulanabilir olmadığı durumlar. Bu, bana Gauss eğrisinin önerdiği gibi biraz daha ilginç bir umut olduğunu gösteriyor. Öyleyse ona Cauchy dağılımını göster.


Cauchy dağılımı ile CLT veya CLT'nin başarısızlığı arasındaki ilişki nedir?
robin girard


CLT, MGF'lerin 0 mahallesinde varolmasını gerektirir. Cauchy dağılımı bu özelliğe sahip değildir. CLT Win. Cauchy, CLT'nin daha güçlü bir versiyonunun zayıf gereksinimlerini bile karşılamıyor, burada gereken tek şey, bu ortalama ve varyansın mevcut olmasıdır. Cauchy dağılımı, CLT'nin tutması için ortalamanın var olması gerektiğini gösterir. CLT'nin başarısız olmasına neden olmaz.
Baltimark

@Baltimark Yazımı yanlış anladınız - açıkçası Cachy'nin CLT varsayımları nedeniyle CLT tarafından kapsanmadığı açık, aksi takdirde CLT'yi kanıtlamak imkansız olurdu. Bu örneği verdim çünkü insanlar CLT'nin tüm dağıtımlar için çalıştığına inanıyor; Muhtemelen "başarısız" mükemmel bir kelime değildir, ama yine de bunun düşük oy için bir sebep olduğunu düşünmüyorum. Tamam, uygulanabilir değil bile yaptım.

Düzenlemenizi tercih ederim. Cauchy dağılımı kesinlikle çok havalı.
Baltimark

14

CLT'yi tamamen takdir etmek için görülmesi gerekir.

Bu nedenle, fasulye makinesi kavramı ve gösterim amacıyla birçok youtube videosu .


Binom dağılımını gösterdiğini sanıyordum; Asimptotiklerinin CLT ile doğrudan bir bağlantısı olduğunu sanmıyorum.

2
animasyon paketinin yazarına göre fasulye makinesi ... yihui.name/tr/wp-content/uploads/2010/07/…
robin


@ robin hakkında yazdım, sorun ne?

1
@ShreevatsaR İyi bir örnek, bir şeyin "çekirdeğini" göstermeli ve (en azından IMO) CLT'nin "çekirdeği", farklı garip dağılımlardan birçok değişkeni bir Gauss'a erittiği gerçeğinden kaynaklanıyor. Binom dağılımının sadece bir sınırı.

7

Çoğunlukla matematikçiler olasılık hakkında konuşurlarsa, bilinen bir olasılık dağılımıyla başlarlar, sonra olayların olasılığı hakkında konuşurlar. Merkezi limit teoreminin gerçek değeri, doğru dağılımı bilmediğimiz durumlarda normal dağıtımı yaklaşık olarak kullanmamıza izin vermesidir. Veriler ortalama mu ve sd sigma ile bir dağıtımdan geliyorsa, babanıza bir örnek ortalamasının belirli bir değerden daha yüksek olma ihtimalinin ne olduğu konusunda standart bir istatistik sorusu (ancak matematik olarak ifade edilir) sorabilirsiniz, Bir dağıtım varsaydığını (o zaman bilmediğimizi söylersiniz) veya dağıtımı bilmesi gerektiğini söyler. Daha sonra, çoğu durumda CLT'yi kullanarak cevabı tahmin edebileceğinizi gösterebilirsiniz.

Matematiği istatistiklerle karşılaştırmak için, entegrasyonun ortalama değer teoremini kullanmak isterim (ki bu, a'dan b'ye bir integral için aynı alandaki a'dan b'ye bir dikdörtgen olduğunu ve dikdörtgenin yüksekliğinin eğrisi). Matematikçi bu teoremi inceliyor ve "havalı, ortalama hesaplamak için bir entegrasyon kullanabilirim" diyor, istatistikçi de aynı teoremi inceliyor ve "havalı, bir entegral hesaplamak için ortalama kullanabiliyor" diyor.

Aslında ofisimde ortalama değer teoremi ve CLT'nin (Bayes teoremi ile birlikte) çapraz dikişli duvar askıları var.


Hmmm. Ben çoğu matematikçinin MVT'yi bir integrali dikdörtgen olarak göstermek için kullandığını düşünürdüm.
kardinal

5

"Sınıf içi" bir alıştırma ile örnekleme varyasyonunu ve esas olarak Merkezi Limit Teoremini göstermeyi seviyorum. Diyelim ki sınıftaki herkes 100 yaşını bir kağıda yazar. Tüm kağıt parçaları aynı boyutta ve ortalamayı hesapladıktan sonra aynı şekilde katlanmış. Bu nüfus ve ortalama yaşını hesaplıyorum. Daha sonra her öğrenci rastgele 10 parça kağıt seçer, yaşlarını yazar ve çantasına geri döndürür. (S) ortalamayı hesaplar ve çantayı bir sonraki öğrenciye iletir. Sonunda, her biri bir histogram ve bazı tanımlayıcı istatistikler yoluyla tanımlayabileceğimiz popülasyon ortalamasını tahmin eden 10 öğrenciden oluşan 100 öğrencimiz var.

Daha sonra bu sefer gösteriyi, son anketlerden bazı Evet / Hayır sorusunu yineleyen 100 "fikir" kullanarak tekrarlıyoruz. Örneğin (Genel General) seçim yarın aranırsa, İngiliz Ulusal Partisine oy vermeyi düşünürsünüz. Öğrenciler bu görüşlerin 10 tanesini örneklemektedir.

Sonunda, hem sürekli hem de ikili veri içeren örnekleme varyasyonunu, Merkezi Limit Teoremini vb. Gösterdik.


4

Aşağıdaki kodla oynamak M, tekdüze dışındaki dağılımların değerini değiştirmek ve seçmek, eğlenceli bir örnek olabilir.

N <- 10000
M <- 5
meanvals <- replicate(N, expr = {mean(runif(M,min=0, max=1))}) 
hist(meanvals, breaks=50, prob=TRUE) 


2

Tecrübelerime göre CLT göründüğünden daha az kullanışlıdır. Hiç kimse bir projenin ortasında, yaklaşık görevin görev için yeterli olması için n'nin yeterince büyük olup olmadığını bilmiyor. Ve istatistiksel testler için CLT, tip I hatasını korumanıza yardımcı olur, ancak tip II hatasını uzak tutmak için çok az şey yapar. Örneğin, veri dağılımı aşırı derecede eğildiğinde, t testi büyük n için keyfi olarak düşük güce sahip olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.