İstatistikte


19

Matematik sınıfımda, veya "çan eğrisi" işleviyle karşılaştık ve bana istatistiklerde sık sık uygulamaları olduğu söylendi.ex2

Merak etmekten sormak istiyorum: fonksiyonu istatistiklerde gerçekten önemli mi? Eğer öyleyse, ilgili yararlı olan nedir ve bazı uygulamaları nelerdir?ex2ex2

İnternetteki işlev hakkında fazla bilgi bulamadım, ancak biraz araştırma yaptıktan sonra, genel olarak çan eğrileri ile normal dağılım adı verilen bir şey arasında bir bağlantı buldum . Bir Wikipedia sayfası, bu tür işlevleri istatistik uygulamasına bağlar ve şunu vurgulayarak:

"Normal dağılım, istatistiklerde en belirgin olasılık dağılımı olarak kabul edilir. Bunun birkaç nedeni vardır: 1 İlk olarak, normal dağılım, ılımlı koşullar altında çok sayıda rastgele değişkenin toplamının belirtildiğini belirten merkezi limit teoreminden kaynaklanır. aynı dağıtımdan, orijinal dağıtımın biçimine bakılmaksızın yaklaşık olarak normal olarak dağıtılır . "

Yani, bir tür anket veya benzerlerinden büyük miktarda veri toplarsam, ? Fonksiyon simetriktir, yani simetrisi, yani normal dağılıma olan faydası, onu istatistiklerde bu kadar kullanışlı kılan nedir? Sadece spekülasyon yapıyorum.ex2

Genel olarak, 'yi istatistiklerde yararlı kılan nedir? Normal dağılım tek alansa, benzersiz ya da normal dağılımdaki diğer gauss tipi işlevler arasında özellikle yararlı kılan nedir?ex2ex2


Başlamak için bu "toplam" değil "demek" okumak gerekir.
Tristan

2
Toplam da. Sonuçta, bu sadece örnek sayısıyla çarpılan ortalamadır.
Erik

1
Tırnak, bir arama için anahtar kelimelerin "normal dağılım" ı içerdiğini gösterir. Sahne buraya o aramayı başlatan bu sitede beri günde birinin ortalama - 600 konuları bulur. Bu isabetlere kısa bir süre bakmak, herkesin "çan eğrisi" nin istatistikteki rolünü takdir etmesine yardımcı olacaktır.
whuber

4
Gönderen Normal dağılımlar ile ilgili konu en yüksek oyu onlar olduğuna inanıyoruz çünkü ve matematikçiler; onlar matematik ispat edilebilir düşünüyorum çünkü, deneyci: "Herkes hatalar [yani Normal dağılım] üslü yasa inanır: gözlem yoluyla kuruldu. "
whuber

"Gauss dağılımının en şaşırtıcı karakterizasyonu nedir?" Sorusunun
robin

Yanıtlar:


12

Bu işlevin önemli olmasının nedeni aslında normal dağılım ve onunla yakından ilişkili arkadaşı, merkezi limit teoremidir ( buradaki diğer sorularda CLT hakkında bazı iyi açıklamalarımız vardır ).

İstatistiklerde, CLT tipik olarak yaklaşık olasılıkları yaklaşık olarak hesaplamak için kullanılabilir, "% 95'e güveniyoruz ..." gibi ifadeler mümkün ("% 95 kendine güvenen" anlamı genellikle yanlış anlaşılır, ancak bu farklı bir konudur).

İşlev (bir ölçekli versiyonu) normal dağılımın yoğunluğu fonksiyonudur. Rastgele bir miktar normal dağılım kullanılarak modellenebiliyorsa, bu fonksiyon bahsedilen miktarın farklı olası değerlerinin ne kadar olası olduğunu açıklar. Yüksek yoğunluklu bölgelerdeki sonuçların, düşük yoğunluklu bölgelerdeki sonuçlardan daha olasıdır.exp((xμ)22σ2)

μ ve yoğunluk işlevinin yerini ve ölçeğini belirleyen parametrelerdir. hakkında simetriktir , bu nedenle değiştirmek işlevi sağa veya sola kaydırdığınız anlamına gelir. yoğunluk işlevinin değerini maksimuma ( ) ve olarak 0'a ne kadar hızlı gideceğini belirlerσμμσx=μx uzağa hareket . Bu anlamda, σ'yi değiştirmek işlevin ölçeğini değiştirir .μσ

Özel seçim için ve σ = 1 / μ=0 yoğunluke - x 2'dir (orantılı). Bu, bu parametrelerin özellikle ilginç bir seçimi değildir, ancak diğerlerinden biraz daha basit görünen bir yoğunluk fonksiyonu sağlama avantajına sahiptir.σ=1/2ex2

Öte yandan, x = u - μ değişkenlerini değiştirerek herhangi bir normal yoğunluğa gidebilirizex2. Ders kitabınızınexpdeğile-x2olduğunu söylemesinin nedeni(-(x-μ)2x=uμ2σex2,nin yazılmasının daha basit olmasıçok önemli bir işlevdir.exp((xμ)22σ2)ex2


1
Sondan bir önceki paragrafın (1) İlk cümle: Ben diyebilirsiniz orantılıdır yerine ise .
kardinal

@cardinal: Teşekkürler, oldukça haklısın! Cevabı düzenledim.
MånsT

1
+1, bu cevabı gerçekten beğendim. Dikkat çekmeye değer bir şey, normal pdf genellikle ile yazılmış olmasıdır önde. Bunun nedeni, eğrinin altındaki toplam alanın12πσ22πσ2

3

exp(x2)exp(x2)

Ve normal dağılım önemlidir çünkü ("hafif düzenlilik koşulları altında") "birçok" sonsuza yaklaştığında birçok bağımsız ve özdeş dağılmış rasgele değişkenin toplamı normale yaklaşır.

Her şey normalde dağıtılmaz. Örneğin, anket sonuçlarınız, en azından yanıtlar sürekli ölçekte değil, 1-5 tamsayıları gibi bir şeydeyse olabilir. Ancak sonuçların ortalaması normalde tekrarlanan örnekleme üzerinden dağıtılır, çünkü ortalama sadece ölçeklendirilmiş (normalleştirilmiş) bir toplamdır ve bireysel yanıtlar birbirinden bağımsızdır. Tabii ki numunenin yeterince büyük olduğu varsayılırsa, çünkü kesinlikle, normallik sadece numunenin boyutu sonsuz olduğunda ortaya çıkar.

Örnekte gördüğünüz gibi, veriler normal olarak dağıtılmasa bile, tahmin veya modelleme sürecinin bir sonucu olarak normal dağılım görünebilir. Bu nedenle normal dağılımlar istatistiklerin her yerinde. Bayes istatistiklerinde, parametrelerin birçok posterior dağılımı yaklaşık olarak normaldir veya olduğu varsayılabilir.


ex2

Eşanlamlı değiller, bunu işaret ettiğiniz için teşekkürler. (Niyetim kesin değildi, sadece istatistikçi olmayan bir kişi tarafından anlaşılabilirdi. Şimdiden iyi bir kesin yanıt var.)
scellus

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.