Normal dağılışı takip eden bu kadar doğal olgunun neden bir açıklaması var mı?


29

Bunun büyüleyici bir konu olduğunu düşünüyorum ve tam olarak anlamıyorum. Hangi fizik kanunu bu kadar doğal fenomenin normal dağılıma sahip olmasını sağlar? Düzgün dağılıma sahip olmaları daha sezgisel görünebilir.

Bunu anlamak benim için çok zor ve bazı bilgileri kaçırdığımı hissediyorum. Biri bana iyi bir açıklama yapması için yardımcı olabilir mi veya bir kitap / video / makaleye bağlayabilir mi?


Şunu kontrol et .
Antoni Parellada

7
Sizin öncülünüzün gerçekten böyle olduğunu düşünmek için sağlam bir nedeniniz var mı?
Glen_b

4
Aslında normal dağılım, doğada "baskın" dağılım olmayabilir. Aşırı değerli, ağır kuyruklu veya iktidar yasası işlevlerini tanımlayan birçok olgu ve davranış vardır. Gabaix, bu dağıtım sınıfının ekonomik ve finansal varyantlarının birçoğunu, İktisattaki Güç Yasaları: Buraya dayandırılan bir Giriş yazdı ... pages.stern.nyu.edu/~xgabaix/papers/pl-jep.pdf Shalizi , et ark. Bu yazıda onların ampirik tahmini tartışmak Ampirik Veri Power-Law Dağılımları , burada ungated ... santafe.edu/media/workingpapers/07-12-049.pdf
Mike Hunter

Normal dağılımın baskın olduğunu kim söyledi?
shadowtalker

1
Bağlantılar için @DJohnson +1, ancak Clauset ve ark. kağıt olmasıdır değildir vardır çok fazla ampirik güç yasası dağılımları kuvvetle desteklenen! Bulgulardan alıntı yapıyorum, "Sadece bir vakada - kelimelerin İngilizce metinlerinde ortaya çıkma sıklıklarının dağılımı", güç yasası verilere mükemmel bir şekilde uyduğu ve alternatiflerin hiçbirinin taşıyamadığı anlamında gerçekten ikna edici görünüyor. ağırlık."
Sycorax, Reinstate Monica’nın

Yanıtlar:


31

Öncül reddederek başlayalım. Robert Geary muhtemelen (1947'de) “ ... normallik bir efsanedir; asla normal bir dağılım olmadı ve olmayacaktı ” derken davayı abartmadı . ”-
normal dağılım bir modeldir *, bir bazen daha fazla ya da daha az kullanışlı olan yaklaşım.

* (hangisi benim profilimdeki versiyonu tercih etsem de George Box'a bakınız ).

Bazı fenomenlerin yaklaşık olarak normal olması, çok fazla sürpriz olmayabilir, çünkü bağımsız [veya çok güçlü bir şekilde ilişkili olmayan etkilerin] toplamları, eğer bunların birçoğunun varyansı ile karşılaştırıldığında önemli olan bir varyansa sahip olması durumunda Diğerlerinin dağılımını görebileceğimiz toplamı daha normal görünmek eğilimindedir.

Merkezi limit teoremi ( , bazı ılıman şartlar altında sonsuzluğa gider) standartlaştırılmış bir numunenin normal dağılımına yakınsama yaklaşımı hakkındadır ) en azından yeterince büyük fakat sonlu örneklem büyüklüklerinde bu normallik eğilimini görebileceğimizi göstermektedir.n

Elbette standartlaştırılmış araçlar yaklaşık normalse, standartlaştırılmış toplamlar; “birçok etkinin toplamı” gerekçesinin nedeni budur. Dolayısıyla, varyasyona çok az miktarda katkı varsa ve bunlar arasında yüksek oranda bir ilişki yoksa, onu görme eğiliminde olabilirsiniz.

Berry-Esseen teoremi bize (normal dağılıma yakınsama) yakınlık ile ilgili iddialı veriler için standartlaştırılmış örnekleme araçlarıyla (CLT'ye göre biraz daha katı koşullar altında, çünkü üçüncü mutlak anın sonlu olmasını gerektirdiği için) bir açıklama verir. bize bunun ne kadar hızlı olduğunu anlatmak gibi. Teoremin müteakip versiyonları , toplamda aynı olmayan dağılmış bileşenlerle ilgilidir , ancak normallikten sapma üzerindeki üst sınırlar daha az sıkıdır.

Daha az resmi olarak, çok güzel dağılımlı konvolüsyonların davranışı bize birçok durumda sonlu örneklemlerde adil bir yaklaşım olma eğiliminde olabileceğinden şüphelenmemize neden olacak (ek olarak yakın olsa da) nedenler vermektedir. Evrişim, çeşitli çekirdeklerde çekirdek yoğunluğu tahminini kullanan kişilerin aşina olacağı bir tür "lekelenme" operatörü gibi davranır; Sonucu standart hale getirdiğinizde (böylelikle böyle bir işlem yaptığınızda varyans sabit kalır), art arda pürüzsüz hale gelirken simetrik tepe şekillerine doğru artan bir ilerleme vardır (ve her seferinde çekirdeği değiştirirseniz çok önemli değildir).

Terry Tao, Merkezi limit teoreminin versiyonlarını ve Berry-Esseen teoremini burada güzelce tartışıyor ve bu arada, Berry-Esseen'in bağımsız olmayan bir versiyonuna bir yaklaşımdan söz ediyor.

Dolayısıyla, görmeyi beklediğimiz en az bir durum sınıfı ve bunun gerçekleşme eğiliminde olduğunu düşünmenin resmi nedenleri var. Bununla birlikte, en iyi ihtimalle, "birçok etkinin toplamının" sonucunun normal olacağı herhangi bir anlamda bir yaklaşımdır. Pek çok durumda bu oldukça makul bir yaklaşımdır (ve dağılımın yaklaşması yakın olmasa da, ek durumlarda, normalliğin varsayıldığı gibi bazı prosedürler, bireysel değerlerin dağılımına özellikle en az büyük örneklerde özellikle duyarlı değildir).

Etkilerin "katmadığı" birçok durum vardır ve başka şeylerin olmasını bekleyebiliriz; örneğin, bir çok finansal veri etkisinde çarpma eğilimi vardır (etkiler, faiz ve enflasyon ve döviz kurları gibi yüzde cinsinden miktarları taşıyacaktır). Orada normallik beklemiyoruz, ancak bazen kütük ölçeğinde normallik için kabaca bir yaklaşım gözlemleyebiliriz. Diğer durumlarda, uygun olmayan bir şekilde bile uygun olmayabilir. Örneğin, olaylar arası zamanlar genellikle kütüklerin normalliği veya normalliği ile iyi bir şekilde yaklaştırılmayacaktır; Burada tartışılacak etkilerin "meblağ" ya da "ürünü" yoktur. Belirli durumlarda belirli bir tür "yasa" için biraz argüman yapabileceğimiz başka fenomenler de var.


12
+1. Argümanınız - sanırım, bence - grup düşüncesi gibi psikolojik bir cevap olabilir : Alanınızdaki herkes normal dağılımlar gördüğünde, başka kim söylemelisiniz? Bu, özellikle istatistiki prosedürlerin yaya araçları olarak görüldüğü, belki de yayın için bir makaleyi onaylamak için gerekli olan, ancak aksi takdirde çok az doğal değeri olan veya ilgi alanını sorgulayan alanlar için geçerli olacaktır.
whuber

2
Spetel bir örnek vermek gerekirse, Quetelet BMI'yi (Vücut Kitle İndeksi) icat ettiğinde, bunu açıkça normal dağılmış bir miktar elde edecek şekilde yaptı. Bu konuda burada konuştuk: stats.stackexchange.com/questions/64171/…
Matt Krause

Bana öyle geliyor ki, herkes bu soruyu cevaplamak yerine yanıltmaya çalışıyor.
Digio

Geary bir istatistikçiydi, bu yüzden normalliğin bir efsane olduğunu düşünmesi şaşırtıcı değil. Fizikçi olsaydı, onu farklı görürdü.
Aksakal

Yorumlar genişletilmiş tartışmalar için değildir; bu konuşma sohbete taşındı .
Glen_b -Reinstate Monica

20

Poincaré'nin dediği gibi, Gabriel Lippmann'ın (fizikçi, Nobel ödüllü) ünlü bir deyişi var :

[Normal dağılım] kesin kesintilerden elde edilemez. Varsayılan ispatların birçoğu korkunç [...]. Bununla birlikte, M. Lippmann'ın bana bir gün söylediği gibi herkes inanıyor, çünkü deneyciler matematiksel bir teorem olduğunu düşünürken, matematikçiler deneysel bir gerçek olduğunu düşünürler.

- Henri Poincaré, Le calcul des Probabilités . 1896

[Cette loi] ne bir şey olmazsa olsun, rigoureuse; plus d'e démonstration, 'donner est grossière […] ile ilgili bir cevap verdi. Tören ledide monit yurdum, benim için bir şey istemedim, M. Lippmann.

İstatistiksel Sözler listemiz başlığında bu alıntıya sahip değiliz, bu yüzden buraya göndermenin iyi olacağını düşündüm.


Bir oy? Burada gizlice Poincare'den nefret eden biri var mı?
amip diyor Reinstate Monica

Fizik bilgim lisede öğrendiklerimle bitiyor, fakat Gauss orjinal dağılımı fiziğin normal denklemleri bağlamında incelememiş miydi? Gauss hatalarının bazı klasik fizik modellerinden doğal olarak düştüğü Wikipedia
görüşümdü

2
Bu Bon Mot'ın yazarı olarak Lippmann'ı daha çok onurlandırmalıyız . Gabriel Lippmann, Physics'te Nobel Ödülü sahibi idi. (M. burada sadece Monsieur, doğası anlamına gelir.)
Nick Cox

3
@ssdecontrol Hatırlattığım gibi, Gauss normal gözlem hatalarıyla , özellikle astronomi ve jeodeziyle ilgileniyordu , ancak varsayımın sorgulanabileceğini bilmek yeterince akıllıdı. (Aynı zamanda, örneğin, ortanca medyan mutlak sapmasını 1816'da yayılmaya karşı dirençli bir önlem olarak kullanıyordu.)
Nick Cox

Yeterince adil, @Nick. Netleştirmek için düzenleme yaptım.
amip diyor Reinstate Monica

7

Hangi fizik kanunu bu kadar doğal fenomenin normal dağılıma sahip olmasını sağlar? Düzgün dağılıma sahip olmaları daha sezgisel görünebilir.

Normal dağılım, doğa bilimlerinde ortak bir yerdir. Genel açıklama, ölçüm hatalarında meydana gelmesinin nedeni , genellikle şöyle devam eden bazı büyük sayılar veya merkezi limit teoremi (CLT) gerekçeleridir: “deney sonuçları, ilişkisiz kaynaklardan CLT sınırsız sayıda rahatsızlıktan etkilendiği için hataların normal olarak dağıtılacağını öne sürüyor ". Örneğin, WJ Metzger'ın Veri Analizinde İstatistiksel Yöntemlerden bir kısmı :

Ölçtüğümüz şeylerin çoğu aslında birçok rv'nin toplamıdır. Örneğin, bir tablonun uzunluğunu cetvelle ölçersiniz. Ölçeceğiniz uzunluk birçok küçük etkiye bağlıdır: optik paralaks, cetvelin kalibrasyonu, sıcaklık, titreyen eliniz, vb. Bu nedenle ölçtüğünüz şey sadece ölçmek istediğiniz şey değildir, aynı zamanda çok sayıda (umarım) küçük katkılar eklemiştir. Eğer bu küçük katkı payı büyükse, CLT bize toplamlarının Gauss dağıtıldığını söyler. Bu genellikle böyledir ve çözünürlük fonksiyonlarının genellikle Gaussian olmasının nedeni budur.

Ancak, bilmeniz gereken bu elbette her dağılımın normal olacağı anlamına gelmez. Örneğin, Poisson dağılımı sayma işlemleriyle uğraşırken fizikte olduğu kadar yaygındır. Spektroskopide Cauchy (aka Breit Wigner) dağılımı, radyasyon spektrumlarının ve benzerlerinin şeklini tanımlamak için kullanılır.

Bunu yazdıktan sonra farkettim: şu ana kadar bahsedilen her üç dağıtım da (Gaussian, Poisson, Cauchy) kararlı dağılımlar , Poisson ayrık kararlı . Şimdi bunu düşündüğüme göre, toplamalardan kurtulabilmesi için dağıtımın önemli bir niteliği gibi görünüyor: Poisson'dan bir kaç rakam eklerseniz, toplam bir Poisson. Bu (nedense) neden bu kadar yaygın olduğunu "açıklayabilir".

Doğal olmayan bilimlerde, çeşitli sebeplerden dolayı normal (veya başka) bir dağılım uygularken çok dikkatli olmalısınız. Özellikle korelasyonlar ve bağımlılıklar bir konudur, çünkü CLT'nin varsayımlarını bozabilirler. Örneğin, finans alanında, pek çok seri normal göründüğü, ancak risk yönetiminde büyük bir sorun olan daha ağır kuyruklara sahip olduğu iyi bilinmektedir .

Son olarak, doğa bilimlerinde normal dağılıma sahip olmanın, daha önce bahsettiğim "el sallama" mantığından çok daha katı nedenleri var. Brownian hareketini düşünün. Şoklar gerçekten bağımsız ve sonsuzsa, kaçınılmaz olarak gözlemlenebilir bir yolun dağılımı CLT'ye bağlı olarak normal dağılıma sahip olacaktır, bakınız örneğin Einstein'ın ünlü eserinde " BROWNIAN HAREKETİNİN İNCELEMESİ" nde Denk . Bugünün adı "Gauss" ya da "normal" olarak adlandırmak için zahmet etmedi bile.

ΔxΔpΔxΔp

Bu nedenle, Gauss dağılımının farklı alanlardaki araştırmacılardan farklı tepkiler almasına şaşırmayın. Fizik gibi bazı alanlarda, belirli olayların, çok sayıda gözlemle desteklenen çok katı teoriye dayanarak Gauss dağılımına doğal olarak bağlanması beklenmektedir. Diğer alanlarda, Normal dağılım teknik uygunluğu, kullanışlı matematiksel özellikleri veya sorgulanabilir diğer nedenlerle kullanılmaktadır.


1
+1. Alıntı makul, ancak ölçülen uzunluğun negatif olamayacağına (yani sınırlandırılmayacağına) dikkat çekebilir, bu yüzden gerçekten normal bir dağılımı izleyemez. Bu her zaman bir yaklaşımdır.
amip diyor Reinstate Monica

Doğal olmayan bilimler? Frankenstein'ın görünmeyen deneyleri gibi mi demek istiyorsun? ;-)
Sycorax,

1
@ user777, 's Nobel ödüllü Landau 'ın şaka : 'bilimler üç tipe ayrılabilir: doğal, doğal olmayan ve antinatural'
Aksakal

@Aksakal: Bu özel bağlantının yanlış olduğunu düşünüyorum; Landau, bilimlerin "ayrılmamış, değiştirilemediğini" ("сверхъестественные" yerine) ayrıldığını söyledi. Nasıl olsa tercüme edileceği hakkında hiçbir fikrim yok.
amip Reinstate Monica

@ amoeba, "неестественные" kelimesini "doğal" olarak tercüme ediyorum. "сверхъестественные" "doğaüstü" olduğunu düşünüyor. Belki Ruslar beni düzeltebilir.
Aksakal

2

Burada çok fazla aşırı karmaşık açıklama var ...

Benimle alakalı olmasının iyi bir yolu:

  1. Tek bir kalıbı yuvarlayın, her sayının (1-6) yuvarlanma olasılığınız eşit olur ve dolayısıyla PDF sabittir.

  2. İki zar atın ve sonuçları bir araya getirin; PDF artık sabittir. Bunun sebebi 36 kombinasyonun olması ve toplam aralığın 2 ila 12 olmasıdır. 2 ihtimalinin olması, 1 + 1'in tekil tekil kombinasyonudır. 12'lik bir ihtimal, aynı zamanda, yalnızca 6 + 6'nın tek bir kombinasyonunda meydana gelebileceği için benzersizdir. Şimdi, 7'ye bakıldığında, çoklu kombinasyonlar var, yani 3 + 4, 5 + 2 ve 6 + 1 ( ve onların ters permütasyonları). Orta değerden (7) uzaklaştıkça, 2 ve 12 tekil kombinasyonlarına ulaşana kadar 6 ve 8 vb. İçin daha az kombinasyon vardır. Bu örnek normal dağılıma neden olmaz, ancak daha fazla eklerseniz ve ne kadar çok numune alırsanız, sonuç normal dağılıma yönelecektir.

  3. Bu nedenle, rastgele değişime maruz kalan (her biri kendi PDF'lerine sahip olabilecek) bir dizi bağımsız değişken topladığınızda, sonuçta elde edilen çıktı normallik eğilimindedir. Bu, Altı Sigma terimlerinde bize “Sürecin Sesi” dediğimiz şeyi verir. Bu, bir sistemin 'ortak sebep varyasyonunun' sonucu olarak adlandırdığımız şeydir ve dolayısıyla çıktı normallik eğilimindeyse, bu sistemi 'istatistiksel süreç kontrolünde' olarak adlandırırız. Çıktının normal olmadığı (çarpık veya kaymış) olduğu durumlarda, sistemin sonucu bir şekilde önyargılı bir “sinyal” olduğu “özel sebep varyasyonuna” maruz kaldığını söylüyoruz.

Umarım yardımcı olur.


1

Hangi fizik kanunu bu kadar doğal fenomenin normal dağılıma sahip olmasını sağlar?

Fikrim yok. Öte yandan, bunun doğru olup olmadığını ya da “çok” un ne anlama geldiğini de bilmiyorum.

Bununla birlikte, sorunu biraz yeniden düzenlemek, normal bir dağılıma göre sabit bir ortalama ve değişkenliğe sahip olduğuna inandığınız sürekli bir miktarı (yani modellemek ) kabul etmek için iyi bir neden vardır . Bunun nedeni, Normal dağılımın, bu moment kısıtlamalarına tabi entropiyi maksimize etmenin sonucudur. Kabaca konuşmak gerekirse, entropi, Normal'i en commital olmayan veya azami belirsiz dağıtım şekli seçimi yapan belirsizlik ölçüsüdür.

Şimdi, kişinin entropi konusunu bilinen kısıtlamalara göre en üst düzeye çıkararak bir dağıtım seçmesi gerektiği fikri, onları gerçekleştirmenin olası yollarının sayısı bakımından bazı fiziki desteklere sahip. İstatistik mekaniğindeki Jaynes buradaki standart referans.

Maksimum entropinin Normal dağılımları motive etmesine rağmen, bu durumda, farklı tanıdıkların, örneğin tanıdık üstel, poisson, binom, vb. Gibi farklı dağıtım ailelerine yol açtığını gösterebilir.

Sivia ve Beceri 2005 ch.5 sezgisel bir tartışma var.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.