Sorunuzda normal dağılım kavramının dağıtım belirlenmeden önce olduğunu ve insanlar ne olduğunu anlamaya çalıştığını farz ediyor gibisiniz. Bunun nasıl işe yarayacağı bana belli değil. [Düzenle: "bir dağıtım arayışı" olduğunu düşünebileceğimiz en az bir anlam var ama bu "çok ve çok sayıda olayı tanımlayan bir dağıtım arayışı" değil.]
Durum bu değil; dağılım, normal dağılım denilmeden önce biliniyordu.
Böyle bir kişiye normal dağılmış tüm verilerin olasılık yoğunluk fonksiyonunun zil biçiminde olduğunu nasıl kanıtlarsınız?
Normal dağılım işlevi genellikle "çan şekli" olarak adlandırılan şeye sahiptir - tüm normal dağılımlar aynı "şekle" sahiptir (yalnızca ölçek ve konum bakımından farklı oldukları anlamında).
Veriler dağılımda az ya da çok "çan şeklindeki" görünebilir, ancak bu normal değildir. Normal olmayan dağılımların çoğu, benzer şekilde "çan şeklindeki" görünmektedir.
Verilerin alındığı gerçek nüfus dağılımları, muhtemelen oldukça makul bir yaklaşım olsa da, aslında hiçbir zaman normal değildir.
Bu tipik olarak gerçek dünyadaki şeylere uyguladığımız hemen hemen tüm dağıtımlar için geçerlidir - onlar gerçek dünya değil, onlar modeldir . [Örnek olarak, belirli varsayımlar yaparsak (Poisson süreci için olanları), Poisson dağılımını türetebiliriz - yaygın olarak kullanılan bir dağıtım. Fakat bu varsayımlar tam olarak tatmin olmuş mu? Genel olarak söyleyebileceğimiz en iyisi (doğru durumlarda), neredeyse gerçek olmalarıdır .]
normal olarak dağıtılmış verileri gerçekte ne düşünüyoruz? Normal dağılımın olasılık modelini takip eden veri mi, yoksa başka bir şey mi?
Evet, hiç aslında normalde dağıtılacak, numune çekildi nüfus normal dağılımın tam fonksiyonel formunu olan bir dağılıma sahip olurdu. Sonuç olarak, sonlu bir popülasyon normal olamaz. Mutlaka bağlı olan değişkenler normal olamaz (örneğin, belirli görevler için geçen zamanlar, belirli şeylerin uzunlukları negatif olamaz, bu yüzden normal olarak dağıtılamazlar).
normalde dağıtılmış verilerin olasılık fonksiyonunun bir ikizkenar üçgen şeklinde olması belki de daha sezgisel olacaktır.
Bunun neden daha da sezgisel olduğunu anlamıyorum. Kesinlikle daha basit.
İlk olarak hata dağılımları için modeller geliştirilirken (özellikle erken dönemde astronomi için), matematikçiler hata dağılımlarıyla ilgili çeşitli şekilleri göz önünde bulundurduğunda (bir erken noktada üçgen dağılım dahil), ancak bu çalışmanın çoğunda matematik (daha doğrusu sezgi yerine). Laplace, örneğin, birkaç üstel ve normal dağılıma baktı (diğerleri arasında). Benzer şekilde, Gauss matematiği aynı anda türetmek için kullandı, ancak Laplace’ten farklı bir takım düşünceler ile ilişkili olarak.
Laplace ve Gauss’un “hataların dağıtımını” düşündükleri dar anlamda, orada en azından bir süre için “bir dağıtım arayışı” olarak görebiliriz. Her ikisi de, önemli olduğunu düşündükleri bir hata dağılımı için bazı özellikleri öne sürdüler (Laplace zaman içinde biraz farklı kriterlere sahipti), farklı dağılımlara yol açtı.
Temelde benim sorum, normal dağılım olasılık yoğunluğu fonksiyonunun neden bir zil şekli olduğu değil mi?
Normal yoğunluk fonksiyonu olarak adlandırılan şeyin işlevsel şekli ona bu şekli verir. Standart normal kabul edin (basitlik için; diğer tüm normaller sadece ölçek ve konum bakımından farklılık gösteren aynı şekle sahiptir):
fZ(z)=k⋅e−12z2;−∞<z<∞
k
x
Bazı insanlar normal dağılışı bir şekilde "her zamanki" olarak kabul etmiş olsa da, gerçekte sadece bir yaklaşım olarak görmeye eğilim gösterdiğiniz durumlar için geçerlidir.
Dağılımın keşfi genellikle de Moivre'ye yatırılır (binomun bir yaklaşımı olarak). Etkili formu binom katsayılarını (/ binom olasılıkları) yaklaşık olarak sıkıcı hesaplamalara yaklaştırmaya çalışırken ortaya çıkardı, ancak - normal dağılımın şeklini etkili bir şekilde çıkardığı halde - yaklaşık olarak bir Olasılık dağılımı, bazı yazarlar yaptığını öne sürse de. Belli bir yorumlama gereklidir, bu yüzden bu yorumdaki farklılıkların kapsamı vardır.
Gauss ve Laplace, 1800'lerin başında bunun üzerinde çalıştı; Gauss 1809'da (ortalamanın MLE olduğu dağılımla bağlantılı olarak) ve 1810'da Laplace hakkında simetrik rastgele değişkenlerin toplamının dağılımına bir yaklaşım olarak yazdı. On yıl sonra, Laplace ayrık ve sürekli değişkenler için erken bir merkezi limit teoremi şekli verir.
Dağıtımı için erken isimleri şunlardır hata kanunu , hataların sıklığı kanunu ve aynı zamanda bazen ortaklaşa, Laplace ve Gauss hem almıştır.
"Normal" terimi, 1870’lerde üç farklı yazarın (Peirce, Lexis ve Galton), 1873’de birincisi ve 1877’de diğer ikisi tarafından bağımsız olarak dağıtılmasını tanımlamak için kullanıldı. Laplace ve de Moivre'nin yaklaşık değerinden iki kat daha fazla. Galton'un kullanımı muhtemelen en etkiliydi, ancak 1877'de (çoğunlukla “sapma kanunu” olarak adlandırıyordu) eserinde “normal” terimini kullandı.
Bununla birlikte, 1880'lerde Galton, dağılımla ilgili "normal" sıfatını birçok kez kullandı (örneğin, 1889'da "normal eğri" olarak) ve sırayla Birleşik Krallık'ta daha sonra istatistikçiler üzerinde çok fazla etkisi oldu (özellikle Karl Pearson). ). Neden "normal" terimini bu şekilde kullandığını söylemedi, ama muhtemelen "normal" veya "olağan" anlamında olduğu anlamına geliyordu.
"Normal dağılım" ifadesinin ilk açık kullanımı, Karl Pearson; 1894'te kesinlikle kullandı, ancak uzun zaman önce kullandığını iddia etti (bazı dikkatle bakacağım bir iddia).
Referanslar:
Miller, Jeff
"Bazı Matematik Kelimelerinin Bilinen İlk Kullanımları:"
Normal Dağılım (Giriş: John Aldrich)
http://jeff560.tripod.com/n.html
Stahl, Saul (2006),
"Normal Dağılımın Evrimi",
Matematik Dergisi , Cilt. 79, No. 2 (Nisan), ss 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf
Normal dağılım, (2016, 1 Ağustos).
Wikipedia'da, Serbest Ansiklopedi.
3 Ağustos 2016, 12:02, https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History adresinden alındı
Hald, A (2007),
"De
Moivre'nin Binom'a Normal Yaklaşımı, 1733 ve Genellemesi", İçinde: Bernoulli'den Fisher'a Parametrik İstatistiksel Çıkarımın Tarihçesi, 1713-1935; 17-24
[Bu kaynaklar arasında, Moivre’in hesaplarıyla ilgili olarak önemli tutarsızlıklar olduğunu unutmayın]