Yaygın dağılımların gerçek hayattan örnekleri


28

İstatistiğe ilgi duyan yüksek lisans öğrencisiyim. Maddeyi genel olarak seviyorum, ancak bazen gerçek hayata uygulamalar hakkında düşünmekte zorlanıyorum. Özellikle, benim sorum yaygın olarak kullanılan istatistiksel dağılımlar (normal - beta-gamma vb.) İle ilgili. Sanırım bazı durumlarda, dağıtımı oldukça iyi yapan belirli özellikleri elde ediyorum - örneğin üstel ve hafızasız özellik. Ancak diğer birçok durumda, ders kitaplarında gördüğümüz ortak dağıtımların hem önemi hem de uygulama alanları hakkında bir fikrim yok.

Endişelerimi giderecek pek çok iyi kaynak var, bunları paylaşırsanız sevinirim. Gerçek hayattaki örneklerle ilişkilendirebilseydim, malzemeye daha fazla motive olurdum.


8
Çok çeşitli dağılımları kapsayan on dört tür uygulama , Mathematica'nın EstimatedDistribution işlevi için yardım sayfasında "uygulamalar" altında açıklanmaktadır .
whuber

Yanıtlar:


23

Wikipedia'da, her bir dağıtım hakkında daha fazla ayrıntıya bağlantı veren birçok olasılık dağılımını listeleyen bir sayfa vardır . Farklı dağıtımların yaygın olarak kullanıldığı uygulama türleri hakkında daha iyi bir fikir edinmek için listeyi inceleyebilir ve bağlantıları takip edebilirsiniz.

Sadece bu dağılımların gerçeği modellemek için kullanıldığını ve Box'un söylediği gibi: "tüm modeller yanlış, bazı modeller yararlıdır".

Yaygın dağıtımların bazıları ve faydalı olma nedenlerinden bazıları şunlardır:

Normal: Bu, CLT nedeniyle ortalamalara ve diğer lineer kombinasyonlara (örneğin regresyon katsayıları) bakmak için kullanışlıdır. Bununla ilgili olarak, birçok farklı küçük nedenin ilave etkilerinden dolayı bir şey ortaya çıktığı biliniyorsa, o zaman normal makul bir dağılım olabilir: örneğin, birçok biyolojik önlem çoklu genlerin ve çoklu çevresel faktörlerin sonucudur ve bunun için genellikle normaldir. .

Gama: Sağa eğik ve 0'da doğal minimum olan şeyler için faydalıdır. Genellikle geçen süreler ve bazı finansal değişkenler için kullanılır.

Üstel: Gama'nın özel durumu. Hafızasız ve kolayca ölçeklenebilir.

Ki-kare ( ): Gama'nın özel durumu. Karesi alınmış normal değişkenlerin toplamı olarak ortaya çıkar (varyanslar için kullanılır).χ2

Beta: 0 ile 1 arasında tanımlanır (ancak diğer değerler arasında dönüştürülebilir), oranlar veya 0 ile 1 arasında olması gereken diğer miktarlar için yararlıdır.

Binom: Belirli bir sayıda bağımsız denemeden kaçının "başarı" ile aynı olasılıkta olduğu "başarı".

Poisson: Sayılar için ortak. Bir süre veya alandaki olayların sayısı bir Poisson'u takip ederse, o zaman, zamanın veya alanın iki katı olan sayı hala Poisson'u takip ediyorsa (ortalamanın iki katı): Poidison eklemek veya değerlerden başka bir değerle ölçeklendirmek için çalışır 2.

Olaylar zamanla meydana gelirse ve olaylar arasındaki sürenin bir üstel olduğunu ve bir zaman diliminde gerçekleşen sayının bir Poisson izleyeceğini unutmayın.

Negatif Binom: Asgari 0 (veya hangi sürüme bağlı olarak başka bir değer) sayar ve üst sınır yoktur. Kavramsal olarak k "başarılı" olmadan önce "başarısızlık" sayısıdır. Negatif binom, aynı zamanda, bir gamma dağılımından gelen Poisson değişkenlerinin bir karışımıdır.

Geometrik: 1. "başarılı" den önce "başarısız" sayısının olduğu negatif binom için özel durum. Ayrık yapmak için üstel bir değişkeni keser (yuvarlarsanız), sonuç geometrik olur.


3
Cevabınız için teşekkür ederim. Ancak, wikipedia, istediğim daha genel bir açıklama sağlar. Temel olarak sorum, neden bazı dağıtımların iyi olduğu? Normal dağılım durumunda muhtemel bir cevap vermek için, merkezi sınırlı teoremle ilgili olabilir - bu da sonsuz miktarda gözlem örneği alırsanız, asimpotikte gerçekte, eğer gözlemlemenin yeterli bir istatistiğinin normal bir dağılıma sahip olduğunu görebilirsiniz. . Bunun gibi daha fazla örnek arıyorum ..
Roark

Tam olarak gerçek bir dağıtım değil, peki ya bimodal? İnsandaki cinsiyet farklılıklarının çoğunun iki modlu olmadığını tespit ettikten sonra, sık görülen gerçek hayattan örnekler düşünemiyorum.
tavan kedisi,

Multinomial ekleyin

3

Asimptotik teori normal dağılıma, aşırı değer türlerine, kararlı yasalara ve Poisson'a yol açar. Üstel ve Weibull olay dağılımlarına parametrik zaman olarak gelme eğilimindedir. Weibull durumunda, bir numunenin minimum miktarı için aşırı bir değer türüdür. Normal dağılımlı gözlemler için parametrik modellerle ilgili olarak ki kare, t ve F dağılımları hipotez testlerinde ve güven aralığı tahminlerinde ortaya çıkmaktadır. Testlerin gücünü incelemek için merkez dışı t ve F dağılımlarına sahibiz. Hipergeometrik dağılım, Fisher'in beklenmedik durum tabloları için yapılan kesin testinde ortaya çıkar. Binom dağılımı, oranları tahmin etmek için deneyler yaparken önemlidir. Negatif binomial, bir nokta işleminde aşırı dağılmayı modellemek için önemli bir dağılımdır. Bu size pratik parametrik dağılımlarda iyi bir başlangıç ​​yapmalıdır. (0, ∞) üzerindeki negatif olmayan rasgele değişkenler için, Gamma dağılımı çeşitli şekiller sağlamak için esnektir ve log normal olarak da kullanılır. [0,1] 'de beta ailesi, tek tip ve aynı zamanda sağa eğik veya sağa eğimli dağılımları içeren simetrik dağılımlar sağlar.

İstatistiki dağılımlar ile ilgili tüm nitrit detaylarını bilmek istiyorsanız, Johnson ve Kotz tarafından kesikli dağılımlar, sürekli tek değişkenli dağılımlar ve sürekli çok değişkenli dağılımlar ve ayrıca Gelişmiş Teorinin 1. hacmini içeren klasik kitap serilerinin olduğunu da belirtmeliyim. Kendall ve Stuart İstatistikleri.


Cevabınız için çok vey teşekkür ederim, bu son derece yararlıdır. Tekrar teşekkür ederim, bu gerçekten bana yardımcı oldu.
Roark

2

William J. Feller'in en az ilk 6 bölümünü (ilk 218 sayfa) satın alın ve okuyun. "Olasılık Teorisi ve Uygulamalarına Giriş, Cilt 2" http://www.amazon.com/dp/0471257095/ref=rdr_ext_tmb . En azından Çözüm için tüm Sorunları okuyun ve tercihen olabildiğince çok sayıda çözmeyi deneyin. Bence özellikle değerli olmayan Vol 1'i okumak zorunda değilsin.

Kitabın bitiminden 45 1/2 yıl önce vefat etmiş olmasına rağmen, kitapta bitmeden önce, bu en iyi kitap, olasılık ve stokastik süreçlerde sezgiyi geliştirmek, çeşitli dağılımlar için bir fikir edinmek ve anlamak için en iyisidir. Gerçek dünya fenomenleriyle ve bunların meydana gelebilecek ve gerçekleşen çeşitli stokastik fenomenlerle ilgileri. Ve ondan inşa edeceğiniz sağlam temel ile istatistikte iyi hizmet verilecektir.

Biraz daha zorlaşan daha sonraki bölümlerde başarabilirseniz, neredeyse herkesin önünde ışık yılı olacaksınız. Basitçe söylemek gerekirse, Feller Cilt 2'yi biliyorsanız, olasılık (ve stokastik süreçler); yani, yeni gelişmeler gibi bilmediğiniz her şey, bu sağlam temel üzerine inşa ederek çabucak toplanabilecek ve ustalaşabileceksiniz.

Bu konuda daha önce sözü edilen hemen hemen her şey Feller Cilt 2'de (Kendall Gelişmiş İstatistik Teorisi'ndeki materyallerin tamamı değil, ancak bu kitabı okumak Feller Cilt 2'den sonra bir parça kek olacak) ve daha fazlası, hepsi Stokastik düşüncenizi ve sezgilerinizi geliştirecek şekilde. Johnson ve Kotz, çeşitli olasılık dağılımları konusundaki bakanlıklar için iyidir, Feller Vol 2 olasılıklı olarak nasıl düşünüleceğini ve Johnson ve Kotz'dan ne çıkarılacağını ve nasıl kullanılacağını bilmek için kullanışlıdır.


2

Sadece diğer mükemmel cevaplara eklemek için.

npλ=npsabit kalır, sıfırdan ve sonsuzluktan sınırlar. Bu bize, çok fazla bireysel olamayacak kadar çok olayla karşılaştığımız zaman faydalı olacağını söylüyor. Bazı iyi örnekler: Bir günde New York'ta meydana gelen araba kazalarının sayısı gibi kazalar, iki araba geçtiğinde / karşılaştıklarında çarpışma olasılığı çok düşüktür ve bu tür fırsatların sayısı gerçekten astronomiktir! Artık sizler bir yılda dünyadaki toplam uçak kazası sayısı gibi diğer örnekleri düşünebilirsiniz. Prusya süvarilerinde atlı ölümlerin sayısının arttığı klasik örnek!

np(1-p)p1-pnpλpp


0

Son zamanlarda yayınlanan araştırmaİnsan performansının, normal düşüncenin aksine normal dağılmadığını ileri sürmektedir. Dört alandan elde edilen veriler analiz edildi: (1) En önde gelen disipline özgü dergilerde yayınlanma sıklığına dayanan 50 disiplinde akademisyenler. (2) Aktörler, müzisyenler ve yazarlar gibi eğlence verenler ve alınan saygın ödüllerin, adayların veya ayrımların sayısı. (3) 10 ülkedeki politikacılar ve seçim / yeniden seçim sonuçları. (4) Ev koşularının sayısı, takım sporlarındaki resepsiyonlar ve bireysel sporlardaki toplam kazançlar gibi mevcut en kişiselleştirilmiş önlemlere bakan kolej ve profesyonel sporcular. Yazar, "Verileri ne kadar dar veya geniş bir şekilde analiz ettiğimize bakılmaksızın, her çalışmada net ve tutarlı bir güç kanunu dağılımının ortaya çıktığını gördük ..."


4
Kim, insan performansının normal dağıldığını önerdi ?! 80-20 prensibi Pareto (1906!) Tarafından önerilmiştir.
abaumann
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.