Beta dağılımı nerede?


13

Eminim herkes burada, zaten Beta dağılımı ait PDF bilir XB(a,b) tarafından verilir

f(x)=1B(a,b)xa1(1x)b1

Bu formülün kökenlerini açıklamak için her yerde avlanıyordum, ama bulamıyorum. Beta dağıtımında bulduğum her makale bu formülü veriyor, birkaç şeklini gösteriyor, sonra doğrudan anlarını tartışmaya devam ediyor ve oradan devam ediyor.

Türetemediğim ve açıklayamadığım matematiksel formülleri kullanmayı sevmiyorum. Diğer dağıtımlar için (örn. Gama veya binom)) öğrenip kullanabileceğim açık bir türev var. Ama Beta dağıtımı için böyle bir şey bulamıyorum.

Benim sorum şu: bu formülün kökenleri neler? Başlangıçta hangi bağlamda geliştirildiyse ilk ilkelerden nasıl türetilebilir?

[Açıklığa kavuşturmak için, Beta dağılımını Bayesçi istatistiklerde nasıl kullanacağımı ya da pratikte sezgisel olarak ne anlama geldiğini sormuyorum (beyzbol örneğini okudum). Sadece PDF'yi nasıl türeteceğimizi bilmek istiyorum. Benzer bir şey soran bir önceki soru vardı, ancak (yanlış düşünüyorum) sorunu ele almayan başka bir sorunun kopyası olarak işaretlendi , bu yüzden şu ana kadar burada herhangi bir yardım bulamadım.]

EDIT 2017-05-06: Sorular için herkese teşekkürler. Kurs eğitmenlerimin bazılarını sorduğumda aldığım cevaplardan birinden istediğimin iyi bir açıklaması olduğunu düşünüyorum:

"Sanırım insanlar normal yoğunluğu, sqrt (n) 'ye bölünen n şeyin toplamının bir limiti olarak türetebilirler ve poisson yoğunluğunu sabit bir oranda meydana gelen olaylar fikrinden türetebilirsiniz. Benzer şekilde, beta yoğunluğu için, yoğunluğu bağımsız olarak ve mantıksal olarak öncesinde beta dağıtımını bir şey yapan şey hakkında bir fikriniz olmalı. "

Yani yorumlarda "ab initio" fikri muhtemelen aradığım şeylere en yakın. Ben bir matematikçi değilim ama türetebileceğim matematiği kullanmakta kendimi çok rahat hissediyorum. Kökeni idare edebilecek benim için çok ileriyse, öyle olsun, ama değilse, anlamak istiyorum.


5
Ne türetildi? Binom-konjügat-önceki bir yaklaşım olarak kabul edilebilir değilse, çeşitli alternatifler burada (tek tip bir rastgele değişkenin örneğin sipariş istatistikleri, Gama değişken oranları).
GeoMatt22

3
Not: Beta dağıtımının tüm geçmişi, olası her ayrıntıyı içeren bu dağıtımdaki inanılmaz Wikipedia sayfasında sunulmaktadır !
Xi'an

1
Önceki soru tekrarı olarak işaretlendi diğer OP bir yorumda sonra ne açıklık sonrasında. whuber, @ Geomatt22'nin yaptığı gibi aynı soruyu sordu: "Bir türetme , kurulacak bir şeyle mantıklı bir bağlantı anlamına gelir. Ne varsaymak istersiniz ?"
Scortchi - Monica'yı eski durumuna döndürün

2
@Aksakal ama o zaman soru çok geniş - her türlü yoldan türetilebilir; eğer haklıysanız, soru olası cevaplar
kapmaktan

3
Küçük bir tarihsel bağlamın kısa bir tartışması burada (en azından eksik beta işleviyle ilişkisi açısından). Gama dağılımıyla bağlantıları vardır ve birçok başka dağıtımın yanı sıra birçok farklı şekilde oldukça makul bir şekilde ortaya çıkar; Xi'an'ın belirttiği gibi , Pearson sisteminde de tarihsel kökenleri var . Burada ne tür bir cevap arıyorsunuz? Ne verildi / ne türetilmelidir?
Glen_b-Monica

Yanıtlar:


6

Eski bir fizikçi olarak nasıl türetilebildiğini görebiliyorum. Fizikçiler böyle devam eder:

B(x,y)=01tx1(1t)y1dt
f(s|x,y)=sx1(1s)y101tx1(1t)y1dt=sx1(1s)y1B(x,y),
0<s<1

Bunu her zaman tüm integrallere o kadar sık ​​yaparlar ki, düşünmeden bile refleks olarak gerçekleşir. Bu prosedüre "normalleştirme" veya benzer adlar diyorlar. Nasıl Bildirim tanım gereği yoğunluk böyle her zaman pozitif olarak bunu istiyorum tüm özelliklere sahiptir ve birine ekler trivially.

f(t)

GÜNCELLEME

@ whuber'ın Beta dağıtımı hakkında neyin özel olduğunu sorurken yukarıdaki mantık sonsuz sayıda uygun integrale uygulanabilir (yukarıdaki cevabımda belirttiğim gibi)?

Özel kısım binom dağılımından gelir . PDF'sini parametreler ve değişkenler için normal gösterimi değil , beta sürümümle benzer gösterimi kullanarak yazacağım :

f(x,y|s)=(y+xx)sx(1s)y

Burada, - başarı ve başarısızlık sayısı ve - başarı olasılığı. Bunun Beta dağılımındaki payla nasıl çok benzediğini görebilirsiniz. Aslında, Binom dağıtımı için öncekine bakarsanız, Beta dağıtımı olacaktır. Ayrıca şaşırtıcı değildir, çünkü Beta etki alanı 0 ila 1'dir ve Bayes teoreminde yaptığınız şeydir: aşağıda gösterildiği gibi bu durumda başarı olasılığı olan parametresi üzerine entegre edin : burada - verilen başarı olasılığı (yoğunluğu) Beta dağıtımının önceki ayarları vex,yss

f^(x|X)=f(X|s)f(s)01f(X|s)f(s)ds,
f(s)f(X|s)- olasılık gözönüne alındığında bu veri kümesi (örneğin, gözlenen başarı ve başarısızlık) yoğunluğu .s

1
@ Xi'an OP tarihle ilgilenmiyor gibi görünüyor.
Aksakal

1
"Bu formülün kökenlerinin açıklaması ... hangi bağlamda geliştirilseydi" bana tarih gibi geliyor :-).
whuber

3
Aynı zamanda hem tarihle hem de ilklerle ilgilenebileceğine inanıyorum. :-) Cevabınız matematiksel olarak doğru olmasına rağmen, ne yazık ki çok genel: sonlu integral ile herhangi bir negatif olmayan fonksiyonun yoğunluğunu yapabilir. Peki, bu özel dağıtım ailesi hakkında bu kadar özel olan ne? Bu nedenle, yaklaşımınız her iki bakış açısını da tatmin edici görünmüyor.
whuber

2
@WillBradshaw, evet. Normalde, binom dağılımına olasılık ve deneme sayısı parametresi olarak verildiğinde başarısızlık (veya başarı) sayısının bir fonksiyonu olarak bakarız. Bu şekilde ayrı bir dağıtımdır . Ancak, parametre olarak başarı ve başarısızlık sayısı göz önüne alındığında olasılıkların bir işlevi olarak bakarsanız, yeniden ölçeklendirdiğinizde Beta dağılımı haline gelir, sürekli bir dağıtım, btw.
Aksakal

2
Beta dağılımı üzerinde Wikipedia makalesi Karl Pearson, hiç izleri aynen Şian @ tarafından önerdi. Stigler, İstatistik Tarihinde: Belirsizliğin Ölçülmesi 1900'den önce , modern gösterimi kullanarak Pearson'un türetilmesinin kısa bir açıklamasını verir.
whuber

15

resim açıklamasını buraya girin

Thomas Bayes (1763), Beta dağıtımını [bu adı kullanmadan] posterior dağılımın ilk örneği olarak türetmiştir, Leonhard Euler (1766) Glen_b tarafından birkaç yıl boyunca işaret edilen Beta integralindeki çalışmalardan önce gelmektedir , ancak integral de Faktör fonksiyonunu genelleştirmenin bir yolu olarak Euler (1729 veya 1738) [Opera Omnia, I14, 1 {24] bu nedenle normalleştirilen Beta sabiti Euler fonksiyonu olarak da adlandırılabilir . DaviesB(a,b)Wallis (1616-1703), Newton (1642-1726) ve Stirling'den (1692-1770) daha önce integralin özel durumlarıyla ilgilenenlerden bahseder. Karl Pearson (1895) ilk olarak bu dağıtım ailesini Pearson Tip I olarak kataloglamıştır .


Tarihsel olarak bu sırada görünmese de, Beta dağıtımına sezgisel bir giriş Fisher'in dağılımından yapılır, bu da oranının dağılımına karşılık gelir Burada varyans tahminleri için alışılmış gösterimleri bilerek kullandım iki varyansın eşitliğini test etmek için ortaya çıktı ve motive edildi. Sonra , tersine, eğer , yoğunluğunu bulmaF(p,q)

ϱ=σ^12/σ^22pσ^12χp2qσ^12χq2
pϱq+pϱB(p/2,q/2)
ωB(a,b)
ω/a(1ω)/bF(2a,2b)
B(a,b)dağıtım bu nedenle değişken adımın değişikliğidir: dağılımının yoğunluğundan başlayarak , ve değişkenini göz önünde bulundurarak çeviren Jacobian dönüşüm yoğunluğuna yol açar [burada tüm normalizasyon sabitleri, yoğunluğun bire entegre olmasını empoze ederek elde edilir.F(p,q)
fp,q(x){px/q}p/21(1+px/q)(p+q)/2
y={px/q}{1+px/q}y(0,1)
x=qyp(1y)
dxdy=qp(1y)+qyp(1y)2=pq(1y)2
g(y)yp/21(1y)q/2+1(1y)2=yp/21(1y)q/2+1

2
+1. K. Pearson'ın sadece Beta dağılımlarını "kataloglamadığını" belirtmek gerekir: bunları Binom için fark denklemleri ve Normal dağılım için diferansiyel denklemler arasında gözlemlediği bir ilişkiden esinlenen bir diferansiyel denklemler ailesinin çözümleriyle türetmiştir . Binom fark denkleminin hipergeometrik dağılıma genelleştirilmesi, çözümleri "Tip I" ve "Tip II" Beta dağılımlarını içeren diferansiyel denklemin genelleştirilmesini sağlamıştır. Bu tam olarak OP'nin aradığı ab initio türetme türüdür .
whuber

2
Bu cevabı inceleyerek çok şey öğrenebileceğimi düşünüyorum. Şu anda benim için çok gelişmiş, ama zamanım olduğunda geri döneceğim ve bahsettiğiniz konuları araştıracağım, sonra anlamaya çalışın. Çok teşekkürler. :)
Bradshaw

1

Her şeyden önce, kafamdaki kavramların matematiksel olarak kesin açıklamalarında iyi değilim, ancak basit bir örnek kullanarak elimden gelenin en iyisini yapacağım:

λ

λ=g(x)=λmax(q|xx0|)1q, q>0, 0λλmax
x0q=1/2

x0g(x)P(x0)=Cg(x)p1)P(λ)dλ=P(x0)dx0λ

P(λ)=P(g1(λ))|dg1(λ)dλ|=Cλp1(λmaxλ)q1

burada normalleştirme sabiti beta fonksiyonudur. Beta dağılımının standart parametrelendirilmesi için .Cλmax=1

Başka bir deyişle, beta dağılımı, oluklu bir dağılımın merkezindeki olasılıkların dağılımı olarak görülebilir.

Umarım bu türetme eğitmeninizin ne anlama geldiğine biraz daha yakın olur. ve ın fonksiyonel formlarının çok esnek olduğunu ve üçgen benzeri dağılımlardan ve U-şekilli dağılımlardan (aşağıdaki örneğe bakın) keskin bir şekilde doruğa ulaşan dağılımlara ulaştığını unutmayın.g(x)P(x0)

Bilginize: Bunu doktora çalışmamda bir yan etki olarak keşfettim ve tezimde sıfır şişirilmiş başak sayısı dağılımlarına (sıfır modlu bimodal) yol açan sabit olmayan nöral ayarlama eğrileri bağlamında rapor ettim. Yukarıda tarif edilen kavramı uygulamak, nöral aktivite için Beta-Poisson karışım dağılımını vermiştir. Bu dağıtım verilere uygun olabilir. Takılan parametreler , ters mantıkları uygulayarak hem dağıtım hem de titreşim dağılımını tahmin etmeyi sağlar . Beta-Poisson karışımı, aşırı dağılımın modellenmesi için yaygın olarak kullanılan negatif binom dağılımına (bir Gamma-Poisson karışımı olan) çok ilginç ve esnek bir alternatiftir. Aşağıda "Jitter " adlı bir örnek bulabilirsinizg(x)p(x0) Beta "- fikir iş başında:

Beta-Poisson sivri modeline giden bir titreşim modeli.

C : ( ) titreşim dağılımından alınan simüle edilmiş 1D deneme yer değiştirmesi . Deneme ortalamalı ateşleme alanı (koyu siyah çizgi) daha geniştir ve titreşim olmadan altta yatan ayarlama eğrisine kıyasla daha düşük bir pik hızına sahiptir (koyu mavi çizgi, kullanılan parametreler: . B : ortaya çıkan dağılımı de . N = 100 araştırmalarda ve beta dağılımı analitik pdf C : parametreler sahip bir Poisson işleminden Simüle başak sayısı dağılımı i çalışmaların indislerine belirtmektedir ve sonuçta ortaya çıkan Beta-Poisson dağılımı.P(jitter)g(x)p1λmax=10,p=.6,q=.5λ x 0 λ iλx0λiD : Aynı istatistiklere yol açan rastgele kaydırma açıları ile 2D'de benzer durum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.