Beta dağılımının ardındaki sezgi nedir?


438

Feragatname: Ben istatistikçi değil yazılım mühendisiyim. İstatistik konusundaki bilgilerimin çoğu öz-eğitimden geliyor, bu yüzden burada diğer insanlar için önemsiz görünebilecek kavramları anlamada hala birçok boşluk var. Bu yüzden cevaplar daha az spesifik terimler ve daha fazla açıklama içeriyorsa çok teşekkür ederim. Büyükannenle konuştuğunu hayal et :)

Ben kavramaya çalışıyorum doğayı ait beta dağılımı nasıl her durumda onu yorumlamak ne için kullanılması gerektiğini ve -. Normal dağılımdan bahsediyorsak, bir trenin varış zamanı olarak tanımlanabilir: en sık sık tam zamanında gelir, biraz daha az sıklıkta 1 dakika erken ya da 1 dakika geç kalır ve çok nadiren fark edilir Ortalamadan 20 dakika. Düzgün dağılım, özellikle, her bir biletin piyangodaki şansını açıklar. Binom dağılımı, yazı turaları vb. İle açıklanabilir. Ama böyle olduğu sezgisel açıklama ait beta dağılımı ?

Diyelim ki, ve . Bu durumda dağılımı şuna benzer: (R cinsinden):α=.99β=.5B(α,β)

görüntü tanımını buraya girin

Fakat bu aslında ne anlama geliyor? Y ekseni açıkça bir olasılık yoğunluğu, fakat X ekseninde ne var?

Bu örnekle veya başka herhangi bir açıklamada çok teşekkür ederim.


13
Y-ekseni bir olasılık değildir (tanımı gereği, bir ihtimal aralığı dışında yer çünkü açıktır, , fakat bu arsa kadar uzanır ve - ilke olarak - için ). Bir olasılık yoğunluğu : birimi başına bir olasılık (ve bir hız olarak tanımladınız ). 50 x x[0,1]50xx
whuber

4
@ whuber: evet, PDF'nin ne olduğunu biliyorum - bu benim tanımlamamdaki hataydı. Geçerli bir not için teşekkürler!
Arkadaş

1
Referansı bulmaya çalışacağım ancak genelleştirilmiş Beta dağılımı için daha tuhaf şekillerin bazılarının fiziği gibi uygulamalara sahip olduğunu . Ayrıca, verileri zayıf ortamlarda uzman verilere (min, mod, maks.) Sığdırabilir ve genellikle bir Üçgen dağılım (maalesef IE'ler tarafından kullanılan) kullanmaktan daha iyidir. a+(ba)Beta(α1,α2)
SecretAgentMan

Belli ki hiç bir zaman demiryolları şirketi Deutsche Bahn ile seyahat etmediniz. Daha az iyimser olurdun.
Nisanda henning

Yanıtlar:


621

Kısa versiyon, Beta dağılımının bir olasılık dağılımını temsil ettiği şeklinde anlaşılabilir - yani, o olasılığın ne olduğunu bilmediğimizde, olasılıkın tüm olası değerlerini temsil eder. İşte bu benim en sevdiğim sezgisel açıklamam:

Beyzbolu takip eden herkes vuruş ortalamalarına aşinadır - sadece bir oyuncunun kaç kez vuruş yapıp vuruşunu yaptığı bir vuruş yapması yeterlidir (bu yüzden 0ve arasında sadece bir yüzde 1). .266genel olarak ortalama bir vuruş ortalaması .300olarak kabul edilirken , mükemmel bir tane olarak kabul edilir.

Bir beyzbol oyuncumuz olduğunu ve sezon boyunca vuruş ortalamasının ne olacağını tahmin etmek istediğimizi hayal edin. Şu ana kadar vuruş ortalamasını kullanabileceğimizi söyleyebilirsiniz - ancak bu, sezon başlangıcında çok zayıf bir önlem olacak! Bir oyuncu bir kez vuruş 1.000yapıp bekar alırsa, vuruş ortalaması kısaca , eğer vurursa, vuruş ortalaması 0.000. Beş ya da altı kez atış yapıp gitmemeniz daha iyi olmaz - şanslı bir çizgi elde edersiniz ve ortalama 1.000, ya da şanssız bir çizgi çekebilir ve bunların ne kadarının 0uzaktan iyi bir tahmin edebileceği bir ortalama elde edemezsiniz. o sezon vuracaksın.

Neden ilk birkaç vuruşta vuruş ortalamanız nihai vuruş ortalamanızın iyi bir göstergesi değil? Bir oyuncunun ilk vuruşunu grevdeyken, neden kimse tüm sezon boyunca hiç vuruş yapmayacağını tahmin etmiyor? Çünkü önceden beklentilerle giriyoruz . Tarihte, bir sezondaki çoğu vuruş ortalamasının , her iki tarafta da nadir görülen bazı istisnalar dışında .215ve gibi şeyler arasında geçtiğini biliyoruz .360. Bir oyuncunun başlangıçta arka arkaya birkaç vuruş yapması durumunda, bunun ortalamadan biraz daha kötü olacağını gösterebileceğini biliyoruz, ancak muhtemelen o aralıktan sapmayacağını biliyoruz.

Bir ile temsil edilebilir bizim averaj problemi göz önüne alındığında binom dağılımı (başarı ve başarısızlıkların bir dizi), (biz istatistikte sadece dediğimiz Bu önceki beklentileri temsil etmenin en iyi yolu önce ), söylediğini distribution- Beta ile olan Oyuncunun ilk vuruşunu yaptığını görmeden önce, vuruş vuruşunun kabaca ortalamasını beklemekteyiz. Beta dağılımının alanı (0, 1)tıpkı bir olasılık gibi, bu yüzden zaten doğru yolda olduğumuzu biliyoruz - ancak Beta'nın bu görev için uygunluğu bunun ötesine geçiyor.

Oyuncunun sezonluk vuruş ortalamalarının büyük olasılıkla olacağını .27ancak makul bir .21seviyeye kadar değişebileceğini umuyoruz .35. Bu, ve parametreleriyle bir Beta dağılımı ile gösterilebilir :β = 219α=81β=219

curve(dbeta(x, 81, 219))

Beta (81, 219)

İki nedenden dolayı bu parametreleri buldum:

  • Ortalama:αα+β=8181+219=.270
  • Arsada gördüğünüz gibi, bu dağılım neredeyse tamamen içindedir (.2, .35)- vuruş ortalamaları için makul aralık.

X ekseninin bir beta dağılım yoğunluğu grafiğinde neyi temsil ettiğini sordunuz - burada vuruş ortalamasını temsil ediyor. Bu nedenle, bu durumda, sadece y ekseni değil bir olasılık (veya daha kesin olarak bir olasılık yoğunluğu) değil, x ekseninin de iyi olduğunu (vuruş ortalaması, sonuçta bir vuruş olasılığıdır)! Beta dağılımı bir olasılık dağılımını temsil etmektedir olasılıklar .

Fakat işte Beta dağılımının bu kadar uygun olmasının nedeni. Oyuncunun tek bir vuruş yaptığını hayal edin. Sezon için rekoru şimdi 1 hit; 1 at bat. O zaman olasılıklarımızı güncellemeliyiz - bu yeni eğrimizi yansıtmak için tüm eğriyi biraz değiştirmek istiyoruz. Bunu ispatlamanın matematiği biraz dahil olmakla birlikte ( burada gösteriliyor ), sonuç çok basit . Yeni Beta dağıtımı:

Beta(α0+hits,β0+misses)

ve nerede başladığımız parametreler, yani 81 ve . Bu durumda, 1 arttı (bir vuruş), hiç artmadı (henüz özlem yok) ). Bu, yeni dağıtımımızın veya:β 0 α β Beta ( 81 + 1 , 219 )α0β0αβBeta(81+1,219)

curve(dbeta(x, 82, 219))

görüntü tanımını buraya girin

Neredeyse hiç değişmediğine dikkat edin - değişiklik gerçekten çıplak gözle görünmez! (Çünkü bir vuruş gerçekten bir şey ifade etmiyor).

Bununla birlikte, oyuncu sezon boyunca ne kadar fazla vuruş yaparsa, eğri o kadar fazla kanıtı barındıracak şekilde kaydırılır ve daha fazla kanıtımız olduğu gerçeğine bağlı olarak daha fazla daralır. Diyelim ki sezonun yarısında 300 kez yarasa geçirdi, bu zamanların 100'ünü vurdu. Yeni dağıtım veya:Beta(81+100,219+200)

curve(dbeta(x, 81+100, 219+200))

görüntü tanımını buraya girin

Eğrinin artık hem daha ince hem de sağa kaydığına dikkat edin (daha yüksek vuruş ortalaması) eskiden olduğundan daha iyi - oyuncunun vuruş ortalamasının ne olduğunu daha iyi anlıyoruz.

Bu formülün en ilgi çekici çıktılarından biri, temelde yeni tahmininiz olan, elde edilen Beta dağılımının beklenen değeridir. Beta dağılımının beklenen değerinin olduğunu hatırlayın . Bu durumda, 300, 100 hit sonra gerçek en-sopaları, yeni beta dağılımı beklenen değer - bu naif tahminden daha düşük olduğunu fark ve , ancak tahmin daha yüksekse (sezonu ait 81+100αα+β10081+10081+100+219+200=.30381100100+200=.3338181+219=.270). Bu formülün bir oyuncunun isabet sayısı ve isabetsiz sayılarına bir "kafa başlangıcı" eklemekle eşdeğer olduğunu fark edebilirsiniz - "sezonda 81 isabet ve 219 isabetsiz vuruşla başla" ).

Böylece, Beta dağılımı olasılık dağılımını temsil etmek için en iyisidir olasılıkların - bir olasılık önceden ne olduğunu bilmiyorum durumda, ancak bazı makul tahmin var.


5
@ffriend: Yardımcı oldu mu sevindim- Beyzbolu takip edersin umarım (aksi halde bunun anlaşılabilir olup olmadığını merak ederim!)
David Robinson

11
John Cook'dan farklı sayıdaki yorumlarla ikili Amazon satıcı sıralamalarını kullanarak benzer bir örnek. Yorumlarda bir öncelik seçme tartışması özellikle aydınlatıcı: johndcook.com/blog/2011/09/27/bayesian-amazon/#comments
Dimitriy V. Masterov

4
Önceden beta dağıtılması gerekmediğine dikkat etmelisiniz ( önceki , - sadece olasılık beta dağıtılmalıdır)α0=β0=1/2
Neil G

4
+ Daha fazla veriniz olduğunda dağılımı nasıl güncelleyeceğinizin açıklanmasını seviyorum.
Mike Dunlavey,

2
Bunlar, istenen ortalama .27 ve vuruş ortalamaları için oldukça kabaca gerçekçi olan standart bir sapma verdi (yaklaşık .025). Bu arada, arzu edilen bir ortalama ve varyans a ve p hesaplanması için bir açıklama burada .
David Robinson,

48

Bir Beta dağılımı , 0 ila 1 gibi sınırlı bir aralıktaki şeyleri modellemek için kullanılır.

Örnekler, bir denemede başarı ve başarısızlık gibi sadece iki sonuca sahip olma olasılığıdır. Sınırlı sayıda deneme yaparsanız ve bazıları başarılı olursa, size bir beta dağıtımı ile neyin anlattığını temsil edebilirsiniz.

Başka bir örnek sipariş istatistikleridir . Örneğin, birden fazla (4 diyor) tekdüze 0,1 rasgele sayı üretip bunları sıralarsanız, 3. sıranın dağılımı nedir?

nss>1Beta(s+1,(ns)+1)

Bu konuda daha fazla ...


41

(0,1)

U1Unn(0,1)U(1)U(n)(U1,,Un)U1UnU ( n ) = en fazla ( U i ) U ( k )Beta ( k , n + 1 - k ) k = 1 , , nU(1)=min(Ui)U(n)=max(Ui)U(k)Beta(k,n+1k)k=1,,n

Bu sonuç, Beta dağılımlarının doğal olarak matematikte göründüğünü ve matematikte bazı ilginç uygulamalara sahip olduğunu göstermektedir.


28

İki temel motivasyon vardır:

İlk olarak, beta dağılımı Bernoulli dağılımından önce konjugattır. Bunun anlamı, tekrarlanan jeton çevirileriyle tahmin ettiğiniz bir madalyonun önyargısı gibi bilinmeyen bir olasılığınız varsa, o zaman bir jeton fişi dizisi tarafından bilinmeyen önyargıya bağlı olma olasılığının beta-dağıtılmış olmasıdır.

İkincisi, beta dağılımının üstel bir aile olmasının sonucu, bir dizi yeterli istatistik için maksimum entropi dağılımı olmasıdır. Beta dağıtımın durumda Bu istatistikler ve için de . Bu, eğer bir dizi örneği için bu yeterli istatistiklerin yalnızca ortalama ölçümünü tutarsanız, numunelerin dağılımı hakkında yapabileceğiniz minimum varsayımın beta dağıtılmış olduğu anlamına gelir.kütük ( 1)log(x)log(1x)x[0,1]x1,,xn

Beta dağıtımı genellikle [0,1] üzerindeki şeyleri modellemek için özel değildir, çünkü birçok dağıtım bu desteğe kesilebilir ve birçok durumda daha uygulanabilir.


23

görüntü tanımını buraya girin

Bazı e-ticaret sitelerinde bir satıcıya, 400'ü iyi, 100'ü kötü olan 500 derece aldığını varsayalım.

Bunu, 500 uzunluğuna sahip Bernoulli deneyi, 400 başarıya (1 = iyi) götürürken, bunun altında yatan olasılık bilinmediği için yaptığımız bir deney olarak düşünüyoruz .p

Satıcının reytingleri bakımından saf kalite% 80'dir çünkü 0.8 = 400 / 500. Ancak reytingler açısından "gerçek" kalite bilmiyoruz.

Teorik olarak, in "gerçek" kalitesine sahip bir satıcı da 400 değerinde 500 oyla sonuçlanmış olabilir.p=77%

Resimdeki sivri çubuk grafiği, verilen bir "doğru" varsayım için , 500 400'ün iyi olduğu bir simülasyonda ne sıklıkta gerçekleştiğini göstermektedir . Çubuk grafiği, simülasyon sonucunun histogramının yoğunluğudur.p

Ve görebileceğiniz gibi - ve (turuncu) için beta dağılımının yoğunluk eğrisi çubuk grafiğini sık sık çevreliyor (simülasyon için histogramın yoğunluğu).α=400+1β=100+1

Yani beta dağılımı esasen Bernoulli denemenin başarı olasılığıdır ihtimalini ifade denemenin sonucunun verilen.p

library(ggplot2)

# 90% positive of 10 ratings
o1 <- 9
o0 <- 1
M <- 100
N <- 100000

m <- sapply(0:M/M,function(prob)rbinom(N,o1+o0,prob))
v <- colSums(m==o1)
df_sim1 <- data.frame(p=rep(0:M/M,v))
df_beta1 <- data.frame(p=0:M/M, y=dbeta(0:M/M,o1+1,o0+1))

# 80% positive of 500 ratings
o1 <- 400
o0 <- 100
M <- 100
N <- 100000

m <- sapply(0:M/M,function(prob)rbinom(N,o1+o0,prob))
v <- colSums(m==o1)
df_sim2 <- data.frame(p=rep(0:M/M,v))
df_beta2 <- data.frame(p=0:M/M, y=dbeta(0:M/M,o1+1,o0+1))

ggplot(data=df_sim1,aes(p)) +
    scale_x_continuous(breaks=0:10/10) +

    geom_histogram(aes(y=..density..,fill=..density..),
        binwidth=0.01, origin=-.005, colour=I("gray")) +
    geom_line(data=df_beta1 ,aes(p,y),colour=I("red"),size=2,alpha=.5) +

    geom_histogram(data=df_sim2, aes(y=..density..,fill=..density..),
        binwidth=0.01, origin=-.005, colour=I("gray")) +
    geom_line(data=df_beta2,aes(p,y),colour=I("orange"),size=2,alpha=.5)

http://www.joyofdata.de/blog/an-intuitive-interpretation-of-the-beta-distribution/


3
Katkınız için teşekkürler! Yine de bir şey hakkında şaşkınım: histogram efsanesi beta yoğunluklarını gösterdiklerini belirtse de, bunların binom simülasyonlarının sonuçlarını (“bir simülasyonda ne sıklıkta gerçekleştiğini”) de açıkladığını iddia ediyor gibi görünüyorsunuz . Fakat ikisi de farklı şeyler, illüstrasyonda oldukça yakın görünmelerine rağmen. (Bu, Beta'nın büyük parametrelerle yakın normalliklerinin bir sonucu ve Binom dağılımları için Merkezi Limit teoremidir.)
whuber

Bu iyi bir nokta! Ama nasıl doğru bir şekilde yeniden ifade edeceğinden emin değilim. Eğer sadece histogramı çizersem, elbette, büyüklüğü verilen yoğunluğun çoğunu göremezsiniz. Yani evet, histogram aslında sanırım sadece küçültülmüş değil, aslında orijinal histogramın (tahmini) yoğunluğudur. Deneme sayısı göz önüne alındığında, bir faktörü çözebilir ve onu doğrusal olarak aşağıya ölçeklendirebilirim, ancak karşılaştırmak istediğim şeyin neredeyse tamamen aynı PLUS'a benzeyeceği, simülasyonun sonucunun yoğunluğuyla beta yoğunluğudur ( orijinal histogramın yoğunluğu).
Raffael

8

Şimdiye kadar cevapların üstünlüğü, örnek oranlar için bir öncek olarak üretilen Beta RV'lerinin gerekçesini kapsıyordu ve akıllı bir cevabın istatistik siparişi için Beta RV'leri ile ilgisi vardı.

Beta dağılımları ayrıca iki Gamma (k_i, 1) RVs, i = 1,2 olarak adlandırılan X ve Y arasındaki basit bir ilişkiden kaynaklanır. X / (X + Y) bir Beta dağılımına sahiptir.

Gamma RV'leri bağımsız etkinlikler için varış zamanlarını modellemede kendi mantığına zaten sahipler, bu yüzden sizin sorunuz olmadığı için bunu ele almayacağım. Ancak sırayla gerçekleştirilen iki görevden birini tamamlamak için harcanan "zamanın bir kısmı" doğal olarak bir Beta dağılımına yol açar.


1
+1 Beta dağılımı oluşturmak için Gama'yı kullandığınızı belirttiğiniz için teşekkür ederiz. Beta'yı bir Dirichlet'te genellemek istiyorsanız, sadece payda daha fazla Gamma koyduğunuzu duydum. Belki bir istatistikçi bunu bilir, ama bana göre, kategorik bir gözlemin güven aralıklarına bakarken çok faydalı oldu.
Mike Dunlavey

4

Sezgim, " " başarısının şu anki oranını ve " " başarısızlık oranını "tartıştığını" söylüyor : . Sabitin . başarıdır katkılarından dolayı bir "ağırlık" gibidir. başarısızlığı katkılarından dolayı bir "ağırlık" gibidir. Düşünmeniz ve anlamanız zorlaşan iki boyutlu bir parametre alanınız var (biri başarı katkısı için diğeri de başarısızlık katkısı için).( 1 - x ) f ( x ; α , β ) = sabit x α - 1 ( 1 - x ) β - 1 1 / B ( α , β ) αx(1x)f(x;α,β)=constantxα1(1x)β11/B(α,β)αβ


3

Alıntılanan örnekte, parametreler önceki yıla göre alfa = 81 ve beta = 219'dur [81 yarasalarda 300 çarptı ya da (81 ve 300 - 81 = 219)]

81 isabet ve 219 çıkışın önceki varsayımına ne dediklerini bilmiyorum ama İngilizce, bu ilkel bir varsayım.

Mevsim ilerledikçe, eğri sola veya sağa kayar ve modal olasılık sola veya sağa kayar ancak yine de bir eğri vardır.

Acaba Büyük Rakamların Laa'sının tutup tutmayacağını ve vuruş ortalamasını tekrar.

Genel olarak alfa ve beta miktarını tahmin etmek için, bir önceki olayların (yarasalardaki) tam sayısı, bilinen ortalama vuruş sayısı, toplam isabetleri (alfa), beta veya genel toplam eksi başarısızlıkları) ve işte elde eder. Formülün var. Ardından, ek verileri gösterildiği gibi çalıştırın.


2

Partikül büyüklüğü dağılımı ile çalışırken beta dağılımı çok faydalıdır. Tahıl dağılımını modellemek istediğinizde durum bu değildir; bu durumda sağa bağlı olmayan Tanh dağılımı kullanmak daha iyidir. F(X)=tanh((x/p)n)

Bu arada, mikroskobik bir gözlemden bir boyut dağılımı üretiyorsanız ve sayı olarak bir parçacık dağılımınız varsa ve amacınız bir hacim dağılımı ile çalışmak mı? Orijinal dağıtımın sağa bağlı sayıyla elde edilmesi neredeyse zorunludur. Dolayısıyla, dönüşüm daha tutarlıdır, çünkü yeni ses dağıtımında, çalıştığınız aralığın dışında medyan veya orta büyüklükte hiçbir mod görünmediğinden eminiz. Ayrıca, Grönland Afrika etkisinden uzak duruyorsun.

Düzenli şekillere, yani bir küreye veya bir prizmaya sahipseniz, dönüşüm çok kolaydır. Beta dağılımının alfa parametresine üç birim eklemeniz ve hacim dağılımını almanız gerekir.


1
Siteye Hoşgeldiniz. Bu OP'nin sorusuna bir cevap olarak mı tasarlandı? Bunun beta dağılımının arkasındaki sezgiyle ne kadar ilişkili olduğunu açıklayabilir misiniz?
gung

Beta dağıtımı hakkındaki sezgiyi netleştirmek için lütfen düzenleyin.
Glen_b

1

Beta dağıtımının arkasında NO sezgisi olmadığını düşünüyorum! Beta dağıtımı, FIX ürün yelpazesi ile sadece çok esnek bir dağıtımdır! Ve a ve b tamsayıları için uğraşması bile kolaydır. Ayrıca betaların birçok özel durumu, tek biçimli dağılım gibi kendi doğal anlamlarına sahiptir. Eğer verilerin bu şekilde modellenmesi gerekiyorsa veya biraz daha fazla esneklikte ise, beta çok iyi bir seçimdir.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.