Kısa versiyon, Beta dağılımının bir olasılık dağılımını temsil ettiği şeklinde anlaşılabilir - yani, o olasılığın ne olduğunu bilmediğimizde, olasılıkın tüm olası değerlerini temsil eder. İşte bu benim en sevdiğim sezgisel açıklamam:
Beyzbolu takip eden herkes vuruş ortalamalarına aşinadır - sadece bir oyuncunun kaç kez vuruş yapıp vuruşunu yaptığı bir vuruş yapması yeterlidir (bu yüzden 0
ve arasında sadece bir yüzde 1
). .266
genel olarak ortalama bir vuruş ortalaması .300
olarak kabul edilirken , mükemmel bir tane olarak kabul edilir.
Bir beyzbol oyuncumuz olduğunu ve sezon boyunca vuruş ortalamasının ne olacağını tahmin etmek istediğimizi hayal edin. Şu ana kadar vuruş ortalamasını kullanabileceğimizi söyleyebilirsiniz - ancak bu, sezon başlangıcında çok zayıf bir önlem olacak! Bir oyuncu bir kez vuruş 1.000
yapıp bekar alırsa, vuruş ortalaması kısaca , eğer vurursa, vuruş ortalaması 0.000
. Beş ya da altı kez atış yapıp gitmemeniz daha iyi olmaz - şanslı bir çizgi elde edersiniz ve ortalama 1.000
, ya da şanssız bir çizgi çekebilir ve bunların ne kadarının 0
uzaktan iyi bir tahmin edebileceği bir ortalama elde edemezsiniz. o sezon vuracaksın.
Neden ilk birkaç vuruşta vuruş ortalamanız nihai vuruş ortalamanızın iyi bir göstergesi değil? Bir oyuncunun ilk vuruşunu grevdeyken, neden kimse tüm sezon boyunca hiç vuruş yapmayacağını tahmin etmiyor? Çünkü önceden beklentilerle giriyoruz . Tarihte, bir sezondaki çoğu vuruş ortalamasının , her iki tarafta da nadir görülen bazı istisnalar dışında .215
ve gibi şeyler arasında geçtiğini biliyoruz .360
. Bir oyuncunun başlangıçta arka arkaya birkaç vuruş yapması durumunda, bunun ortalamadan biraz daha kötü olacağını gösterebileceğini biliyoruz, ancak muhtemelen o aralıktan sapmayacağını biliyoruz.
Bir ile temsil edilebilir bizim averaj problemi göz önüne alındığında binom dağılımı (başarı ve başarısızlıkların bir dizi), (biz istatistikte sadece dediğimiz Bu önceki beklentileri temsil etmenin en iyi yolu önce ), söylediğini distribution- Beta ile olan Oyuncunun ilk vuruşunu yaptığını görmeden önce, vuruş vuruşunun kabaca ortalamasını beklemekteyiz. Beta dağılımının alanı (0, 1)
tıpkı bir olasılık gibi, bu yüzden zaten doğru yolda olduğumuzu biliyoruz - ancak Beta'nın bu görev için uygunluğu bunun ötesine geçiyor.
Oyuncunun sezonluk vuruş ortalamalarının büyük olasılıkla olacağını .27
ancak makul bir .21
seviyeye kadar değişebileceğini umuyoruz .35
. Bu, ve parametreleriyle bir Beta dağılımı ile gösterilebilir :β = 219α=81β=219
curve(dbeta(x, 81, 219))
İki nedenden dolayı bu parametreleri buldum:
- Ortalama:αα+β=8181+219=.270
- Arsada gördüğünüz gibi, bu dağılım neredeyse tamamen içindedir
(.2, .35)
- vuruş ortalamaları için makul aralık.
X ekseninin bir beta dağılım yoğunluğu grafiğinde neyi temsil ettiğini sordunuz - burada vuruş ortalamasını temsil ediyor. Bu nedenle, bu durumda, sadece y ekseni değil bir olasılık (veya daha kesin olarak bir olasılık yoğunluğu) değil, x ekseninin de iyi olduğunu (vuruş ortalaması, sonuçta bir vuruş olasılığıdır)! Beta dağılımı bir olasılık dağılımını temsil etmektedir olasılıklar .
Fakat işte Beta dağılımının bu kadar uygun olmasının nedeni. Oyuncunun tek bir vuruş yaptığını hayal edin. Sezon için rekoru şimdi 1 hit; 1 at bat
. O zaman olasılıklarımızı güncellemeliyiz - bu yeni eğrimizi yansıtmak için tüm eğriyi biraz değiştirmek istiyoruz. Bunu ispatlamanın matematiği biraz dahil olmakla birlikte ( burada gösteriliyor ), sonuç çok basit . Yeni Beta dağıtımı:
Beta(α0+hits,β0+misses)
ve nerede başladığımız parametreler, yani 81 ve . Bu durumda, 1 arttı (bir vuruş), hiç artmadı (henüz özlem yok) ). Bu, yeni dağıtımımızın veya:β 0 α β Beta ( 81 + 1 , 219 )α0β0αβBeta(81+1,219)
curve(dbeta(x, 82, 219))
Neredeyse hiç değişmediğine dikkat edin - değişiklik gerçekten çıplak gözle görünmez! (Çünkü bir vuruş gerçekten bir şey ifade etmiyor).
Bununla birlikte, oyuncu sezon boyunca ne kadar fazla vuruş yaparsa, eğri o kadar fazla kanıtı barındıracak şekilde kaydırılır ve daha fazla kanıtımız olduğu gerçeğine bağlı olarak daha fazla daralır. Diyelim ki sezonun yarısında 300 kez yarasa geçirdi, bu zamanların 100'ünü vurdu. Yeni dağıtım veya:Beta(81+100,219+200)
curve(dbeta(x, 81+100, 219+200))
Eğrinin artık hem daha ince hem de sağa kaydığına dikkat edin (daha yüksek vuruş ortalaması) eskiden olduğundan daha iyi - oyuncunun vuruş ortalamasının ne olduğunu daha iyi anlıyoruz.
Bu formülün en ilgi çekici çıktılarından biri, temelde yeni tahmininiz olan, elde edilen Beta dağılımının beklenen değeridir. Beta dağılımının beklenen değerinin olduğunu hatırlayın . Bu durumda, 300, 100 hit sonra gerçek en-sopaları, yeni beta dağılımı beklenen değer - bu naif tahminden daha düşük olduğunu fark ve , ancak tahmin daha yüksekse (sezonu ait 81+100αα+β10081+10081+100+219+200=.30381100100+200=.3338181+219=.270). Bu formülün bir oyuncunun isabet sayısı ve isabetsiz sayılarına bir "kafa başlangıcı" eklemekle eşdeğer olduğunu fark edebilirsiniz - "sezonda 81 isabet ve 219 isabetsiz vuruşla başla" ).
Böylece, Beta dağılımı olasılık dağılımını temsil etmek için en iyisidir olasılıkların - bir olasılık önceden ne olduğunu bilmiyorum durumda, ancak bazı makul tahmin var.