Scipy'de beta dağıtım bağlantısı


14

Wikipedia'ya göre beta olasılık dağılımının iki şekil parametresi vardır: ve .βαβ

aralığındaki bir grup sayı scipy.stats.beta.fit(x)olan Python'u aradığımda 4 değer döndürülür. Bu bana tuhaf geliyor.x[0,1]

Google'dan sonra aradığımda üçüncü değişken 0 olduğu için dönüş değerlerinden birinin 'konum' olması gerektiğini buldum scipy.stats.beta.fit(x, floc=0).

Dördüncü değişkenin ne olduğunu bilen var mı ve ilk ikisi ve ?βαβ


1
Dokümantasyon son iki "konum" ve "ölçek" parametreleri çağırır. Böylece dördüncü ölçek parametresidir. Yer ve ölçek standart istatistiksel anlamlara sahiptir. Bu bağlamdaki bir yorum NIST el kitabında açıkça verilmiştir .
whuber

Ben de aynı sorunu yaşıyorum, ama nedense tüm beta modellerim "su tutma" eğilimindedir. Mesela stats.beta.fit([60,61,62,72])anladım (0.7313395126217731, 0.7153715263378897, 58.999999999999993, 3.3500998441036982). Bu konuda ne yapabileceğime dair bir fikrin var mı?
TheChymera

Sadece beta.fit () kullanarak bazı örnekler içeren genel sürekli rasgele değişken uyum yöntemi için bu belgeleri ekleyin: docs.scipy.org/doc/scipy/reference/generated/…
mathisfun

Yanıtlar:


13

Çıktısıyla ilgili belirgin bir dokümantasyon eksikliğine rağmen beta.fitçıktıyı aşağıdaki sırayla yapar:

αβ


Sadece veri aralığına göre alt ve üst sınırları tükürüyor mu yoksa başka bir şey yapıyor mu?
shadowtalker

Limitler olasılık dağılımına dayanmaktadır. yani. Normal dağılımın sınırı yoktur, ancak örnek veriler nadiren ~ değerini aşar +/-3. Beta dağılımının zor sınırları vardır ve bu sınırların dışında 0 olasılığı vardır. Neyi modellediğinize bağlı olarak verilerinizin sınırlara ulaşmaması muhtemeldir. Aslında, birçok beta dağılımı sınırlarda sıfır olasılıkla eğilim gösterdiğinden, bu sınırları veri aralığına uymaya zorlamak sorunlu olabilir. Bkz Bu yayını o konuda daha fazla bilgi için.
jdj081

1
Evet, farkındayım. Bu limitler her zaman 0 ve 1'dir. Bu nedenle: bu fonksiyon tarafından döndürülen üst ve alt limitler nelerdir ve bunlar "konum" ve "ölçek" ile nasıl aynıdır? Sanırım bu cevabı anlamıyorum.
shadowtalker

2
Beta dağılımının tanımlanma şekli, bu sınırlar her zaman 0 ve 1'dir. Ancak genelleştirilmiş beta dağılımı bu iki ölçeklendirme faktörünü içerir. Ben model veri 0 ile 1 arasında değil, bu yüzden bu sayıları kullanmak zorunda. Verileriniz 0 ile 1 arasındaysa, bu çıkışlar 0 ve 1'e çok yakın olmalıdır. Sınırlarınızın 0 ve 1 olduğunu biliyorsanız, floc=0ve fscale=1kwargs ile bunları zorlayabilirsiniz . Yine de bu çıktıları alacaksınız, ancak onları zorlamakla aynı şey olacaklar. Ve muhtemelen alfa ve beta değerlerinizi değiştirecektir.
jdj081
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.