Log olasılığı, olasılıkların çarpımı


17

Buna göre wikipedia makalesinde , tek olasılıkların ürünü temsil edebilir x⋅yolarak -log(x) - log(y)sayısal olarak daha optimal olan hesaplamasını yaparak. Ama bir örnek denerseniz şunu söyleyin:

p1 = 0.5
p2 = 0.5
p1 * p2 = 0.25
-log(p1) - log(p2) = 2

p3 = 0.1
p4 = 0.1
p3 * p4 = 0.01
-log(p3) - log(p4) = 6.64

Olasılıklar ait ürün p1ve p2ardından bir yüksek p3ve p4ancak günlük olasılığı daha düşüktür.

Nasıl olur?


2
Sorun nedir? Daha küçük olasılıkları olacak daha büyük değerler, elde gelen artışları 0 p = 1 doğru olarak p 0 . logp0p=1p0
Dilip Sarwate

5
(+1) Neden düşük oy? Bence bu konu çok temel olsa da iyi yazılmış bir konu.
Juho Kokkala

@DilipSarwate sorunum matematik bölümü ile değil, olasılıkları temsil etmenin bu özel yoludur. Belki bu sadece onunla rahat olma meselesidir.
spacemonkey

Yanıtlar:


22

Makalenin niyetini yanlış anladığınızdan korkuyorum. Biraz belirsiz yazılmış olduğu için bu büyük bir sürpriz değil. İki farklı şey oluyor.

Birincisi, günlük ölçeğinde çalışmaktır.

pAB=pApBlog(pAB)=log(pA)+log(pB)". If you need the actual probability, you can exponentiate at the end to get back pAB: pAB=elog(pA)+log(pB), but if needed at all, the exponentiation would normally be left to the last possible step. So far so good.

The second part is replacing logp with logp. This is so that we work with positive values.

Personally, I don't really see much value in this, especially since it reverses the direction of any ordering (log is monotonic increasing, so if p1<p2, then log(pA)<log(p2); this order is reversed with logp).

This reversal seems to concern you, but it's a direct consequence of the negation - it should happen with negative log probabilities. Think of negative log probability as a scale of "rarity" - the larger the number, the rarer the event is (the article refers to it as 'surprise value', or surprisal, which is another way to think about it). If you don't like that reversal, work with logp instead.

To convert negative-log-probabilities back to probabilities, you must negate before exponentiating. If we say si=log(pi) (s for 'surprise value'), then pAB=e[sA+sB]. As you see, that reverses direction a second time, giving us back what we need.


2
+1 "Think of negative log probability as a scale of "rarity" - the larger the number, the rarer the event is"
Zhubarb
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.