N-gram modeller için şaşkınlık ve çapraz entropi


10

Çapraz entropi ve şaşkınlık arasındaki ilişkiyi anlamaya çalışmak. Model için genel olarak M , Şaşkınlık (M) 2 ^ entropi (M) = . Bu ilişki tüm farklı n-gramları, yani unigram, bigram vb.


Aslında şaşkınlığın tanımı budur ; Πi=1N1P(wi|w1,...wi1)Nşey ondan türetilmiştir;)
WavesWashSands

Yanıtlar:


9

Evet, şaşkınlık her zaman entropinin gücüne ikiye eşittir. Ne tür bir modeliniz olduğu, n-gram, unigram veya sinir ağınızın önemi yoktur.

İnsanların dil modellemesinin sadece entropi kullanmak yerine şaşkınlıktan hoşlanmasının birkaç nedeni vardır. Birincisi, üssü nedeniyle, şaşkınlıktaki iyileşmeler entropideki eşdeğer iyileşmeden daha önemliymiş gibi "hissetmek" tir. Bir diğeri, şaşkınlık kullanmaya başlamadan önce, bir dil modelinin karmaşıklığının, entropi olmaktan çok şaşkınlığa benzeyen basit bir dallanma faktörü ölçümü kullanılarak bildirilmesidir.


1

@Aaron cevabını hafif bir değişiklikle kabul etti:

Entropinin gücü her zaman ikiye eşit değildir. Aslında, entropinin gücüne (günlük için temel) olacaktır. Tabanı olarak e'yi kullandıysanız, e ^ entropi olur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.