Bir olasılık dağılımı için Huffman kod en az ağırlıklı ortalama kod sözcüğü uzunluğuna sahip önek kodu , uzunluğu inci codword. Huffman kodunun sembol başına ortalama uzunluğunun ve arasında olduğu bilinen bir teoremdir , burada Shannon entropisidir. olasılık dağılımının.
Ortalama uzunluğun Shannon entropisini neredeyse 1'e geçtiği kanonik kötü örnek, entropinin neredeyse 0 olduğu ve ortalama kod sözcüğü uzunluğunun 1 olduğu gibi bir olasılık dağılımıdır entropi ve neredeyse olan codeword uzunluğu arasında bir boşluk .
Peki, olasılık dağılımındaki en büyük olasılık üzerinde bir sınır varsa ne olur? Örneğin, tüm olasılıkların değerinden daha az olduğunu varsayalım . Bu durumda bulabileceğim en büyük boşluk , entropinin 1'den biraz daha fazla olduğu ve ortalama kod sözcüğü uzunluğunun 1.5'ten biraz daha az olduğu, gibi bir olasılık dağılımı içindir boşluk yaklaşıyor . Yapabileceğin en iyi şey bu mu? Bu dava için kesinlikle 1'den daha az olan boşluğa bir üst sınır verebilir misiniz?
Şimdi, tüm olasılıkların çok küçük olduğu durumu düşünelim. Her biri olasılık olan harfleri üzerinde bir olasılık dağılımı seçtiğinizi varsayalım . Bu durumda, en büyük boşluk seçerseniz oluşur . Burada, civarında bir boşluk elde Tüm olasılıkların küçük olduğu durumlarda yapabileceğiniz en iyi şey bu mu?
Bu soru, bu TCS Stackexchange sorusundan ilham aldı .