Kodlama gereksinimi olması önek ücretsiz nedeniyle tam olmak zorunda ağacına büyük ağaçların sonuçlanır. Sabit uzunlukta kodlanmamış veri depolamanın verileri kodlamaktan daha verimli olacağı bir eşik var mı?
Kodlama gereksinimi olması önek ücretsiz nedeniyle tam olmak zorunda ağacına büyük ağaçların sonuçlanır. Sabit uzunlukta kodlanmamış veri depolamanın verileri kodlamaktan daha verimli olacağı bir eşik var mı?
Yanıtlar:
H(A)
Bu problemin entropisi 1.998
. Bu sorun için hem Huffman kodlaması hem de sabit uzunluklu kodlama, ort 2
. Ve FYI, Huffman Encoding kullanarak aldığınız kodlama yanlış. Huffman Encoding ayrıca bu sorun için sabit uzunluğa benzer kodlar üretir. Açgözlü bir yaklaşım kullanır. Yani a
bir kod almaz 0
ama onun yerine alır 00
. Huffman Kodlamasını kullanarak oluşturduğunuz ağaç üzerinde yeniden çalışın. Alacağınız ağaç:
Huffman kodlaması, nüfus dağılımını iki olasılık gücüyle yaklaşık olarak tahmin eder. Gerçek dağılım iki olasılıktan oluşan güçlerden oluşuyorsa (ve giriş sembolleri tamamen ilişkisizse), Huffman kodlaması en uygunudur. Değilse, aralık kodlamasıyla daha iyisini yapabilirsiniz. Bununla birlikte, girişteki belirli sembollere belirli bit kümeleri atayan tüm kodlamalar arasında en uygunudur.
Evet, her zaman en uygunudur.
Hayır, sabit uzunluklu kodlanmamış verileri kullanmak için daha az yer kullanacağı bir eşik yoktur.
Web'de birkaç kanıt buldum, ancak Wikipedia makalesinde Huffman kodlamasında yeterli tartışma var .
Bu aynı zamanda daha yüksek sıkıştırma sağlayan diğer teknikleri de kapsar (Huffman kodunun en uygun olduğu alanın dışında çalışma).