Wikipedia'ya göre :
Shannon'un entropisi, bir mesajda yer alan bilgileri, mesajın belirlenen (veya tahmin edilebilir) kısmının aksine ölçmektedir. İkincisinin örnekleri, dil yapısındaki fazlalığı veya harf veya kelime çiftlerinin, üçüzlerin ve benzerlerinin oluşum sıklıklarına ilişkin istatistiksel özellikleri içerir.
Bu yüzden entropi bir mesajda yer alan bilgi miktarının bir ölçüsüdür. Entropi kodlayıcıları, kayıpsız bir şekilde böyle bir mesajı, onu temsil etmek için gereken minimum bit sayısına sıkıştırmak için kullanılır (entropi). Bana göre bu, mükemmel bir entropi kodlayıcısı bir mesajı mümkün olduğunca kayıpsız şekilde sıkıştırmak için gerekli olan tek şey olabilir.
Ancak birçok sıkıştırma algoritması, mesajın entropisini azaltmak için entropi kodlamadan önce adımları kullanır.
Almanca'ya göre Vikipedi
Entropiekodierer, Kodierern kombiniert firmasında bir araya geldi. Dabei dienen vorgeschaltete Verfahren dazu, Entropie der Daten zu verringern.
İngilizcede:
Entropi kodlayıcıları sıklıkla diğer kodlayıcılarla birleştirilir. Önceki adımlar verilerin entropisini azaltmaya yarar.
yani bzip2, Entropy kodlamasını uygulamadan önce Burrows-Wheeler-Transform'u ve ardından Bir Öne Taşı özelliğini kullanır (bu durumda Huffman kodlaması).
Bu adımlar mesajın entropisini gerçekten azaltıyor mu, bu mesajda yer alan bilgilerin miktarını azaltmak anlamına mı geliyor? Bu bana çelişkili görünüyor çünkü bu, bilgilerin sıkıştırma sırasında kaybedilmesi ve kayıpsız dekompresyonun önlenmesi anlamına geleceği anlamına geliyor. Yoksa entropi kodlama algoritmasının etkinliğini artırmak için mesajı sadece dönüştürüyorlar mı? Yoksa entropi doğrudan mesajdaki bilgi miktarına karşılık gelmiyor mu?