“Ampirik entropi” terimini kim icat etti?


9

Shannon'ın entropi ile çalışmasını biliyorum, ancak son zamanlarda ampirik entropinin sıklıkla depolama analizinin bir parçası olarak kullanıldığı özlü veri yapıları üzerinde çalıştım .

Shannon, ayrı bir bilgi kaynağı tarafından üretilen bilgilerin entropisini i=1kpilogpi, nerede pi olayın olasılığı i örneğin belirli bir karakter üretilir ve k olası olaylar.

MCH'nin yorumlarda belirttiği gibi, ampirik entropi bu olayların ampirik dağılımının entropisidir ve bu nedenlei=1kninlognin nerede ni olayın gözlenen olaylarının sayısıdır i ve ntoplam gözlemlenen olay sayısıdır. Buna sıfırıncı dereceden ampirik entropi denir . Shannon'ın koşullu entropi kavramı benzer yüksek dereceli ampirik versiyona sahiptir.

Shannon, ampirik entropi terimini kullanmadı, ancak bu kavram için kesinlikle bir miktar krediyi hak ediyor. Bu fikri ilk kim kullanmış ve ilk olarak (çok mantıklı) ampirik entropiyi tanımlamak için kim kullanmıştır ?


"Her bir dize için noktadan tanımlanmış" kulağa Kolmogorov karmaşıklığı gibi geliyor: bahsettiğiniz şey bu mu? Değilse, onu tanımlayan bir bağlantıya işaret edebilir misiniz, yoksa sorunun kendisinde hala bir defn sağlayabilir misiniz?
Suresh Venkat

1
Buna denir çünkü ampirik entropi, bir dizinin ampirik dağılımının entropisidir.
Mehdi Cheraghchi

@SureshVenkat Soruyu ayrıntılandırmaya çalıştım.
silinen kullanıcı 42

1
Kosaraju S. Rao'ya bakın, Manzini G., "Düşük entropi dizelerinin Lempel-Ziv algoritmaları ile sıkıştırılması" (1998) da. Lempel-Ziv algoritmalarının performansını " ampirik entropi " denilen analizi kullanarak analiz ederler .
Marzio De Biasi

2
"Ampirik dağılımın" belirli bir frekans sayımı seti için ML dağılımı olduğunu unutmayın. Acaba bu Bayes'e mi dayanıyor? Laplace bile deneysel sayımlardan bir dağılım tanımlama sorununu düşünmüştü.
Suresh Venkat

Yanıtlar:


3

Senin gibi "ampirik entropi" ile ilgileniyorum ve bulduğum en eski kağıt Kosaraju kullanıcı gibi "Marzio De Biasi" yaptığı açıklamada söyledi.

Ancak bence "ampirik entropinin" gerçek tanımları daha sonra eski kavramların genelleştirilmesiyle yapılır:

  1. "Büyük Alfabeler ve Sıkıştırılamaz" yazan Travis Gagie (2008)
  2. Paul Emp Vitányi tarafından "Emprik entropi" (2011)

Gagie tanımını tanımı kemir ampirik entropisi:

  • Hk(w)=1|w|minQ{log1P(Q=w)}

burada a, dereceden Markov işlemi inci. Ayrıca bu tanımın öncekine eşdeğer olduğunu gösterdi. Vitányi'nin bir sonraki adımı, rasgele süreç sınıflarına genelleme idi (sadece Markov süreçleri değil):Qk

  • H(w|X)=minX{K(X)+H(X):|H(X)log1P(X=w)|isminimal!}

burada izin verilen süreçlerin sınıfı ve Kolmogorov karmaşıklığıdır. Biz seçerseniz sınıfı olmak emri Markov inci dizisi üreten süreçlerrastgele değişkenler ve Kolmogorov karmaşıklığını görmezden gelmek, bundan daha fazla Gagie tanımına yol açar ( ile çarpılır ).XK(X)
Xk|w||w|

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.