Göreceli, normalleştirilmiş fayda işlevini pmf olarak ele alırken Shannon entropisinin veya Shannon bilgisinin yorumu nedir?


10

Diyelim ki , ayrı bir rastgele değişkenin birbirini dışlayan sonuçlarının bir kümesidir ve , , vb.Ωf0<f(ω)1Ωf(ω)=1

Tüm düzgün dağılmış ve a, olasılık yoğunluk fonksiyonu , Shannon entropi olup maximize ( ve bir elementin tüm kütlesine sahip olması durumunda, Shannon entropisi minimize edilir ( aslında ). Bu, sürpriz (veya belirsizlik azaltma ) ve sonuçlar ve belirsizlik (veya beklenen sürpriz ) ve rastgele değişkenler hakkındaki sezgilere karşılık gelir :fΩfH(Ω)=Ωf(ω)log1f(ω)=log|Ω|)Ωf0

  • Ne zaman eşit dağıtılır, belirsizlik maksimize edilir ve kütle düzgün dağılmış olması için daha fazla sonucu vardır, daha belirsiz öyleyiz.f
  • Ne zaman tüm kütlesi bir sonuca konsantre olmuştur, hiçbir belirsizlik var.f
  • Bir sonuca olasılık atadığımızda, gerçekte gözlemlediğimizde hiçbir bilgi kazanmıyoruz ("şaşırtıcı değil").1
  • Bir sonucu daha yakın ve daha yakın bir olasılık atadığımızda, bunun gerçekte gerçekleşen gözlemi gittikçe daha bilgilendirici olur ("şaşırtıcı").0

(Bu, elbette Shannon bilgisinin / entropisinin çok daha somut ama daha az epistemik kodlama yorumu hakkında hiçbir şey söylemez.)

Bununla birlikte, bir fayda fonksiyonunun yorumuna sahip olduğunda , veya mantıklı bir yorumu var mı? ? Bana öyle geliyor ki:l o g 1ff(ω)log1log1f(ω)f(ω)log1f(ω)

  • bir PMF olarak üzerinde eşit bir dağılımı temsil ediyorsa , bir faydalı fonksiyon olarak , daha büyük olamayacak sonuçlar üzerindeki kayıtsızlığa karşılık gelir *Ω ffΩf
  • bir sonucun tüm faydaya ve geri kalanının hiçbirine sahip olmadığı bir fayda fonksiyonu (olabildiğince bir faydaya çarpık olarak) çok güçlü göreceli tercihlere karşılık gelir - kayıtsızlık eksikliği.

Bu konuda genişleyen bir referans var mı? Olasılık kütle fonksiyonlarının ve normalize edilmiş göreceli yardımcı programların ayrık rasgele değişkenler üzerinden karşılaştırılmasındaki sınırlamalar hakkında bir şey kaçırdım mı?

* Kayıtsızlık eğrilerinin farkındayım ve kategorik bir örnek alana odaklanmamdan ve kendiliğinden 'kayıtsızlıkla' ilgilenmiyorum olmasından başlayarak, çeşitli nedenlerle sorumla nasıl alakalı olabileceğini görmüyorum, daha ziyade, yardımcı programların olasılıklar olarak nasıl yorumlanacağı ve söz konusu (ayrık) 'olasılık dağılımı' fiilen veya (ek olarak) bir fayda fonksiyonunun yorumlanmasına sahip olduğunda, olasılıklar üzerindeki fonksiyonellerin nasıl yorumlanacağı.


Cevabım yok, ama sorunuz bana adil kek kesme probleminde entropi kullanmayı düşündürüyor: en.wikipedia.org/wiki/Fair_cake-cutting Standart model pastanın bir aralık olmasıdır [0, 1] ve aralıkta farklı normalize edilmiş değer ölçümlerine sahip ajan vardır . Önlemlerin atomik olmadığı varsayılır, ancak "entropileri" hakkında başka bir varsayım yoktur. Fayda fonksiyonlarının entropiyi sınırladığı kek kesme problemleri hakkında ne söyleyebileceğimizi düşünmek ilginç olabilir. n
Erel Segal-Halevi

Yanıtlar:


3

Tartışmadan önce Shannon'ın entropisi, tartışılması gereken başka bir nokta daha vardır: görünüşe göre sıradan ziyade kardinal fayda var .

Her iki durumda da "normalleştirilmiş" fayda fonksiyonları türetilebilir. Ancak "göreceli tercih" kavramı sadece kardinal fayda bağlamında tanımlanabilir ve ölçülebilir.

Ve sorun, tanımladığınız iki uçta değil, tüm olası ara durumlarda ortaya çıkar.

Basit bir örnek: olmak üzere üç "sonuç" olduğunu varsayalım (örneğin, tüketim seviyeleri veya her biri bir miktar üç farklı mal). Yardımcı program işleviniz onlara değerler atandıA,B,C

V(A)=1,V(B)=9,V(C)=90

Ordinal fayda altında, bu bize sadece

A<prB<prC

Elbette bunları elde etmek için bölerek normalleştirebiliriz.100

ve üç sonucun sıralaması korunur

UV(A)=0.01,UV(B)=0.09,UV(C)=0.9

Ancak sıralı yarar altında, atayabilecek başka bir yardımcı program işlevini çok iyi kullanabiliriz

W(A)=31,W(B)=32,W(C)=37

ve elde et

UW(A)=0.31,UW(B)=0.32,UW(C)=0.37

VW

WV

Kardinal fayda ile ilgili sorunları biliyor musunuz?


VU

3

Diğer cevabımda OP ile değiş tokuş ettikten sonra, biraz yaklaşımı ile çalışalım.

XX={x1,...,xk}Pr(X=xi)=pi,i=1,...,k

desteğindeki değerler aynı zamanda gerçek değerli bir kardinal fayda fonksiyonundaki girdilerdir , . Daha sonra normalleştirilmiş fayda fonksiyonunu dikkate alıyoruzu ( x i ) > 0Xu(xi)>0i

(1)w(X):w(xi)=u(xi)i=1ku(xi),i=1,...,k

ve bize söylendi

(2)w(xi)=pi

Sadece sonlu alanın normalize edilmiş negatif olmayan bir ayrık fonksiyonunun, genel olarak bir olasılık kütle fonksiyonunun özelliklerini karşıladığını gözlemlemiyoruz - özellikle 'nin rastgele fonksiyonel formuna sahip olduğunu varsayıyoruz. değerleri girdi olarak alan değişken .w(xi)w(xi)

Yana bir rastgele değişkenin bir ölçülebilir fonksiyon, bu da, rasgele bir değişkendir. Dolayısıyla, beklenen değeri gibi şeyleri anlamlı bir şekilde düşünebiliriz. Bilinçsiz İstatistikçi Yasası'nı kullanarakw(xi)

(3)E[w(X)]=i=1kpiw(xi)=i=1kpi2

Bu dışbükey bir işlevdir ve bunu kısıtı altında 'nin üzerinde aşırılaştırmaya çalışırsak kolayca elde ederizpii=1kpi=1

(4)argminE[w(X)]=p:p1=p2=...=pk=1/k

ve genel bir sonuç elde ettik:

Yukarıda tanımlandığı gibi normalleştirilmiş faydalı fonksiyon, dağılımı Tekdüze olduğunda beklenen minimum değere sahiptir .X

Açıkçası böyle bir durumda sabit bir fonksiyon , ve sıfır varyans ile dejenere rastgele bir değişken olacaktır .E [ w ( X ) ] = 1 / kw(X) E[w(X)]=1/k

OP'nin odağı olan Shannon'ın Entropisine dönelim. Hesaplamak için, Shannon'ın Entropy'sinin rastgele değişkenin olasılık kütle fonksiyonuna ihtiyacı var ... bu yüzden rastgele değişkenin PMF'sini bulmalıyız ... w(X)

Ama benim izlenimim bu OP'nin aklında olan şey değil. Aksine, Shannon'ın Entropisini, arzu edilen bazı cebirsel özelliklere sahip olan ve belki de ilgi çekici bir şeyi kompakt bir şekilde ölçebilen bir metrik olarak görür.

Bu daha önce İktisatta, özellikle Endüstriyel Organizasyonda, Pazar Konsantrasyonu Endeksleri ("bir pazarın rekabet derecesi / tekelci yapısı") oluşturulmuştu. Burada özellikle alakalı görünen iki tane not ediyorum.

A) Herfindahl Endeksi, bağımsız değişkenler olarak pazar paylarını sahiptir pazar, faaliyet gösteren şirketlerin onlar inşaat tarafından birlik toplamı böylece. Ölçeklendirilmemiş sürümüs bennsi

H=i=1nsi2

bu yukarıda beklenen ' un beklenen değeri ile tam olarak aynı yapıya sahip bir ifadedir .w(X)

B) Entropi Endeksi Shannon Entropi ile kesin matematiksel formuna sahip olduğu.

Re=i=1nsilnsi

Encaoua, D. ve Jacquemin, A. (1980). Tekel derecesi, konsantrasyon endeksleri ve giriş tehdidi. Uluslararası Ekonomik İnceleme, 87-105. "izin verilebilir" konsantrasyon indekslerinin aksiyomatik bir türevini sağlarlar, yani böyle bir indeksin sahip olması gereken özellikleri tanımlarlar. Yaklaşımları soyut olduğu için, OP'nin anlamayı araştırmak ve eklemek istediği şey için yararlı olabileceğine inanıyorum.


1

Fayda işlevi burada sadece kardinal değil, aynı zamanda bir oran ölçeğinde tanımlanmıştır. 1/4 ve 3/4 yardımcı programları ile iki sonucu düşünün. Açıkçası, afin dönüşümünü uygulayabiliriz: bu durumda yardımcı programlar 0 ve 1 olur. Ancak, şimdi entropiyi kesinlikle pozitif bir değerden sıfıra değiştirdik!v=v20.5

Bu nedenle, önce hizmet programınıza anlamlı bir oran ölçeği sağlamanız gerekir. Bunu yapmanın bir yolu doğal 0 kullanım seviyesine bir yorum vermektir. Bu şartname olmadan entropi anlamsızdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.