İlgili Sınır


21

Eğer f o zaman bir konveks fonksiyonu Jensen eşitsizliği devletler f(E[x])E[f(x)] ve gerekli değişiklikler yapılmış olarak f içbükeydir. Açıkça en kötü durumda üst bağlı olamaz E[f(x)] cinsinden f(E[x]) dışbükey için f , ama orada bu yönde gider bağlanmış fdışbükey ama "çok dışbükey" değil mi? dışbükey işlevinde şartlar sağlayan bazı standart bir sınır var mı f(ve eğer gerekliyse muhtemelen dağıtımı da), E[f(x)]φ(f)f(E[x]) , burada φ(f) dışbükey eğriliği / derece bir fonksiyonudur f ? Belki de bir Lipschitz durumuna benzer bir şey?


Konu dışı olarak kapatmak için oy kullanma. math.stackexchange.com belki de?
Aryabhata

7
Bu sorunun açık kalması gerektiğini düşünüyorum; bu, birçok çalışma teorisyeninin düzenli olarak yararlı bulacağı bir tür eşitsizliktir.
Aaron Roth

10
Bunun şimdiye kadar gönderilen soruların çoğundan daha matematiğe daha yakın olduğunu biliyorum, ancak rastgele algoritmaların analizinde sık sık rastlandığım için bu konunun açık olduğunu iddia ediyorum. Zihin). Bilgisayar biliminde yoğun olarak kullanılan matematiğin sorular için adil bir oyun olarak kabul edilmesi gerektiğini düşünüyorum.
Ian

6
açık tutmak için oy verin. kesinlikle konuyla ilgili
Suresh Venkat

1
Ayrıca açık kalmak için oy kullanırım.
Jeffε

Yanıtlar:


21

EDIT: orijinal sürüm mutlak bir değeri kaçırdı. üzgünüm!!

Selam Ian. Kısaca, biri Lipschitz bağımlı, diğeri ikinci türevdeki bir bağ kullanan iki örnek eşitsizliğini özetleyeceğim ve daha sonra bu problemdeki bazı zorlukları tartışacağım. Gereksiz olmakla birlikte, bir türev kullanan bir yaklaşım, daha fazla türevle (Taylor yoluyla) neler olduğunu açıkladığından, ikinci türev versiyonunun oldukça iyi olduğu ortaya çıktı.

Birincisi, bir Lipschitz ciltli: basitçe standart Jensen eşitsizliğini yeniden çalışın. Aynı numara geçerlidir: Taylor genişlemesini beklenen değerde hesapla.

Spesifik olarak, Let karşılık gelen adres ölçü μ ve resim m : = e ( X ) . Eğer f Lipschitz sabiti vardır L Taylor'un teoremi tarafından daha sonra,Xμm: =E(x)fL

f(x)=f(m)+f(z)(xm)f(m)+L|xm|,

olduğu yerlerde ( x m ve x > m'nin mümkün olduğuna dikkat edin ). Bunu kullanmak ve Jensen ispatı tekrar çalışmak (Ben paranoyak ve standart bir gerçekten wikipedia'da olduğunu kontrol ettim),z[m,x]xmx>m

E(f(X))=f(x)dμ(x)f(m)dμ(x)+L|x-m|dμ(x)=f(E(X))+LE(|XE(X)|).

Şimdi, varsayalım . Bu durumda,|f(x)|λ

f(x)=f(m)+f'(m)(x-m)+f"(z)(x-m)22f(m)+f'(m)(x-m)+λ(x-m)22,

ve bu yüzden

E(f(X))f(m)+f(m)(E(X)m)+λE((Xm)2)2=f(E(X))+λVar(X)2.

Birkaç şeyden kısaca bahsetmek istiyorum. Açıksa üzgünüm.

Bir o, sen sadece diyemeyiz olan "wlog " Sen arasındaki ilişkiyi değişiyor çünkü, dağıtım kaydırarak f ve u .E(X)=0fμ

Sonraki, sınırın bir şekilde dağılıma bağlı olması gerektiğidir . Bunu görmek için, ve f ( x ) = x 2 olduğunu hayal edin . Σ değeri ne olursa olsun, yine de f ( E ( X ) ) = f ( 0 ) 2 ) = σ 2 elde edersiniz.XGaussian(0,σ2)f(x)=x2σ. Öte yandan, E ( f ( X ) ) = E ( Xf(E(X))=f(0)=0E(f(X))=E(X2)=σ2 . Böylece, değiştirerek , iki miktar arasındaki boşluğu isteğe bağlı olarak yapabilirsiniz! Sezgisel olarak, ortalamadan daha fazla kütle itilir ve bu nedenle, herhangi bir kesinlikle dışbükey işlev için, E ( f ( X ) ) artar.σE(f(X))

Son olarak, önerdiğiniz gibi çarpımcılığa nasıl bağlanacağımı anlamıyorum. Bu gönderide kullandığım her şey standart: Taylor teoremi ve türev sınırları, istatistik sınırlarında ekmek ve tereyağıdır ve çarpma hataları değil, otomatik olarak katkı sağlar.

Yine de düşüneceğim ve bir şey yollayacağım. Belirsiz sezgi, hem fonksiyon hem de dağılım için çok zorlu koşullara ihtiyaç duyacağı ve ilave bağın gerçekte bunun merkezinde olduğu anlamına gelir.


Her düzenlediğimde cevap çarptı. Bu yüzden şunu işaret edeceğim: ikinci türev sınırı, verdiğim örnek için sıkı.
matus

Bence, hakkınızdaki daha güçlü koşullar olmadan ilave sınırların mümkün olan en iyisi olduğunuzu düşünüyorum.
Ian,

Sevgili Ian, bu problemi biraz daha düşündüm, ama aklımdaki asıl zorluk, verdiğim örnekle ima ediyor, , fakat E (f(E(X))=0 . Hem fonksiyon ailesini (sınırlı, sınırlı türevler, bütünleştirilebilir) hem de dağılımı (düzgün, sınırlı, sınırlı anlar) sınırlandırabilir ve hala bu örneklere sahipsiniz. Dağılımın ortasında sıfıra eşit simetrik, negatif olmayan bir işleve sahip olmak yeterlidir. Bununla birlikte, her şey sizin probleminizdeki kısıtlamalara bağlıdır. Genel durumda, katkı yapısının temel olduğunu düşünüyorum.E(f(X))>0
matus

@Ian: Chernoff ve Azuma-Hoeffding eşitsizliklerinin ispatları bunu hatırlatan argümanları kullanıyor, bu nedenle ilham almak için bunları okumak isteyebilirsiniz. Mitzenmacher ve Upfal'ın bilgisayardaki randomizasyon konusundaki kitabına bakınız.
Warren Schudy

3

İçgörü için, iki değer üzerinde yoğunlaşmış bir dağıtım düşünün; diyelim ki, 1/2 eşit olasılıkları 1 veya 3'e eşit, bu nedenle . Al N > > 0 ve ε > 0 . İşlevlerini göz önünde f olan f ( 1 ) = f ( 3 ) = N ε ve f ( E [ x ] ) = f ( 2 ) = ε . YaparakE[x]=2N>>0ϵ>0ff(1)=f(3)=Nϵf(E[x])=f(2)=ϵ yeterince küçük ve bağlantı f bu üç nokta arasında sürekli olarak biz eğriliğini yapabilir f istenen kadar küçük. Sonraϵff

, henüzE[f(x)]=Nϵ

.N=Nϵ/ϵ=E[f(x)]/f(E[x])φ(f)

Bu gösterir keyfi olarak büyük olması gerektiğini.φ(f)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.