Hoeffding eşitsizliğinde kullanılan bir lemmanın kanıtını anlama


11

Larry Wasserman'ın Casella ve Berger'i birincil metin olarak kullanan İstatistik ders notlarını inceliyorum . 2 no'lu ders notları üzerinde çalışıyorum ve Hoeffding eşitsizliğinde kullanılan lemmanın türetilmesinde sıkıştım (s.2-3). Aşağıdaki notlarda ispatı yeniden veriyorum ve ispattan sonra nerede sıkıştığımı göstereceğim.


baş kelime

olduğunu olduğunu varsayalım . Sonra .E(X)=0aXbE(etX)et2(ba)2/8

Kanıt

Bu yana , yazabiliriz konveks kombinasyonu gibi ve , yani burada . İşlev dışbükey ile ElimizdekiaXbXabX=αb+(1α)aα=Xabayety

etXαetb+(1α)eta=Xabaetb+bXbaeta

Her iki tarafın beklentilerini alın ve aslında kullanmak olsunE(X)=0

E(etX)abaetb+bbaeta=eg(u)

burada , ve . olduğuna dikkat edin . Ayrıca tüm u> 0 için .u=t(ba)g(u)=γu+log(1γ+γeu)γ=a/(ba)g(0)=g(0)=0g(u)1/4u>0

Taylor teoremine göre, (0, u) ' da bir \ varepsilon \ vardır, ε(0,u)böylece g(u)=g(0)+ug(0)+u22g(ε)=u22g(ε)u28=t2(ba)28

Bu nedenle E(etX)eg(u)et2(ba)28 .


Kanıtı takip edene kadar

E(etX)abaetb+bbaeta=eg(u) ama türlerini nasıl elde edeceğimi bilemiyorum .u,g(u),γ


3
İlginç bir maksimum değeri olan ve böylece sonuç etkili bir şekilde bu durum tesadüflerden kaynaklanamayacak kadar tanıdık geliyor. Olasılıklı bir argüman yoluyla sonucu elde etmenin başka, muhtemelen daha kolay bir yolu olabileceğinden şüpheleniyorum. var(X)σmax2=(ba)2/4
E[etX]eσmax2t2/2
Dilip Sarwate

@DilipSarwate Anladığım kadarıyla, tekdüze bir rastgele değişken için maksimum varyans oluşuyor . Varyansı olan . Lütfen nasıl e sahip olduğunuzu açıklayabilir misiniz ? XU(a,b)XVar(X)=(ba)212(ba)24
Anand

Kitleyi uç noktalara yoğunlaştırarak ...
Elvis

@DilipSarwate Kanıtta birkaç yorum ekledim, bu en kötü durumun neden en büyük varyans olduğu bir liitle bitini açıklığa kavuşturabilir.
Elvis

1
@DilipSarwate - Burada lemma 1 ve egzersiz 1'e bakın: terrytao.wordpress.com/2010/01/03/… . Görünüşe göre Jensen eşitsizliğine ve taylor'ın genişlemesine dayanan daha basit bir türev var. Ancak bunun detayları bana açık değil. Belki birisi bunu anlayabilir. ((9) 'dan (10)' a türev ve alıştırma 1)
Leo

Yanıtlar:


17

Sorunuzu doğru anladığımdan emin değilim. Cevap vermeye çalışacağım: nın bir fonksiyonu olarak yazmaya çalışın : this içinde bir cilt istediğiniz gibi doğaldır .

abaetb+bbaeta
u=t(ba)eu28

Deneyimin yardımıyla, bunu biçiminde yazmanın daha iyi olduğunu bileceksiniz . Sonra yol açar ile .eg(u)

eg(u)=abaetb+bbaeta
g(u)=log(abaetb+bbaeta)=log(eta(abaet(ba)+bba))=ta+log(γeu+(1γ))=γu+log(γeu+(1γ)),
γ=aba

Bu istediğin bir şey mi?

Düzenleme: ispat hakkında birkaç yorum

  1. İlk hile dikkatle bakılmayı hak ediyor: dışbükey bir işlevse ve ortalanmış rasgele bir değişkense, burada tarafından tanımlanan ayrık değişkentir Sonuç olarak, şunu alır olduğunu en yüksek varyansı olan de desteklenen ortalanmış değişken : Bir destek genişliğiniϕaXb
    E(ϕ(X))abaϕ(b)+bbaϕ(a)=E(ϕ(X0)),
    X0
    P(X0=a)=bbaP(X0=b)=aba.
    X0[a,b]
    Var(X)=E(X2)E(X02)=ba2ab2ba=ab.
    (ba), Dilip'in yorumlarda söylediği gibi az , bunun nedeni ; bağlı elde edilir .(ba)24(ba)2+4ab0a=b
  2. Şimdi sorunumuza dönün. Neden sadece bağlı olarak bir bağlanma elde etmek mümkün ? Sezgisel olarak, bu sadece yeniden ölçeklenmesi meselesidir : vakası için bağlanmışsa, genel sınır alınarak elde edilebilir . Şimdi genişlik 1 desteğiyle ortalanmış değişkenler setini düşünün: çok fazla özgürlük yok, bu yüzden gibi bir sınır mevcut olmalıdır. Başka bir yaklaşım, basitçe yukarıdaki üzerindeki lemma ile daha genel olarak , yalnızca veu=t(ba)XE(etX)s(t)ba=1s(t(ba))s(t)

    E(ϕ(X))E(ϕ(tX))E(ϕ(tX0))uγ : ve ve değişken , yalnızca bir serbestlik derecesi vardır, ve , , . Biz olsun Sadece içeren bir sınır bulmalısın .u=u0=t0(b0a0)γ=γ0=a0b0a0t,a,bt=t0αa=αa0b=αa0

    abaϕ(tb)+bbaϕ(ta)=a0b0a0ϕ(tb0)+b0b0a0ϕ(a0).
    u
  3. Şimdi bunun yapılabileceğine ikna olduk, çok daha kolay olmalı! Başlamak için mutlaka düşünmek zorunda değilsiniz . Mesele şu ki, her şeyi ve bir fonksiyonu olarak yazmalısınız . İlk olarak , , ve . Ardından Şimdi özel durumdayız ... I bitirebileceğini düşünüyorum.guγ

    γ=aba1γ=bbaat=γubt=(1γ)u

    E(ϕ(tX))abaϕ(tb)+bbaϕ(ta)=γϕ((1γ)u)+(1γ)ϕ(γu)


    ϕ=exp

Umarım biraz açıklığa kavuştum.


tam da aradığım şey buydu. Çok teşekkürler.
Anand

1
@Anor, tavsiyelere uymanın zor olduğunu biliyorum, ancak teknik detaylara odaklanarak başlamamanız gerektiğini düşünüyorum, bunun yerine neden böyle bir sınırın var olabileceğini anlamaya çalışın ... o zaman kanıt daha kolay görünmelidir. Size ikinci bölümde nedenini göstermeye çalıştım , bu sabah ekledim (böyle bir soru üzerinde uyumanız gerekiyor - en azından ihtiyacım var). Sanırım bu tür sezgilerin çoğu ders kitabında görünmemesi çok kötü ... teknik bir parçası olsa bile, fikirlere sahip olmadığınız sürece her şey sihirli görünüyor. CrossV'e bana bunu ayrıntılı olarak düşünme fırsatı verdiğiniz için teşekkür ederim!
Elvis

1
Vaov! Düzenleme için +1. Teşekkürler. Ama gibi bir şey elde etmek mümkün olsaydı hoş olmaz mıydı
E[etX]eE[t2X2/2]=e(t2/2)E[X2]=e(t2/2)var(X)et2σmax2/2?
Dilip Sarwate

@Elvis Tavsiye ve sezgisel kısmı yazmak için zaman ayırdığınız için teşekkür ederiz. Bunu anlamak için biraz zaman ayırmam gerek!
Anand

1
@Elvis Sezgiyi ele alarak anlayışımı açıklığa kavuşturmak istiyorum. Daha keskin sınırlar elde etmek için daha yüksek anlara ihtiyaç vardır. Markov ilk anı, Chebyshev ikinci anı kullanır ve Hoeffding mgf kullanır. Bu doğru mu? Birisi bu kısmı genişletebilir ve açıklığa kavuşturabilirse harika olur.
Anand
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.