Ölçüm konsantrasyon eşitsizliklerini anlama


12

Bu sorunun ruhu içinde , Hoeffding eşitsizliğinde kullanılan bir lemmanın kanıtını anlayarak, Hoeffding eşitsizliğine yol açan adımları anlamaya çalışıyorum.

Kanıtta benim için en gizemli olan şey, iid değişkenlerinin toplamı için üstel anların hesaplandığı, daha sonra Markov'un eşitsizliğinin uygulandığı kısımdır.

Amacım anlamak: Bu teknik neden sıkı bir eşitsizlik veriyor ve başarabileceğimiz en sıkı şey mi? Tipik bir açıklama, üsün moment üreten özelliklerini ifade eder. Yine de bunu çok belirsiz buluyorum.

Tao'nun blogunda yer alan bir yayın, http://terrytao.wordpress.com/2010/01/03/254a-notes-1-concentration-of-measure/#hoeff , bazı cevaplar alabilir.

Bu hedef göz önünde bulundurulduğunda, sorum Tao'nun gönderisinde takıldığım ve bir zamanlar açıklayabileceğimi umduğum yaklaşık üç nokta.

  1. Tao, şu eşitsizliği, kullanarak şu eşitsizliği türetir Bu herhangi bir k için doğruysa, üstel bir bağ sonlandırır. Burası kaybolduğum yer.

    P(|Sn|λn)2(ek/2λ)k.     (7)
    P(|Sn|λn)Cexp(cλ2)     (8)
  2. Hoeffding'in lemması sunulmuştur: Lemma 1 (Hoeffding'in lemması) aralığında değerler alan skaler bir değişken . Daha sonra herhangi , Özellikle Lemma 1'in kanıtı taylor genişlemesi Genişleme neden bu ikinci dereceden terimle sınırlanabilir? Ve denklem 10 nasıl takip eder?X[a,b]t>0

    EetXetEX(1+O(t2Var(X)exp(O(t(ba)))).     (9)
    EetXetEXexp(O(t2(ba)2)).     (10)
    etX=1+tX+O(t2X2exp(O(t)))
  3. Son olarak, bir alıştırma verilir:
    Alıştırma 1 (10) 'daki faktörünün ile değiştirilebildiğini ve bunun keskin. Bu , Hoeffding eşitsizliğinde kullanılan bir lemmanın kanıtını anlama bölümünden çok daha kısa bir kanıt sağlayacaktır , ancak bunu nasıl çözeceğimi bilmiyorum.O(t2(ba)2)t2(ba)2/8

Eşitsizliğin kanıtı veya daha sıkı bir bağ türetemememizin nedeni hakkında daha fazla sezgi \ açıklama kesinlikle kabul edilir.


Orijinal Hoeffding'in belgesini okudunuz mu?
Alecos Papadopoulos

@AlecosPapadopoulos Aslında bilmiyorum. Buradaki türetmenin, aradığım açıklamadan yoksun matematik derslerinde genellikle öğretilen cebirsel adımlardan oluştuğu izlenimi altındayım. Aksini söyleyebilir misin?
Leo

Okumanızı öneririm. JStor'daki sabit URL jstor.org/stable/2282952'dir . "Sizin için en gizemli olan" şey, kanıtları kağıdın 4. bölümünde (sonunda değil) olan kağıdın 1, 2 ve 3 Teoremleri ve bana oldukça açık görünüyor. Bazı "matematiksel olmayan" sezgi arıyorsanız-bilmiyorsanız evet, her zaman mevcut değildir.
Alecos Papadopoulos

Yanıtlar:


3

Üstel momentlerin kullanımı, ölçü eşitsizliklerinin konsantrasyonunu kanıtlama sürecinde yaygın bir adımdır. Benim anlayış gibidir kullanarak) 1 aşağıda ziyade , tek yakalar tüm anları yerine sadece ilk an. Bu nedenle, her zaman bağlı avantajlıdır yerine bağlı daha , daha bilgiler bulunduğundan . Neden gelmez fazla bilgiye sahip? Taylorın genişlemesi ile gayri resmi bir açıklama yapılmıştır . Gördüğünüz gibi tüm güçleriEeXEXXEeXEXEeXEeXeX=1+X+X22+X36+Xalakalıdır. Bu nedenle, aldığınızda, aslında tüm anlarını sınırlandırırsınız . EXX


2
Tanım olarak, mahallesindeki herhangi bir analitik fonksiyonun kesinlikle yakınsak bir Taylor serisine sahiptir. Bu nedenle argümanınız, üstel de değiştirilebileceğini düşündürmektedir . Üstel hakkında özel bir şey yok mu? f0eXf(X)
whuber

1
Ben yerine düşünmedim genel analitik fonksiyonu ile. Ama şimdi bahsettiğinize göre, "uygun" bir işlev , böylece Markov eşitsizliği uygulanabilir ve Taylor genişlemesi tüm güçlerine sahip olan , böylece tüm anlar yakalanan. Sanırım en basit ve en doğal seçimdir. ff(x)>0XeX
gmravi2003

1
Buna bakmadım, ancak üstel olanın sizin de dahil olmak üzere kritik olan bazı belirli özelliklere sahip olduğundan şüpheleniyorum: tüm katsayılar kesinlikle olumlu olmalı ve kesinlikle her yerde birleşmesi kullanışlı. Ancak, Fourier ve Laplace dönüşümlerinin özellikleri ile ilgili olarak bu işlevin gerekli olmasının daha derin nedenleri olduğuna inanıyorum. Üstel olanın hangi özelliklerinin gerçekten kullanıldığını görmek için ölçü eşitsizliklerinin türevlerini keşfetmek aydınlatıcı olabilir! (+1)
whuber

@whuber güzel bir gözlem. Şu anda açıklamanın eksik olduğunu düşünüyorum. Beni ikna eden şey, üs fonksiyonunun üst sınır ve ayrılabilirlik özellikleridir. Yani, . Dolayısıyla, , ortalama değişken sayısı ne kadar fazlaysa, bu terim üzerinde etkili olan güç de o kadar büyük olur. Böylece üslü bir sınır vermek. P{x1+x2>0}=E{1[x1+x2>0]}E{exp(tx1)}E{exp(tx2)}E{exp(tx1)}<1
Leo

Sizi bu sınırın sıkılığı hakkında bir soru ile ilgilendirmek istiyorum: stats.stackexchange.com/questions/77019/…
Leo
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.