Yinelenen Beklentiler Yasasının genelleştirilmesi


43

Geçenlerde bu kimliğe rastladım:

E[E(Y|X,Z)|X]=E[Y|X]

Elbette bu kuralın basit versiyonunu biliyorum, yani ama bunun için gerekçe bulamadım genelleme.E[E(Y|X)]=E(Y)

Birisi beni bu konuda teknik olmayan bir referansı gösterebilirse veya daha da iyisi, bu önemli sonuç için basit bir kanıt hazırlayabilirse minnettar olurum.


2
Eğer üzerinde şartlanmış olsaydı, bu tamamen basit versiyonun dışına çıkmaz mıydı? yx
Mehrdad

Yanıtlar:


36

BİLGİ TEDAVİSİ

Rasgele değişkenler üzerinde şart koyduğumuz notasyonun, ekonomik olmasına rağmen, notasyon olarak yanlış olduğunu hatırlamalıyız. Gerçekte, bu rastgele değişkenlerin ürettiği sigma cebirini şartlandırırız. Başka bir deyişle , . Bu sözler "Gayri resmi bir İşlem" de görünmeyebilir, ancak şartlandırma varlıklarımızın kümelerden oluşan koleksiyonlar olduğunu hatırlatır (ve tek bir değere koşarken, o zaman bu bir singleton setidir). Peki bu setler neler içeriyor? İçerdikleri bilgi rasgele değişken olası değerler hangi geçirilmesindeki olabilecekler konusunda bize temin .E[YX]E[Yσ(X)]XY
Bilgi kavramını getirmek, Yinelenen Beklentiler Yasasını (bazen "Kule Mülkiyeti" olarak adlandırılır) çok sezgisel bir şekilde düşünmemize ve kullanmamıza izin verir:
En az iki rasgele değişken tarafından oluşturulan sigma cebiri Bir rastgele değişkenin ürettiği büyüklük: büyük set-teorik anlamdaki . Böylece bilgi ile ilgili içerdiği karşılık gelen bilgilere kadar büyük, en azından, . Şimdi, notasyonel innuendo olarak, ve . Ardından, baktığımız denklemin LHS'si yazılabilir.σ(X)σ(X,Z)Yσ(X,Z)σ(X)
σ(X)Ixσ(X,Z)Ixz

Y I x z I x

E[E(Y|Ixz)|Ix]
sözlü Elimizdeki yukarıdaki ifadeyi nitelendiren: "beklenen değerin {beklentisi nedir Bilgi verilen } yalnızca mevcut bilgisine sahip için mi? " YIxzIx

Her nasılsa "dikkate alalım" ? Hayır - sadece . Fakat sahip olduğumuz şeyi kullanırsak (çözmek istediğimiz ifadeyle mecbur olduğumuz gibi), o zaman beklentiler operatörü altında hakkında bir şeyler söylüyoruz , yani " " , artık - bilgilerimizi henüz tükettik. I x Y E ( Y I x )IxzIxYE(YIx)

Bu yüzden

E[E(Y|Ixz)|Ix]=E(Y|Ix)

Başkası almazsa, resmi tedavi için geri döneceğim.

A (biraz daha fazla) FORMAL TEDAVİ

İki önemli olasılık teorisi kitabının, P. Billingsley'in Olasılık ve Ölçümü'nün (3d ed.-1995) ve D. Williams'ın "Martingalılarla Olasılık" (1991), "Yinelenen Beklentiler Yasası" nı nasıl ispatladığını ele alalım:
Billingsley ispat için tam üç satır ayırıyor. Williams ve teklif veriyorum

"(Kule Mülkiyet) koşullu beklenti tanımından hemen hemen".

Bu bir metin satırı. Billingsley'in ispatı daha az opak değil.

Tabii ki haklılar: koşullu beklentinin bu önemli ve sezgisel özelliği, esasen doğrudan (ve hemen hemen) tanımından kaynaklanmaktadır - tek sorun, bu tanımın genellikle öğretilmediğini veya en azından vurgulanmadığını, olasılık dışında olduğunu sanmıyorum. veya teorik çevreleri ölçün. Ancak, İfade Edilmiş Beklentiler Kanunu'nun (neredeyse) üç satırını gösterebilmek için, koşullu beklenti tanımına veya onun tanımlayıcı özelliğine ihtiyacımız var .

Bir olasılık alanı ve bir bütünleşik rasgele değişken . Let bir alt olmak cebiri arasında , . Daha sonra , matematiksel ölçülebildiği, bütünleştirilebilen ve tanımlayan özellik olan bir işlevi vardır.Y G σ F GF W G(Ω,F,P)YGσFGFWG

E(W1G)=E(Y1G)GG[1]

buradaki , setinin gösterge işlevidir . Biz söylemek ( "bir sürümünü") 'dir koşullu beklenti verilen ve biz yazmak burada dikkat edilmesi gereken kritik detay koşullu beklenti olduğunu aynı beklenen değere sahiptir değil sadece bütün üzerinde, yapar , ama her alt kümesinde arasında . G W Y G W = E ( Y G )1GGWYGY G G GW=E(YG)a.s.
YGGG

(Şimdi Tower mülkünün şartlı beklenti tanımından nasıl çıktığını göstermeye çalışacağım).

G σ HG G HG G W Y U = E ( G H )W matematiksel bir ölçülebilir rasgele değişkendir. O zaman bazı alt -algebra düşünün , deyin . Sonra . Bu yüzden, daha önce olduğu gibi benzer bir şekilde, biz koşullu bir beklentiye sahip verilen , demek bu karakterizedir GσHGGHGGWHU=E(WH)a.s.

E(U1G)=E(W1G)GH[2]

Yana , denklem ve bize vermek [ 1 ] [ 2 ]HG[1][2]

E(U1G)=E(Y1G)GH[3]

Ancak bu koşullu beklenti belirleyici özelliğidir verilen . HYHBu yüzden inşaata ile de sahip olduklarından , sadece kanıtlanmıştır kule özellik veya Yinelenen Beklentiler Yasasının genel formu - sekiz satırda.U = E ( G H ) = E ( E [ Y G ] H )U=E(YH)a.s.
U=E(WH)=E(E[YG]H)


6
(+1) Bu soyut ve zor bir kavramı tanımlamanın yararlı bir yoludur. Yine de, "... daha büyük değil ..." ifadesinin "daha küçük olmaması" gerektiğine inanıyorum. Daha da iyisi, o bölüm hakkında bilgi Yani bir rastgele değişkenin tarafından üretilen bu kadar büyük, en azından ... iki değişken tarafından oluşturulan sigma cebir" gibi negatif kaldırma ve paralel yapı kullanılarak daha net yapılmış olabilir içeriyordu içinde karşılık gelen bilgilere kadar büyük, en azından, ." σ ( X , Z ) σ ( X )Yσ(X,Z)σ(X)
whuber

İkinize de teşekkürler, cc @ whuber. Bu çok kullanışlı bir teoremdir.
JohnK

@ whuber Bunu ve önerinizi paylaştığınız için teşekkür ederiz.
Alecos Papadopoulos

24

Koşullu beklentiyi anlama ve öğrencilerime öğretme yöntemi şudur:

koşullu beklenti , çözünürlüğünde bir kamera tarafından çekilmiş bir resimdirE[Y|σ(X)]σ(X)

Alecos Papadopoulos, gösterim tarafından belirtildiği gibi daha hassas . Kamera hattı boyunca, , orijinal nesne, örneğin bir manzara, manzara gibi düşünülebilir. , çözünürlüğü olan bir fotoğraf makinesi tarafından çekilmiş bir resimdir . Beklenti ortalama bir operatördür ("bulanıklaştırma" operatörü?). Manzara çok şey içerebilir, fakat düşük çözünürlüklü bir kamera kullanarak çektiğiniz resim kesinlikle biraz ayrıntıdan uzaklaşacaktır, örneğin gökyüzünde çıplak gözünüz tarafından görülebilen bir UFO olabilir, ancak tarafından çekilen resimde görünür (iphone 3?)E[Y|σ(X)]E[Y|X]YE[Y|σ(X,Z)]σ(X,Z)

Çözünürlük kadar yüksekse , bu resim gerçek manzaradaki her ayrıntıyı yakalayabilir. Bu durumda, .σ(X,Z)=σ(Y)E[Y|σ(Y)]=Y

Şimdi, olarak görülebilir: çözünürlüğe sahip bir kamerayı kullanarak (örneğin, iphone 1) daha düşük olan (örneğin, iphone 3) ve bu fotoğrafta çözünürlüğünde kamera tarafından oluşturulan bu fotoğrafın resmini çekin, o zaman bir fotoğraftaki bu resmin başlangıçta yaptığınız gibi olması gerektiği açık olmalıdır. düşük çözünürlüklü bir kamera kullanın .E[E[Y|σ(X,Z)]|σ(X)]σ(X)σ(X,Z)σ(X,Z)σ(X)

Bu, hakkında sezgi sağlar . Aslında bu aynı sezgi bize hala olduğunu söylüyor . Bunun nedeni şudur: İlk fotoğrafınız iphone 1 (düşük çözünürlükte) tarafından çekilirse ve şimdi ilk fotoğrafta başka bir fotoğraf oluşturmak için daha iyi bir kamera (örneğin, iphone 3) kullanmak istiyorsanız, o zaman hiçbir şekilde İlk fotoğrafın kalitesini artırabilir.E[E[Y|X,Z]|X]=E[Y|X]E[E[Y|X]|X,Z]=E[Y|X]


2
Sevdim! :) harika bir açıklama.
jessica,

1
@jessica Ben yardımcı olur sevindim :-) Bu açıklama ile gelip bir süre aldı
KevinKim

21

Yinelenen Beklenti Yasasında (LIE), , bu içsel beklenti, bir işlevi olan rastgele bir değişkendir , ve bir işlevi değil . bu fonksiyonunun beklentisinin beklentisine eşit olması, LIE'nin bir sonucudur. Bütün bunlar, el sallayarak, sadece ortalama değerinin, çeşitli koşullar altında ortalama değerlerinin ortalaması alınarak bulunabileceği iddiası . Aslında, bunların tümü, toplam olasılık yasasının doğrudan bir sonucudur. Örneğin, eğer veE[E[YX]]=E[Y]Xg(X)YXYYYXY , pmf rasgele değişkenler , daha sonra \ scriptstyle {\ text {RV} ~ E [Y \ orta X] ~ \ text {değeri}} ~ E [Y \ orta X = x] ~ \ text {ne zaman} ~ X = x} \ end {align} Not Bu son beklentinin göre nasıl olduğu ;pX,Y(x,y)

E[Y]=yypY(y)definition=yyxpX,Y(x,y)write in terms of joint pmf=yyxpYX(yX=x)pX(x)write in terms of conditional pmf=xpX(x)yypYX(yX=x)interchange order of summation=xpX(x)E[YX=x]inner sum is conditional expectation=E[E[YX]]RV E[YX] has value E[YX=x] when X=x
XE[YX] bir fonksiyonudur değildir, , ama yine de, buna ait ortalama ortalama aynıdır .XYY

Baktığınız genelleştirilmiş LIE , içsel beklentinin iki rastgele değişkeni bir fonksiyonu olduğu sol 'a sahiptir. ve . Argüman yukarıda ana hatlarıyla belirtilene benzer, ancak şimdi rastgele değişkeninin başka bir rastgele değişkene eşit olduğunu göstermeliyiz. değeri olduğunda , değerine bakarak bunu yaparız . Açıklamaları atlayarak, biz var E[E[YX,Z]X]h(X,Z)XZ E[YX]E[YX]Xx

E[YX=x]=yypYX(yX=x)=yypX,Y(x,y)pX(x)=yyzpX,Y,Z(x,y,z)pX(x)=yyzpYX,Z(yX=x,Z=z)pX,Z(x,z)pX(x)=zpX,Z(x,z)pX(x)yypYX,Z(yX=x,Z=z)=zpZX(zX=x)yypYX,Z(yX=x,Z=z)=zpZX(zX=x)E[YX=x,Z=z)=E[E[YX,Z]X=x]
Sondan beri olan sonucun , rastgele değişkeninin koşullu beklenen değerinin formülü olduğuna dikkat edinZ] ( ve bir fonksiyonu ) şartlandırılmışE[YX,Z]XZ değerinde . Bu sabitleme değeri için rastgele değişken değerlerini çarpılmasıyla tarafından şartlı PMF değeri verilen , ve tüm bu koşullar toplanmasıyla.XXxE[YX,Z]ZX

Bu nedenle, rastgele değişkeninin her değeri için, rastgele değişkeninin değeri ( daha önce not ettik , değil, bir işlevidir ), rastgele değerinin değeriyle aynıdır. değişken , yani bu iki rastgele değişken eşittir. Sana yalan söyler miyim hiç?X E [ Y X ] X Y E [ E [ Y X , Z ] X ]xXE[YX]XYE[E[YX,Z]X]

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.