En iyi öngörücü olarak Koşullu beklentinin kanıtı ile ilgili sorun


19

Kanıtıyla ilgili bir sorunum var

E(Y|X)argming(X)E[(Yg(X))2]

bu da büyük olasılıkla beklentilerin ve koşullu beklentilerin daha derin bir yanlış anlaşılmasını ortaya koymaktadır.

Bildiğim kanıt şu şekildedir (bu kanıtın başka bir versiyonunu burada bulabilirsiniz )

argming(X)E[(Yg(x))2]=argming(X)E[(YE(Y|X)+E(Y|X)g(X))2]=argming(x)E[(YE(Y|X))2+2(YE(Y|X))(E(Y|X)g(X))+(E(Y|X)g(X))2]=argming(x)E[2(YE(Y|X))(E(Y|X)g(X))+(E(Y|X)g(X))2]

Daha sonra kanıt genellikle 2E[(YE(Y|X))(E(Y|X)g(X))]=0 ve dolayısıyla

argming(x)E[(Yg(x))2]=argming(x)E[(E(Y|X)g(X))2]

g (X) = E (Y | X) olduğunda minimize edildiği görülebilir g(X)=E(Y|X).

İspat hakkındaki bulmacalarım şunlardır:

  1. Düşünmek

E[2(YE(Y|X))(E(Y|X)g(X))+(E(Y|X)g(X))2] .

Bu bağımsız ilk terim her zaman sıfıra eşit olduğunu gösteren herhangi bir tartışmanın, kimse bu ayar görebilirsiniz Bana öyle geliyor g(X)=E(Y|X) o da anlaşılacağı gibi ifadeyi minimize (E(Y|X)g(X))=0 ve dolayısıyla

E[2(Y-E(Y|X))(E(Y|X)-g(X))+(E(Y|X)-g(X))2]=E(0+0) = 0.

Bunun doğru olup olmadığını Ama sonra bir yerine kanıtı tekrarlamak olabilir herhangi bir başka işlevi tarafından , demek o olduğunu ve sonuca olsun o en aza indirir ifade. Yani yanlış anladığım bir şey olmalı (değil mi?).X sa ( X ) sa ( X )E(Y|X)Xh(X)h(X)

  1. Problemin açıklamasında nin anlamı hakkında bazı şüphelerim var . Gösterim nasıl yorumlanmalıdır? Anlamında mıE[(Y-g(X))2]

E Y [ ( Y - g ( X ) ) 2 ] E X Y [ ( Y - g ( X ) ) 2 ]EX[(Y-g(X))2] , veya ?EY[(Y-g(X))2]EXY[(Y-g(X))2]

Yanıtlar:


11

(Bu Granger & Newbold (1986) "Öngörülen Ekonomik Zaman Serileri" nin bir uyarlamasıdır).

Yapım olarak, hata maliyet fonksiyonu olan . Bu, kritik bir varsayımı içerir (hata maliyeti fonksiyonunun sıfır civarında simetrik olduğu) -Farklı bir hata maliyeti fonksiyonunun, beklenen değerinin olarak şartlı beklenen değeri olması gerekmez . Bilinmeyen miktarlar içerdiğinden hata maliyeti işlevinizi en aza indiremezsiniz. Yani onun yerine beklenen değerini en aza indirmeye karar verdiniz. Sonra objektif fonksiyonunuz argdak.[Y-g(X)]2argmin

E[Y-g(X)]2=-[y-g(X)]2fY|X(y|x)dy

ki ikinci sorunuzu da cevapladığına inanıyorum. Beklenen değerin üzerinde koşullu olması sezgiseldir , çünkü göre tahmin etmeye / tahmin etmeye çalışıyoruz . Elde etmek için kareyi ayrıştırınX Y XYXYX

E[Y-g(X)]2=-y2fY|X(y|x)dy-2g(X)-yfY|X(y|x)dy+[g(X)]2-fY|X(y|x)dy

İlk terim içermez, bu nedenle minimizasyonu etkilemez ve göz ardı edilebilir. İkinci terimdeki integral, verilen koşullu beklenen değerine ve son terimdeki integral birliğe eşittir. YaniY Xg(X)YX

argming(x)E[Y-g(X)]2=argming(x){-2g(X)E(Y|X)+[g(X)]2}

Birinci türev wrt olan en aza indirilmesi için birinci order duruma yol ikinci türevinin eşit ise olan bir minimum için yeterlidir.- 2 E ( Y X ) + 2 g ( X ) g ( X ) = E ( Y X ) 2 > 0g(X)-2E(Y|X)+2g(X)g(X)=E(Y|X)2>0

EK: "Topla ve çıkar" kanıtı yaklaşımının mantığı.

OP soruda belirtilen yaklaşımdan şaşkın, çünkü totolojik görünüyor. Toplama ve çıkarma taktiği kullanıldığında, toplanan ve çıkarılan terimin keyfi bir seçimi için objektif fonksiyonun belirli bir bölümünü sıfır yaparken, değer fonksiyonunu , yani objektifin değerini eşitlemez. işlevi aday küçültücüde değerlendirilir.

seçimi için değer fonksiyonuna sahibiz Keyfi seçim için değerine sahibiz .V ( E ( Y X ) ) = E [ ( Y - E ( Y X ) ) 2X ]g(X)=E(Y|X)V(E(Y|X))=E[(Y-E(Y|X))2|X]V ( h ( X ) ) = E [ ( Y - h ( X ) ) 2X ]g(X)=h(X)V(h(X))=E[(Y-h(X))2|X]

Bunu iddia ediyorum

V(E(Y|X))V(h(X))
E(Y2|X)-2E[(YE(Y|X))|X]+E[(E(Y|X))2|X]E(Y2|X)-2E[(Yh(X))|X]+E[(h(X))2|X]

LHS ve RHS'nin ilk dönemi iptal edildi. Ayrıca dış beklentinin üzerinde koşullu olduğunu unutmayın . Koşullu beklentilerin özellikleri sayesindeX

...2E(YX)E(YX)+[E(YX)]22E(YX)h(X)+[h(X)]2

0[E(YX)]22E(YX)h(X)+[h(X)]2

0[E(YX)h(x)]2
, ise katı eşitsizliğe sahiptir . Yani küresel ve eşsiz minimize edici olan.h(x)E(YX)E(YX)

Ancak bu aynı zamanda, "toplama ve çıkarma" yaklaşımının burada en aydınlatıcı kanıt yolu olmadığını söylüyor.


Cevabınız için teşekkürler. İkinci sorumun açıklığa kavuşturulmasına yardımcı oluyor. Sorunun başlığını aktarmaya çalıştığım gibi, asıl meselem (yazıdaki ilk sorun) ispat mekanizması hakkındaydı. Temel kaygım, soruda sunduğum kanıtları anlamam. Açıkladığım gibi, ispat konusundaki anlayışım beni açıkça sorunlu bir ifadeye götürüyor. Bu yüzden, benim hatamın, beklenti ve koşullu beklenti kavramları hakkında daha derin yanlış anlaşılmaları ortaya çıkarabileceğinden anlamak istiyorum. Bunun hakkında bir fikrin var mı?
Martin Van der Linden

1
İspat için "toplama ve çıkarma" yaklaşımına biraz açıklama ekledim.
Alecos Papadopoulos

Anlamak için bana biraz zaman aldı, ama sonunda temel hatamı aldım: yeterince doğru olduğunda , ancak ifadesinin en aza indirdiği anlamına gelmez . Basamaklama ifadesinin sıfırdan düşük olmamasının bir nedeni yoktur. Çünkü önünde eksi işareti bir tanesidir bulmak olabilir bu şekilde . g ( X ) = h ( X ) h ( X ) ( Y - h ( X ) ) (E[2(Yh(X))(h(X)g(X))+(h(X)g(X))2]=0g(X)=h(X)h(X) g ( X ) E [ - 2 ( Y - h ( X ) ) ( h ( X ) - g ( X ) ) + ( h ( X ) - g ( X ) ) 2 ] < 0(Yh(X))(h(X)g(X))g(X)E[2(Yh(X))(h(X)g(X))+(h(X)g(X))2]<0
Martin Van der Linden

1
Hmmm ... bahsettiğiniz ifadedeki eksi işareti bir hatadır - artı işareti olmalıdır. Elbette, eksi işareti almak için şartları yeniden düzenleyebilirsiniz ... bu, kazandığınız sezgiye zarar veriyor mu?
Alecos Papadopoulos

Soruyu takip ettiğiniz için teşekkürler. Bu hatayı düzeltmek için ilk gönderiyi düzenledim. Neyse ki, kazanılan sezgiye zarar vermediğini düşünüyorum. Aslında benim bir başka hata anlamamıza yardımcı olur: Ben eksi işareti garanti için önemli olduğunu varsayarak ille değildi asgari . Ama bunun sadece 2'den önceki işaretle ilgili olmadığını anlıyorum. (Umarım) Gerçekten anlamam gereken şey, genel olarak (yani keyfi ) , (doğru?) Olduğunda simge durumuna küçültülmesine gerek yoktur . E [ - 2 ( Y - h ( X ) ) ( h ( X ) - g ( X ) ) + ( h ( X ) - g ( X ) ) 2 ] h ( X ) E [ 2 ( Y - h ( X ) ) ( h ( X ) - g (0E[2(Yh(X))(h(X)g(X))+(h(X)g(X))2]h(X)E[2(Yh(X))(h(X)g(X))]g(X)=h(X)
Martin Van der Linden

5

Cevabı kanıtlamak için, gerçekten sadece

E[2(YE(Y|X))(E(Y|X)g(X))]=0

Hangi beklentiyi alacağınıza gelince, şartlı olarak alırsınız, aksi takdirde

argming(X)E[(Yg(X))2]

Anlamsızdır, çünkü , değil ise rastgele bir değişkendir . Gerçekten veya yazmanız gerektiğini gösterin bunu netleştirmek için. Şimdi bu açıklamaya göre, terimi sabittir ve beklentinin dışında çekilebilir ve sizde:g(X)EEXYEY|XE[(Yg(X))2|X]EY|X[(Yg(X))2](E(Y|X)g(X))

2(E(Y|X)g(X))E[(YE(Y|X))|X]=2(E(Y|X)g(X))[E(Y|X)E[E(Y|X)|X]]=2(E(Y|X)g(X))[E(Y|X)E(Y|X)]=0

Böylece objektif fonksiyonu şöyle yazabilirsiniz:

EY|X[(Yg(X))2]=EY|X[(YEY|X(Y|X))2]+(EY|X(Y|X)g(X))2

Minimizer buradan belli oluyor. üzerinde de ortalama olsaydınız, aşağıdakileri göstermek için çok benzer bir argümanın kullanılabileceğini unutmayın:X

EX[(E(Y|X)g(X))2]=EX[(EY|X(Y|X)EX[EY|X(Y|X)])2]+(EX[EY|X(Y|X)]EX[g(X)])2

Bu Şekil set eğer her biri için , daha sonra aynı zamanda, bu işlevi üzerinde bir minimiser sahiptir. Yani bir bakıma o olsun gerçekten önemli değil olduğunu veya .g(X)=EY|X(Y|X)XEEYXEY|X


3

Çok basit bir matematiksel bakış açısı var. Sahip olduğunuz şey, Hilbert uzayında bir projeksiyon problemidir, tıpkı içindeki bir vektörü bir alt uzaya yansıtmak gibidir .Rn

Let altta yatan olasılık alanı belirtmektedir. Sorunun anlamlı olması için, sonlu ikinci momentlere sahip rastgele değişkenleri, yani Hilbert uzayını düşünün . Şimdi sorun şudur: verildiğinde, alt , burada , tarafından oluşturulan -subalgebra'sıdır . (Tıpkı sonlu boyutlu durumda olduğu gibi, bir alt uzaya direncini en aza indirmek projeksiyonu bulmak anlamına gelir). İstenen projeksiyon(Ω,F,μ)L2(Ω,F,μ)X,YL2(Ω,F,μ)YL2(Ω,FX,μ)FXσFXL2E(X|Y) , yapı ile. ( Varlık kanıtını incelerse, bu aslında karakterize eder).E(X|Y)


Bu güzel bir yanıt.
jII

0

Son sorunuzla ilgili beklenti, wrt (koşulsuz hata) veya wrt (her değerindeki koşullu hata ) olabilir. Mutlu bir şekilde, her bir değerinde koşullu hatayı en aza indirmek koşulsuz hatayı da en aza indirir, bu yüzden bu çok önemli bir ayrım değildir.p(x,y)p(yx)X=xX=x

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.