Taylor serisinin beklentisini almak (özellikle geri kalanlar)


42

Sorum, yaygın olarak kullanılan bir yöntemi, yani Taylor Serisinin beklenen değerini alarak doğrulamaya çalışmakla ilgilidir. Olumlu ortalama ve varyans olan rastgele bir değişkenimiz olduğunu varsayalım . Ek olarak, gibi bir fonksiyonumuz var .Xμσ2log(x)

in Taylor Expansion'ını ortalamanın etrafında yaparsak, burada, her zamanki gibi, st.logX

logX=logμ+Xμμ12(Xμ)2μ2+13(Xμ)3ξX3,
ξX|ξXμ|<|Xμ|

Bir beklenti alırsak, insanların genellikle açıkça görülebilecek bir şey olarak gördükleri yaklaşık bir denklem elde edeceğiz ( buradaki ilk denklemdeki işaretine bakın )e günlük X günlük μ - 1 :

ElogXlogμ12σ2μ2

SORU : Kalan terimin beklenen değerinin gerçekten ihmal edilebilir olduğunu kanıtlamakla ilgileniyorum, yani (veya başka bir deyişle, ).

E[(Xμ)3ξX3]=o(σ2)
E[o(Xμ)2]=o(E[(Xμ)2])

Yapmaya çalıştığım şey : (varsa, içerisinde anlamına gelir) varsayarak , integrali ikiye ayırarak, bazı ile çevreleyen -vicinity : X μ P μ ε N ε R p ( x ) ( x - μ ) 3σ20XμPμεNε

Rp(x)(xμ)3ξx3dx=xNεdx+xNεdx

Birincisi, ve dolayısıyla rahatsız etmediği için sınırlanabilir . Ancak ikincisinde iki tane birbirimize has gerçekimiz var: bir yandan ( ). Ancak öte yandan, ile ne yapacağımızı bilemiyoruz . 1 / ξ 3 P ( | X - μ | > ε ) 0 σ 20 1 / ξ 30Nε1/ξ3

P(|Xμ|>ε)0
σ201/ξ3

Başka bir olasılık, Fatou'nun lemmasını kullanmayı denemek olabilir, ancak nasıl olduğunu çözemiyorum.

Herhangi bir yardım veya ipucunu takdir edecektir. Bunun çok teknik bir soru olduğunun farkındayım, ancak bu "Taylor-beklentisi" yöntemine güvenmek için üzerinden geçmem gerekiyor. Teşekkürler!

PS Burada kontrol ettim , ama biraz başka şeyler gibi görünüyor.


Taylor genişlemesinin üçüncü döneminin önünde neden eksi işareti var? Ayrıca dördüncü dönemde neden değil? Neyi kaçırıyorum? 3 !33!
Alecos Papadopoulos 19:13

@Alecos: önünde sadece bakmak türevi inci . Bu, her iki sorunuza da cevap verecektir. günlüğü xnlogx
kardinal

4
(+1) Bu sorun, son zamanlarda anlarını bulmakla ilgili iki soru tartışmalarında ortaya çıktı . Bu gibi hususlara dikkat etmek önemlidir. :-)X1
kardinal

1
Birinci mertebeden yaklaşım, bazı durumlarda, ortalama değer teoremi nedeniyle daha iyi olabilir. Ortalama değer teoreminin genel durumda yardımcı olacağından emin değilim.
olasılık

1
denklemi bir limit ve entegrasyon değişimi olduğundan, baskın yakınsama teoreminin burada faydalı olabileceğini düşünürdüm . E(o(..))=o(E(..))
Olasılık 20

Yanıtlar:


32

Bu yaklaşım hakkında şüpheci olmak haklısın. Taylor serisi metodu genel olarak çalışmaz, ancak sezgisel gerçek bir çekirdek içerir. Aşağıdaki teknik tartışmayı özetlemek,

  • Güçlü konsantrasyon , Taylor serisi yönteminin hoş işlevler için çalıştığını gösterir.
  • Ağır kuyruklu dağıtımlar veya çok hoş olmayan işlevler için işler önemli ölçüde yanlış olabilir ve olacaktır

Alecos'un cevabından da anlaşılacağı gibi, verileriniz yoğun yazıya sahipse, Taylor serisi yönteminin hurdaya çıkarılması gerektiğini gösteriyor. (Finans uzmanları, sana bakıyorum.)

Elvis'in belirttiği gibi, temel problem varyansın daha yüksek anları kontrol etmemesidir . Nedenini bulmak için, ana fikre ulaşmak için sorunuzu mümkün olduğunca basitleştirelim.

Varsayalım rastgele değişkenin bir dizi var ile olarak . σ ( X n ) 0 n Xnσ(Xn)0n

S: olarak garanti edebilir miyizE[|Xnμ|3]=o(σ2(Xn))n?

Yana vardır sonlu ikinci anlar ve sonsuz üçüncü anlarla rastgele değişkenler, cevap vurgulayarak olduğunu hiçbir . Bu nedenle, genel olarak, Taylor serisi metodu 3. derece polinomlarda bile başarısız olur . Bu argümanı yinelemek, Taylor dizisi yönteminin, polinomlar için bile , rastgele değişkeninizin tüm anları iyi kontrol edilmediği sürece, doğru sonuçlar vermesini bekleyemeyeceğinizi gösterir .

Ne yapalım peki? Elbette yöntem , desteği bir noktaya yaklaşan sınırlı rastgele değişkenler için işe yarıyor , ancak bu sınıf ilginç olamayacak kadar küçük. Bunun yerine, dizisinin tatmin edici yüksek yoğunluklu bir aileden geldiğini varsayalım (diyelim)Xn

(1)P{|Xnμ|>t}eCnt2

her ve bazı . Bu tür rastgele değişkenler şaşırtıcı şekilde yaygındır. Örneğin, ampirik ortalama olduğundat>0C>0Xn

Xn:=1ni=1nYi

güzel rasgele değişkenlerin (örneğin istatistiksel bağımsız ve sınırlı), çeşitli konsantrasyon eşitsizlikler ima olduğunu tatmin (1). Standart bir bağımsız değişken (. Sahife 10 buraya ) sınırlayan rasgele değişkenler için anlar inci:YiXnp

E[|Xnμ|p](p2Cn)p/2.

Bu nedenle, "yeterince iyi" herhangi bir analitik fonksiyon (aşağıya bakınız) için, üçgen eşitsizliğini kullanarak -term Taylor serisi yaklaşımı üzerindeki hatasınıfEmm

Em:=|E[f(Xn)]p=0mf(p)(μ)p!E(Xnμ)p|1(2Cn)(m+1)/2p=m+1|f(p)(μ)|pp/2p!

zaman . Stirling'in yaklaşımı verdiğinden beri , kesik Taylor serisinin hatasın>C/2p!pp1/2

(2)Em=O(n(m+1)/2) as nwheneverp=0p(1p)/2|f(p)(μ)|<.

Bu nedenle, kuvvetli bir şekilde konsantre olduğunda ve yeterince iyi olduğunda, Taylor serisi yaklaşımı gerçekten doğrudur. (2) 'de ortaya çıkan eşitsizlik, , bu yüzden, özellikle eden durum gerektirdiği bu olan tüm . Bu mantıklı çünkü (1) herhangi bir sınırlılık varsayımı getirmiyor .Xnff(p)(μ)/p!=O(pp/2)fXn

bir tekillik olduğunda neyin yanlış gidebileceğini görelim (whuber'un yorumunu izleyerek). Farz edelim ki . Biz alırsak dan sıfır ile iki arasında kesilmiş dağılım, daha sonra yeterince konsantre edildi ancak her için . Başka bir deyişle, oldukça konsantre, sınırlı rasgele bir değişkenimiz var ve fonksiyon sadece bir tekilliğe sahipken Taylor serisi yöntemi başarısız oluyor.ff(x)=1/xXnNormal(1,1/n)XnE[f(Xn)]=n

Titizlik üzerine birkaç kelime. (2) 'de ortaya çıkan durumun , titiz bir teorem / prova formatında gerekli olan bir deus ex machina yerine türetildiği gibi sunulması daha iyi buluyorum . Argümanı tamamen titiz yapmak için, ilk önce (2) 'deki sağ tarafın

E[|f(Xn)|]i=0|f(p)(μ)|p!E[|Xnμ|p]<

yukarıdan subgaussian anların büyüme hızı ile. Böylece, Fubini'nin teoremi

E[f(Xn)]=i=0f(p)(μ)p!E[(Xnμ)p]

Kanıtın geri kalanı yukarıdaki gibi ilerler.


1
Bunu hızlı bir okumada kaçırmış olabilirim, ancak üçüncü anının yeterince "kontrol altında" olmasını sağladığını (diğer şeylerin yanı sıra) sağladığınızı mı düşünüyorsunuz, o zaman beklentisine makul bir şekilde yaklaşılabilir. [MacLaurin] dizisi ? Endişeliyim çünkü serinin kendisinin yakınsama özelliklerine bir referans görmedim, en azından dağılımının kuyrukları kadar önemli . Xlog(X)logX
whuber

2
@whuber Haklısın; Taylor serisinin ROC'sinde olmak için desteğine ihtiyacınız olacak, bu nedenle, özellikle, kesinlikle, kesinlikle . Bunu yansıtacak şekilde yazıyı güncelleyeceğim. X0<X<2μ
Mike McCoy

2
Hala bir şeyleri özlediğimi düşünüyorum. Örn, kısaltılmış bir Normal dağılımı olduğunda , açıkça "oldukça konsantre", bir ortalama ve neredeyse kesinlikle yakınsaklığı) yarıçapı içindedir. (bu, içeren merkezindeki birim diskin iç kısmında analitik ), ancak sonsuzdur. X(1,1)(0,2)μ=1f(x)=1/x=1/(1(1x))1(0,2μ)E[f(X)]
whuber

1
@gron Küçük bir hata yaptınız. Tüm , türev . Koşul geçerli değil çünküHerhangi bir için . Herhangi bir işlev sağlıyor (2) ayrıca karşılamasını çünkü Ayrıca (2) tutmadığı doğrulayabilir ve dolayısıyla vardır tekillik yok ( bütün bağlantı başına). f(x)=1/x|f(p)(μ)|=p!/μp
(2)=p!p(1p/2)μp
μ>0log(p!f(p)(μ))/pf
Mike McCoy

1
@gron İki şeye ihtiyacınız var: (1) RV'nizin kütük güç serisinin ROC'sini kesinlikle desteklediğinden emin olun (yani, için ) ve (2) RV anlarının yeteri kadar hızlı bir şekilde azaldığından emin olun, yukarıdaki için bir hata tahmini sonludur. Anları nasıl kontrol edeceğinize dair yeni bir soru sormalısınız, çünkü çok fazla karakter alacaktır (ve yeni yollar hakkında merak ediyorum). [0+ε,2με]ε>0Em
Mike McCoy,

10

Cevabım hiçbir yerde diğer cevapların matematiksel karmaşıklık seviyesine yaklaşmasa da, göndermeye karar verdim, çünkü sonucun dediği gibi "olumsuz" olmasına rağmen katkıda bulunacak bir şey olduğuna inanıyorum.

Hafif bir tonda, OP'nin “riskten kaçınma” olduğunu söyleyebilirim (çünkü çoğu insan, bilimin kendisi gibi), çünkü OP , 2. dereceden Taylor serisi genişleme yaklaşımı için yeterli bir koşul gerektirir . kabul edilebilir". Ancak bu gerekli bir durum değildir .

İlk olarak, Kalan'ın beklenen değerinin, OP'nin gerektirdiği gibi, rv'nin varyasyonundan daha düşük bir sıraya sahip olması için gerekli ancak yeterli olmayan bir ön koşul, serinin ilk sırada bir araya gelmesidir. Sadece bir araya gelelim mi? Hayır.

İncelediğimiz genel ifade

E[g(Y)]=fY(y)[i=0g(i)(μ)(yμ)ii!]dy[1]

As Loistl (1976) GEMIGNANI yönettiği "Matematik ve İstatistik" kitabı (1978, s. 170) başvuran devletler, sonsuz toplamın yakınsaması için şart (bir uygulamadır oran testi yakınsaması için)

yμ<|yμ|<limi|(g(i)(μ)g(i+1)(μ)(i+1))|[2]

... , rv'nin ortalamasıdır. Bu da yeterli bir durum olsa da (yukarıdaki ilişki eşitlikle tutulursa oran testi yetersizdir), eşitsizlik diğer yönde tutulursa seriler birbirinden ayrılacaktır.μ

Loistl, , üstel, güç ve logaritma için üç özel işlevsel formu incelemiştir (makalesi, Beklenen Hizmet Programı ve Portföy Seçimi alanındadır, bu nedenle içbükey hizmet işlevini temsil etmek için kullanılan standart işlevsel formları test etmiştir). Bu işlevsel formlar için, yalnızca üstel işlevsel form için, herhangi bir kısıtlama getirilmediğini buldu . Aksine, iktidar ve logaritmik durum için (zaten sahibiz), eşitsizliğin geçerliliğinin ile eşdeğer olduğunu tespit g()yμ0<y[2]

yμ<μ0<y<2μ

Bunun anlamı, eğer değişkenimiz bu aralığın dışında değişirse, genleşme merkezine sahip Taylor genleşmesi değişkenin ortalaması değişecektir.

Yani: bazı fonksiyonel formlar için, fonksiyonunun bir noktasında bir fonksiyonun değeri, bu nokta genleşme merkezinden ne kadar uzakta olursa olsun, onun sonsuz Taylor genleşmesine eşittir. Diğer işlevsel formlar için (logaritma dahil), ilgilenilen nokta seçilen genişleme merkezine biraz "yakın" olmalıdır. Bir rv'miz varsa, bu değişkenin teorik desteğine (veya ampirik olarak gözlenen aralığının incelenmesi) kısıtlama anlamına gelir.

Sayısal örnekler kullanarak Loitl, kesilmeden önce genleşmenin sırasını arttırmanın , yaklaşımın doğruluğu için sorunları daha da kötüleştirebileceğini gösterdi . Ampirik olarak, finansal sektörde gözlenen değişkenlerin zaman serilerinin eşitsizliğin gerektirdiğinden daha büyük değişkenlik gösterdiğini not etmeliyiz. Loitl, Taylor serisi yaklaşım metodolojisinin Portföy Seçim Teorisi ile ilgili olarak tamamen hurdaya çıkarılması gerektiğini savunmaya devam etti.

Geri tepme 18 yıl sonra Hlawitschka'dan (1994) geldi . Buradaki değerli içgörü ve sonuç şuydu:

... her ne kadar bir dizi sonuçta birleşse de, kısmi serilerden herhangi biri hakkında çok az şey söylenebilir; Bir serinin yakınsaması, terimlerin hemen boyut olarak küçültüldüğü veya herhangi bir terimin yoksayılmak için yeterince küçük olduğu anlamına gelmez. Aslında, burada gösterildiği gibi, bir limitin nihayetinde yakınsamaya geçmeden önce bir serinin farklılaştığı görünebilir. Taylor serisinin ilk birkaç terimine dayanan beklenen faydaya moment momenti yaklaşımı kalitesi, sonsuz serinin yakınsaklık özellikleri ile belirlenemez. Bu ampirik bir konudur ve ampirik olarak, burada incelenen fayda fonksiyonlarına iki dakikalık yaklaşımlar portföy seçimi görevi için iyi performans gösterir. Hlawitschka (1994)

Örneğin, Hlawitschka, 2. sıradaki yaklaşımın Taylor serisinin bir araya gelip gelmediğinin "başarılı" olduğunu gösterdi , ancak Lotl'in sonucunu doğruladı, bu yaklaşımın sırasını arttırmanın daha da kötüleşebileceğini doğruladı. Ancak bu başarının bir niteliği var: Portföy Seçiminde, Beklenen Yardımcı Program, menkul kıymetleri ve diğer finansal ürünleri sıralamak için kullanılır . Bu bir olan sıralı ölçü değil kardinal. Ne Hlawitschka bulundu 2.sıra yaklaşımı olmasıdır Yani sıralamasında korunmuş tam değerinden kaynaklanan sıralamasında kıyasla, farklı menkul kıymet ve değilE(g(Y) her zaman, bu kesin değere yeterince yakın olduğu yerlerde nicel sonuçlar vermiştir (bakınız sayfa 718'deki A1 tablosu).

Peki bu bizi nereye bırakıyor? Limbo olarak söyleyebilirim. Hem teoride hem de ampirikte, 2. derece Taylor yaklaşımının kabul edilebilirliğinin eleştirel olarak incelenen belirli fenomenin birçok farklı yönüne dayandığı ve kullanılan bilimsel metodolojinin teorik varsayımlara, kullanılan işlevsel formlara dayandığı anlaşılmaktadır. Serinin gözlenen değişkenliği üzerine ...

Ama bunu olumlu bir şekilde bitirelim: günümüzde bilgisayar gücü birçok şeyin yerine geçiyor. Bu nedenle, teorik veya ampirik bir problem üzerinde çalışsak da, 2. değişkenli yaklaşımın geçerliliğini, değişkenin geniş bir değer aralığı için ucuza simüle edebilir ve test edebiliriz.


8

Gerçek bir cevap değil, işlerin çok iyi olmadığını ve bu sonucu doğrulamak için ekstra hipotezlerin gerekli olduğunu gösteren bir örnek.

, tek tip bir ve normal bir arasında bir karışım olarak tanımlayın , tekdüzen bileşen olasılıkla seçildi ve normal . You have ve onun varyans yakınsak zaman olarak, sonsuza gider eğer yanılmıyorsam.XnU([1n;1n])N(nn1,1n)1n11n=n1nE(Xn)=10n

E(Xn2)=13n2×1n+((nn1)2+1n)×n1n,

Şimdi (ve veya her neyse) tanımlayın . rasgele değişkenleri iyi tanımlanmıştır, ancak tanımlanmadığı için beklenen bir değeri yoktur. hayır ne kadar büyük bir önemi olduğunu.f(x)=1/xf(0)=0f(Xn)

1n1n1xdx
n

Benim sonuç açıkça küresel davranışları ya üzerine hipotezler ihtiyaç vardır veya - daha büyük olasılıkla, daha zarif - yoğunluğu hızları üzerinde sen kadar beklenen değerden olduğunuzda çürür. Bu tür hipotezlerin klasik literatürde (ve hatta ders kitaplarında) bulunabileceğinden eminim, maalesef eğitimim istatistiklerde değildi ve yine de edebiyatla mücadele ediyorum, yine de umarım bu yardımcı olmuştur.fXn

PS. Bu örnek Nick'in cevabına bir karşı örnek değil mi? Kim yanlış o zaman?


1
Tartışmanın daha genel bir ifadesi olmasıdır var ve için sonluE[Xk]k=1,2,3
probabilityislogic

Benim yukarıdaki yorumumun doğru olmadığını düşünüyorum - fonksiyonunun noktasında bir Taylor Serisi açılımı kabul etmesi gerektiği ne olmalı . Sağladığınız örnekte , sürekli olmayan var . Konunun bu aracı düşünüyorum sizin örneğin bir Taylor açılımı edilemez. f(x)x=μf(x)=1xx=0f
olasılık

Bu de olabilir . Sonra yakınsama yarıçapı var ... Sonsuz yakınsama yarıçapına ihtiyacınız olabilir mi ?! Bu güçlü bir gerekliliktir. μ=1
Elvis,

1
Elvis, evet, küresel bir duruma ihtiyacımız var. Temel olarak, geri kalan, dağıtım kuyrukları tarafından ağırlıklandırıldıktan sonra iyi davranmak zorundadır. Son zamanlarda gelen örneğinize benzer bir şey için, buraya , buraya ve buraya bakın .
kardinal

4

Bu tam bir cevap değil, sadece ikinci dereceden yaklaşıma varmanın farklı bir yolu.

Bence gidilecek en iyi yol, bir Taylor serisinin geri kalan terimi ile çalışmak yerine Cauchy'nin ortalama değer teoremini kullanmak olduğunu düşünüyorum. Bir kez uygularsak

f(X)=f(μ)+f(ξ1)(Xμ)

bazı zaman ya da zaman . Şimdi ortalama değer teoremini tekrar veXξ1μXμXξ1μXμf(ξ1)

f(ξ1)=f(μ)+f(ξ2)(ξ1μ)

bazı , veya , . bu ilk fomula içine koyarak verirXξ1ξ2μXμXξ1ξ2μXμ

f(X)=f(μ)+f(μ)(Xμ)+f(ξ2)(ξ1μ)(Xμ)

Bu sonucun yalnızca ve arasında sürekli ve iki kez farklılaştırılmasını gerektirdiğini unutmayın . Bununla birlikte, bu yalnızca sabit bir için geçerlidir ve değiştirilmesi, karşılık gelen bir değişiklik anlamına . İkinci dereceden delta yöntemi , desteğinin tüm aralığı boyunca ve olduğu genel varsayımını yapıyor olarak görülebilir , veya en azından yüksek olasılık kütlesinin bölgesi üzerinde.X μ X X ξ i ξ 1 - μ = 1fXμXXξiξ2=μXξ1μ=12(Xμ)ξ2=μX

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.