Bağımsız lognormal rastgele değişkenlerin toplamı lognormal mı?


11

İki (veya daha fazla) lognormal rasgele değişkenin toplamının neden gözlem sayısını artırdıkça lognormal bir dağılıma yaklaştığını anlamaya çalışıyorum. Çevrimiçi baktım ve bununla ilgili herhangi bir sonuç bulamadım.

Açıkça, ve bağımsız lognormal değişkenler ise, üslerin özellikleri ve gauss rastgele değişkenleri ile, değeri de lognormaldir. Bununla birlikte, de lognormal olduğunu öne sürmek için bir neden yoktur .Y X × Y X + YXYX×YX+Y

ANCAK

İki bağımsız lognormal rasgele değişken ve üretir ve ve bu işlemi birçok kez tekrarlarsanız, dağılımı lognormal görünür. Gözlem sayısını artırdıkça lognormal bir dağılıma yaklaşıyor bile.Y Z = X + Y ZXYZ=X+YZ

Örneğin: 1 milyon çift ürettikten sonra , Z'nin doğal logunun dağılımı aşağıdaki histogramda verilmiştir. Bu, açıkça lognormal olduğunu düşündüren normal bir dağılıma benzemektedir .Z

resim açıklamasını buraya girin

Herkes bunu anlamak için yararlı olabilecek metinler hakkında herhangi bir fikir veya referans var mı?


ve için eşit varyanslar mı düşünüyorsunuz ? Simüle ederseniz , toplamın günlüğü artık çok normal görünmüyor. YXYxx <- rlnorm(1e6,0,3); yy <- rlnorm(1e6,0,1)
Stephan Kolassa

Eşit varyans varsaydım - eşit olmayan varyansla başka bir tane deneyeceğim ve neyle sonuçlandığımı göreceğim.
Patty

2 ve 3 varyansları ile, hala biraz normal görünen bir şey var, küçük bir çarpıklık gibi görünen albiet.
Patty

1
Önceki sorulara bakmak yardımcı olabilir. Burada ve burada potansiyel olarak yararlı makaleler. İyi görünüm!
Stephan Kolassa

Yanıtlar:


20

Lognormallerin toplamlarının bu yaklaşık lognormalitesi iyi bilinen bir başparmak kuralıdır; çok sayıda makalede ve sitedeki bazı yayınlarda belirtilmiştir.

İlk iki anı eşleştirerek toplam lognormal için lognormal bir yaklaşım, bazen Fenton-Wilkinson yaklaşımı olarak adlandırılır.

Bu belgeyi Dufresne tarafından yararlı bulabilirsiniz ( burada veya burada bulunabilir ).

Ayrıca geçmişte bazen insanları Mitchell'in gazetesine yönlendirdim.

Mitchell, RL (1968),
"Günlük-normal dağılımının kalıcılığı."
J. Amerika Optik Topluluğu . 58: 1267-1272'de tarif edilmektedir.

Ama bu şimdi Dufresne'nin referanslarında kapsanıyor.

n

İşte her biri elli bin iid lognormalin toplamının günlüğü olan 1000 simüle değerin bir histogramı :

elli bin lognormalin toplamının histogramı

Gördüğünüz gibi ... kütük oldukça çarpık, bu nedenle toplam lognormal'e çok yakın değil.

nn

* Kaç tane olduğunu anlamaya çalışmadım, ancak toplamların çarpıklığının (eşdeğer olarak ortalamaların) davranışı nedeniyle, birkaç milyon açıkça yetersiz olacak


μ=0σ=4

res <- replicate(1000,sum(rlnorm(50000,0,4)))
hist(log(res),n=100)

(Ben o zamandan beri denedim . Günlüğü hala çok sağ eğri)n=106


Lütfen şekilde histogramı yapmak için kullanılan parametreleri (veya kod snippet'ini) ekleyebilir misiniz?
altroware

1
μμ=0σμ=0σ44
Glen_b-Monica'yı Yeniden Başlat

1
res <- replicate(1000,sum(rlnorm(50000,0,4))); hist(log(res),n=100)26,5

2

Muhtemelen çok geç, ama konuyu kapsayan lognormal dağılımların toplamları hakkında aşağıdaki makaleyi buldum . Lognormal değil, oldukça farklı ve çalışması zor bir şey.


1

Dufresne tarafından 2009 ve bu yararlı makaleyle birlikte 2004'ten önerilen makale , log-normal dağılımın toplamının yaklaşık tarihini kapsamakta ve toplam matematiksel sonuç vermektedir.

μσ

Belki [bu makale] ( http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6029348 ) size belirli bir durumda log-normallerin toplamı için bir tür merkezi limit teoremi verir, ancak hala bir genellik eksikliği. Her neyse Glen_b tarafından verilen örnek gerçekten uygun değil, çünkü klasik merkezi limit teoremini kolayca uygulayabileceğiniz bir durum ve tabii ki bu durumda log-normal toplamı Gaussian.

n


1
Örneğimde "klasik merkezi limit teoremini kolayca uygulayabileceğinizi" söylüyorsunuz, ancak histogramın ne gösterdiğini anlıyorsanız, bu durumda normalde yaklaşık bir değerin n = 50000'e uygulandığını iddia etmek için CLT'yi kullanamazsınız; toplam o kadar doğru eğridir ki kütüğü hala çok doğru eğridir. Örneğin amacı, bir lognormal ile yaklaşık tahmin edilemeyecek kadar eğik olması (veya histogramın simetrik çok yakın görünmesi) idi. Daha az bir çarpıklık yaklaşımı (normal gibi) * daha kötü * /
Glen_b -Restate Monica

Katılıyorum, ancak muhtemelen örnekte ya numunenin sayısal yakınsamasına ulaşılamamıştır (1000 deneme çok azdır) veya istatistiksel yakınsamaya ulaşılamamıştır (50.000 ekleme çok azdır), ancak sonsuzluk sınırında dağılım Gauss olmak, CLT koşullarındayız, değil mi?
Mimì

1000 numune, toplamın dağılımının şeklini ayırt etmek için fazlasıyla yeterlidir - aldığımız örneklerin sayısı şekli değiştirmez, onu ne kadar "açıkça" gördüğümüz anlamına gelir. Daha büyük bir örnek alırsak, bu açık çarpıklık ortadan kalkmayacak, sadece daha pürüzsüz görünecek. Evet, 50.000 toplamın normal görünmesi için çok az - kütüğün hala çok eğik görünmesi için o kadar doğru eğim. Makul bir şekilde normal görünmeden önce milyonlarca insan gerekebilir. Evet, CLT kesinlikle geçerlidir; iid ve varyans sonludur, bu yüzden standartlaştırılmış araçlar sonunda normale yaklaşmalıdır.
Glen_b

1

Lognormal yasa fiziksel fenomenlerde yaygın olarak bulunur, örneğin bir sistemin herhangi bir ölçekleme davranışını incelemek için bu tür değişken dağılımların toplamı gereklidir. Bu makaleyi biliyorum (çok uzun ve çok güçlü, eğer specilist değilseniz başlangıç ​​anlaşılabilir!), "2003'te yayınlanan" lognormal rasgele değişkenlerin toplamında geniş dağıtım etkileri ", Systems 32, 513) ve https://arxiv.org/pdf/physics/0211065.pdf adresinden edinilebilir .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.