Sonlu ve sonsuz varyans arasındaki fark nedir? İstatistik bilgilerim oldukça basit; Wikipedia / Google burada pek yardımcı olmadı.
Sonlu ve sonsuz varyans arasındaki fark nedir? İstatistik bilgilerim oldukça basit; Wikipedia / Google burada pek yardımcı olmadı.
Yanıtlar:
Rasgele bir değişkenin "sonsuz değişkenliğe" sahip olması ne anlama gelir? Rasgele bir değişkenin sonsuz beklentiye sahip olması ne anlama gelir? Her iki durumda da açıklama oldukça benzerdir, bu nedenle beklenti durumuyla başlayalım ve ondan sonra farklılık gösterelim.
sürekli rastgele bir değişken (RV) olmasına izin verin (sonuçlarımız daha genel olarak geçerli olacaktır, kesikli durumlar için integralleri toplamla değiştirin). Sergilemeyi kolaylaştırmak için, X ≥ 0 olduğunu varsayalım .
Bu beklenti integral ile tanımlanır bu integral bulunduğunda, yani sonludur. Aksi takdirde, beklentinin mevcut olmadığını söyleriz. Bu uygunsuz bir integraldir ve tanımı gereği ∫ ∞ 0 x f ( x )
Çoğu durumda, bu gerçekçi görünmüyor. Bir (hayat) sigorta modeli diyelim, , bazı (insan) ömürleri için modeller. Bunu biliyoruz ki, X > 1000 oluşmuyor, ancak pratikte üst sınırı olmayan modeller kullanıyoruz. Sebep açık: Zor bir üst sınır bilinmemektedir, eğer bir kişi 110 yaşındaysa, bir yıl daha yaşayamaz! Bu yüzden sert üst sınırı olan bir model yapay görünüyor. Yine de aşırı üst kuyruğun çok fazla etkisinin olmasını istemiyoruz.
Eğer sınırlı bir beklentisi varsa, o zaman modeli etkilemeden modeli zor bir üst limite değiştirebiliriz. Bulanık bir üst sınırı olan durumlarda iyi görünüyor. Modelin sonsuz beklentisi varsa, modele getirdiğimiz herhangi bir üst sınırın çarpıcı sonuçları olacaktır! Sonsuz beklentinin asıl önemi budur.
Sonlu beklenti ile üst sınırlar konusunda bulanık olabiliriz. Sonsuz beklenti ile yapamayız .
Şimdi, sonsuz değişkenlik, mutatis mutandi için de aynı şey söylenebilir.
Daha açık yapmak için, bir örnek görelim. Örneğin, Pareto dağıtımını, R paketinde (CRAN'da) actuar'da pareto1 olarak kullanıyoruz - tek parametreli Pareto dağılımı, Pareto tip 1 dağılımı olarak da bilinir. F ( x ) = { α m α tarafından verilen olasılık yoğunluk fonksiyonuna sahiptir. m>0,α>0 olan bazı parametreler içinx<m. Tümα>1beklenti mevcut ve verilira
Beklenti olduğunda ( ), E r ( M ) = E ( m ) / E ( ∞ ) = 1 - ( m zamanαsadece bir küçük beklenti "zar zor var", böylece, bir beklenti tanımlayan yekpare yavaş yakınsayacağı, bir daha büyük bit. M=1ile örneğe bakalım,
### Function for opening new plot file:
open_png <- function(filename) png(filename=filename,
type="cairo-png")
library(actuar) # from CRAN
### Code for Pareto type I distribution:
# First plotting density and "graphical moments" using ideas from http://www.quantdec.com/envstats/notes/class_06/properties.htm and used some times at cross validated
m <- 1.0
alpha <- 1.2
# Expectation:
E <- m * (alpha/(alpha-1))
# upper limit for plots:
upper <- qpareto1(0.99, alpha, m)
#
open_png("first_moment_dist1.png")
Er <- function(M, m, alpha) 1.0 - (m/M)^(alpha-1.0)
### Inverse relative first moment distribution function, giving
# what we may call "expectation quantiles":
Er_inv <- function(eq, m, alpha) m*exp(log(1.0-eq)/(1-alpha))
plot(function(M) Er(M, m, alpha), from=1.0, to=upper)
plot(function(M) ppareto1(M, alpha, m), from=1.0, to=upper, add=TRUE, col="red")
dev.off()
Bu arsa üreten:
Yukarıda tanımlanan Er_inv işlevi, nicel fonksiyona bir analog olan, ters bağıl ilk moment dağılımıdır. Sahibiz:
> ### What this plot shows very clearly is that most of the contribution to the expectation come from the very extreme right tail!
# Example
eq <- Er_inv(0.5, m, alpha)
ppareto1(eq, alpha, m)
eq
> > > [1] 0.984375
> [1] 32
>
set.seed(1234)
n <- 5
N <- 10000000 # Number of simulation replicas
means <- replicate(N, mean(rpareto1(n, alpha, m) ))
> mean(means)
[1] 5.846645
> median(means)
[1] 2.658925
> min(means)
[1] 1.014836
> max(means)
[1] 633004.5
length(means[means <=100])
[1] 9970136
Okunabilir bir çizim elde etmek için, sadece numunenin çok büyük bir kısmı olan 100'ün altındaki değerlere sahip numuneler için histogramı gösteriyoruz.
open_png("mean_sim_hist1.png")
hist(means[means<=100], breaks=100, probability=TRUE)
dev.off()
Aritmetik araçların dağılımı çok eğridir,
> sum(means <= 6)/N
[1] 0.8596413
>
ampirik araçların neredeyse% 86'sı teorik ortalamadan beklentiden daha az ya da eşittir. Beklememiz gereken şey budur, çünkü ortama olan katkının çoğu, çoğu örnekte temsil edilmeyen aşırı üst kuyruktan gelir .
Daha önceki sonucumuzu yeniden değerlendirmek için geri dönmeliyiz. Ortalamanın varlığı üst sınırlar hakkında bulanıklaşmayı mümkün kılarken, bunu görüyoruz. "ortalama ancak zorlukla var" olduğunda, integralin yavaşça yakınsak olduğu anlamına geldiğini, gerçekten de üst sınırlar için bu kadar bulanık olamayacağımızı görüyoruz . Yavaşça yakınsak integraller, beklentinin var olduğunu varsaymayan yöntemleri kullanmanın daha iyi olabileceği sonucuna varmıştır . İntegral çok yavaş bir şekilde birleştiğinde, pratikte hiç birleşmemiş gibi pratiktedir. Bir yakınsak integralden sonra elde edilen pratik faydalar, yavaş yakınsak durumda bir kimeradır! Bu, NN Taleb'in http://fooledbyrandomness.com/complexityAugust-06.pdf'deki sonucunu anlamanın bir yoludur.
Varyans, rastgele bir değişkenin değerlerinin dağılımının dağılımının ölçüsüdür. Bu tek önlem değil, örneğin ortalama mutlak sapma alternatiflerden biri.
Sonsuz varyans, rastgele değerlerin ortalamanın etrafında çok sıkı bir şekilde yoğunlaşma eğiliminde olmadığı anlamına gelir . Bir sonraki rasgele sayının ortalamanın çok uzağında olması için yeterince büyük bir olasılık olduğu anlamına gelebilir.
Normal (Gaussian) gibi dağılımlar, ortalamanın çok uzağında rasgele sayılar üretebilir, ancak bu tür olayların olasılığı , sapmanın büyüklüğü ile çok hızlı bir şekilde azalır .
Bu bakımdan, Cauchy dağılımının ya da Gaussian (normal) dağılımın grafiğine baktığınızda, görsel olarak çok farklı görünmüyorlar. Bununla birlikte, Cauchy dağılımının varyansını hesaplamaya çalışırsanız, Gaussian'ın sonlu olduğu halde, sonsuz olacaktır. Bu nedenle normal dağılım, Cauchy'lere kıyasla ortalamasının üzerinde daha sıkı.
BT, eğer matematikçilerle konuşursanız, Cauchy dağılımının iyi tanımlanmış bir anlamı olmadığı, sonsuz olduğu konusunda ısrar edecekler. Bu, Cauchy'nin simetrik olduğu gerçeğine işaret eden fizikçilere saçma geliyor, bu nedenle, bir anlamı olması şart. Bu durumda, sorunun Cauchy'nin dağılımıyla değil, sizin tanımınızla olduğunu savunuyorlardı.
Bakmanın alternatif bir yolu da nicel işlevdir.
O zaman bir anı veya beklentiyi hesaplayabiliriz
. Aşağıdaki resimde bu, F ile dikey çizginin arasındaki alana karşılık gelir . (Sol taraftaki alan ne zaman negatif olarak sayılabilir? ). İkinci an, aynı alanın hat boyunca döndürüldüğünde süpürdüğü hacme karşılık gelir. (bir faktör ile fark).
Resimdeki eğriler, her bir nicelinin hesaplamaya ne kadar katkıda bulunduğunu göstermektedir.
Normal eğri için büyük bir katkısı olan sadece çok az miktar vardır. Fakat Cauchy eğrisi için büyük katkısı olan daha birçok nicelik var. Eğer eğri F sıfıra ya da birine yaklaştığında sonsuzluğa yeterince hızlı gider, o zaman alan sonsuz olabilir.
Bu sonsuzluk çok tuhaf olmayabilir, çünkü integrandin kendisi mesafe (ortalama) veya kare mesafe (varyans) sonsuz olabilir. Bu sadece ne kadar ağırlık , ne kadar F, yüzde sonsuz kuyrukların olduğu bir sorudur .
Sıfırdan (ortalama) uzaklığın veya ortalamadan (varyanstan) kare mesafenin toplanmasında / bütünleşmesinde, çok uzakta olan tek bir nokta, ortalama mesafeyi (veya kare mesafeyi) yakınlardaki bir çok noktadan daha fazla etkileyecektir.
Bu yüzden sonsuzluğa doğru hareket ettiğimizde yoğunluk düşebilir, ancak bazı (artan) miktarların, örneğin uzaklık veya kare mesafenin toplamı üzerindeki etki mutlaka değişmez.
Belirli bir mesafedeki her kütle miktarı için bir mesafede yarım veya daha fazla kütle var o zaman toplam kütlenin toplamını elde edersiniz. birleşecektir çünkü kütlenin katkısı azalır, ancak bu katkı azalmadığından sapma sonsuz olur
Karşılaştığınız çoğu dağıtım muhtemelen sonlu varyansa sahiptir. İşte ayrık bir örnek Bu sonsuz varyansa sahip ancak sonlu demek:
Olasılık kütle fonksiyonu olsun , için , , nerede . Her şeyden önce çünküsonlu ortalamaları vardır. Ayrıca sonsuz varyansa sahiptir çünkü.
Not: Riemann zeta işlevidir. Başka pek çok örnek var, yazmak çok hoş değil.