Sonlu ve sonsuz değişkenlik arasındaki fark nedir

33

Sonlu ve sonsuz varyans arasındaki fark nedir? İstatistik bilgilerim oldukça basit; Wikipedia / Google burada pek yardımcı olmadı.

variance intuition partial-moments

— AfterWorkGuinness
kaynak

8

Sonsuz değişkenlikteki dağılımlar ağır kuyrukludur ; çok fazla aykırı var ve görmek için kullanılandan farklı özelliklere sahip olabilir. Örneğin, bir Cauchy dağılımından çekilen örneklerin örnek ortalaması , tek tek örneklerle aynı (Cauchy) dağılıma sahiptir. Bu, örnek ortalamanın herhangi bir bireysel örneklemden daha iyi bir "tahmin edici" olduğu inancından oldukça farklıdır.

— Dilip Sarwate

4

Hayır, ağır kuyruklu , sınırsız varyansa sahip değil ya da en azından benim görüşüme göre değil. Ancak, bir istatistikçi değilim ve bu yüzden bu forumdaki en üst düzey kullanıcılardan daha güvenilir bir cevap beklemelisiniz.

— Dilip Sarwate

4

Sınırsız varyans, popülasyon varyansını tanımlayan integral (toplam), limit alındıkça sınırlanmış sınırların ötesinde arttığında gerçekleşir. Örneklerden bazıları tartışma burada

— Glen_b -Reinstate Monica

2

En önemlisi, çoğu merkezi limit teoreminin böyle bir popülasyon için tutamayacağı ve bazı ortak sonuçların çökeceğini düşünüyorum.

— Henry.L 13:15

1

Önemli nokta: Bir varyansı ise nüfus sonsuzdur, ancak varyansı numunesi sonlu, sonra böyle bir örnek istatistiği kullanılarak halkın varyans veya standart sapma herhangi tahmini

s^{2}

$s^{2}$ veya

s

$s$ , ardından

\frac{s}{\sqrt{n}}

$\frac{s}{\sqrt{n}}$ fena halde önyargılı olacak. Pek çok test istatistiği, etkinin tahmini bir standart hatası üzerinden normalize edilmiş bir etki ölçüsüne dayandığından ve pek çok CI, tahmin edilen bir standart hata ile ölçeklendirmeye dayandığından, bu, sonsuz varyansa sahip değişkenler hakkındaki istatistiksel çıkarımın muhtemel olacağıanlamına gelir.fena halde önyargılı olmak.

— Alexis

48

$\DeclareMathOperator{\E}{E} \DeclareMathOperator{\var}{var}$ Rasgele bir değişkenin "sonsuz değişkenliğe" sahip olması ne anlama gelir? Rasgele bir değişkenin sonsuz beklentiye sahip olması ne anlama gelir? Her iki durumda da açıklama oldukça benzerdir, bu nedenle beklenti durumuyla başlayalım ve ondan sonra farklılık gösterelim.

sürekli rastgele bir değişken (RV) olmasına izin verin (sonuçlarımız daha genel olarak geçerli olacaktır, kesikli durumlar için integralleri toplamla değiştirin). Sergilemeyi kolaylaştırmak için, olduğunu varsayalım . $X$ $X \ge 0$

Bu beklenti integral ile tanımlanır bu integral bulunduğunda, yani sonludur. Aksi takdirde, beklentinin mevcut olmadığını söyleriz. Bu uygunsuz bir integraldir ve tanımı gereği

E X = \int_{0}^{\infty} x f (x) d x

$\E X = \int_0^\infty x f(x) \, d x$

bu sınır sonlu olması için, kuyruk katkı sıfır olmalıdır olduğunu biz olmalıdır

\int_{0}^{\infty} x f (x) d x = lim_{bir \to \infty} \int_{0}^{bir} x f (x) d x

$\int_0^\infty x f(x) \, d x = \lim_{a \rightarrow \infty} \int_0^a x f(x) \, d x$

Durum için olması gereken (ancak yeterli olmayan) bir koşul

. Yukarıda gösterilen durumun söylediği,(sağdaki) kuyruktan beklentiyeolankatkının ortadan kalkması gerektiğidir. Öyle değilse, beklenti, keyfi bir şekilde yüksek gerçekleşen değerlerin katkılarıyla belirlenir. Uygulamada, bu, ampirik araçların çok dengesiz olacağı anlamına gelecektir, çünkünadiren gerçekleşen çok büyük değerler tarafından yönetilecek

lim_{bir \to \infty} \int_{bir}^{\infty} x f (x) d x = 0

$\lim_{a \rightarrow \infty} \int_a^\infty x f(x) \, d x =0$

lim_{x \to \infty} x f (x) = 0

$\lim_{x\rightarrow \infty} x f(x) =0$ . Ve örnek araçların bu dengesizliğinin büyük örneklerle birlikte kaybolmayacağını unutmayın — bu modelin yerleşik bir parçasıdır!

Çoğu durumda, bu gerçekçi görünmüyor. Bir (hayat) sigorta modeli diyelim, , bazı (insan) ömürleri için modeller. Bunu biliyoruz ki, oluşmuyor, ancak pratikte üst sınırı olmayan modeller kullanıyoruz. Sebep açık: Zor bir üst sınır bilinmemektedir, eğer bir kişi 110 yaşındaysa, bir yıl daha yaşayamaz! Bu yüzden sert üst sınırı olan bir model yapay görünüyor. Yine de aşırı üst kuyruğun çok fazla etkisinin olmasını istemiyoruz. $X$ $X > 1000$

Eğer sınırlı bir beklentisi varsa, o zaman modeli etkilemeden modeli zor bir üst limite değiştirebiliriz. Bulanık bir üst sınırı olan durumlarda iyi görünüyor. Modelin sonsuz beklentisi varsa, modele getirdiğimiz herhangi bir üst sınırın çarpıcı sonuçları olacaktır! Sonsuz beklentinin asıl önemi budur. $X$

Sonlu beklenti ile üst sınırlar konusunda bulanık olabiliriz. Sonsuz beklenti ile yapamayız .

Şimdi, sonsuz değişkenlik, mutatis mutandi için de aynı şey söylenebilir.

Daha açık yapmak için, bir örnek görelim. Örneğin, Pareto dağıtımını, R paketinde (CRAN'da) actuar'da pareto1 olarak kullanıyoruz - tek parametreli Pareto dağılımı, Pareto tip 1 dağılımı olarak da bilinir. tarafından verilen olasılık yoğunluk fonksiyonuna sahiptir. olan bazı parametreler için. Tümbeklenti mevcut ve verilir

f (x) = {\begin{cases} \frac{α m^{α}}{x^{α + 1}} & , x \geq m \\ 0 & , x < m \end{cases}

$f(x) = \begin{cases} \frac{\alpha m^\alpha}{x^{\alpha+1}} &, x\ge m \\ 0 &, x<m \end{cases}$

m > 0, α > 0

$m>0, \alpha>0$

α > 1

$\alpha > 1$

. Ne zaman

beklenti yapmak yok ya dediğimiz gibi tanımlayarak ayrılmaz sonsuza yakınsar, bunun nedeni, sonsuzdur. İlk moment dağılımınıtanımlayabiliriz(postyazınabakınız. Bazı bilgiler ve referanslar içinkuantiller ve ortanca yerine ne zaman tantiles ve medial kullanırız?)

\frac{α}{α - 1} \cdot m

$\frac{\alpha}{\alpha-1}\cdot m$

α \leq 1

$\alpha \le 1$

(bu beklentinin kendisinde olup olmadığına bakılmaksızın var olur). (Daha sonra düzenleme: "İlk an dağılımı" ismini icat ettim, daha sonra bunun "resmi" olanlarınkısmi anlarile ilgili olduğunu öğrendim).

E (M) = \int_{m}^{M} x f (x) d x = \frac{α}{α - 1} (m - \frac{m^{α}}{M^{α - 1}})

$E(M) = \int_m^M x f(x) \, d x = \frac{\alpha}{\alpha-1} \left( m - \frac{m^\alpha}{M^{\alpha-1}} \right)$

Beklenti olduğunda ( ), $\alpha> 1$ zamansadece bir küçük beklenti "zar zor var", böylece, bir beklenti tanımlayan yekpare yavaş yakınsayacağı, bir daha büyük bit. ile örneğe bakalım

E r (M) = E (m) / E (\infty) = 1 - {(\frac{m}{M})}^{α - 1}

$Er(M) = E(m)/E(\infty) = 1-\left(\frac{m}{M}\right)^{\alpha-1}$

α

$\alpha$

. Ardından

R'nin yardımıyla çizelim:

m = 1, α = 1.2

$m=1, \alpha=1.2$

E r (M)

$Er(M)$

### Function for opening new plot file:
open_png  <-  function(filename) png(filename=filename,
                                     type="cairo-png")

library(actuar) # from CRAN
### Code for Pareto type I distribution:
# First plotting density and "graphical moments" using ideas from http://www.quantdec.com/envstats/notes/class_06/properties.htm   and used some times at cross validated

m  <-  1.0
alpha <- 1.2
# Expectation:
E   <-  m * (alpha/(alpha-1))
# upper limit for plots:
upper  <- qpareto1(0.99, alpha, m)   
#
open_png("first_moment_dist1.png")
Er  <- function(M, m, alpha) 1.0 - (m/M)^(alpha-1.0)
### Inverse relative first moment distribution function,  giving
#   what we may call "expectation quantiles":
Er_inv  <-   function(eq, m, alpha) m*exp(log(1.0-eq)/(1-alpha))     

plot(function(M) Er(M, m, alpha), from=1.0,  to=upper)
plot(function(M) ppareto1(M, alpha, m), from=1.0,  to=upper, add=TRUE,  col="red")
dev.off()

Bu arsa üreten:

$\mu$ $\alpha > 2$

Yukarıda tanımlanan Er_inv işlevi, nicel fonksiyona bir analog olan, ters bağıl ilk moment dağılımıdır. Sahibiz:

> ### What this plot shows very clearly is that most of the contribution to the expectation come from the very extreme right tail!
# Example   
eq  <-  Er_inv(0.5, m, alpha)
ppareto1(eq, alpha, m)
eq

> > > [1] 0.984375
> [1] 32
>

$\mu$ $n=5$

set.seed(1234)
n  <-  5
N  <-  10000000  # Number of simulation replicas
means  <-  replicate(N,  mean(rpareto1(n, alpha, m) ))


> mean(means)
[1] 5.846645
> median(means)
[1] 2.658925
> min(means)
[1] 1.014836
> max(means)
[1] 633004.5
length(means[means <=100])
[1] 9970136

Okunabilir bir çizim elde etmek için, sadece numunenin çok büyük bir kısmı olan 100'ün altındaki değerlere sahip numuneler için histogramı gösteriyoruz.

open_png("mean_sim_hist1.png")
hist(means[means<=100],  breaks=100, probability=TRUE)
dev.off()

Aritmetik araçların dağılımı çok eğridir,

> sum(means <= 6)/N
[1] 0.8596413
>

ampirik araçların neredeyse% 86'sı teorik ortalamadan beklentiden daha az ya da eşittir. Beklememiz gereken şey budur, çünkü ortama olan katkının çoğu, çoğu örnekte temsil edilmeyen aşırı üst kuyruktan gelir .

Daha önceki sonucumuzu yeniden değerlendirmek için geri dönmeliyiz. Ortalamanın varlığı üst sınırlar hakkında bulanıklaşmayı mümkün kılarken, bunu görüyoruz. "ortalama ancak zorlukla var" olduğunda, integralin yavaşça yakınsak olduğu anlamına geldiğini, gerçekten de üst sınırlar için bu kadar bulanık olamayacağımızı görüyoruz . Yavaşça yakınsak integraller, beklentinin var olduğunu varsaymayan yöntemleri kullanmanın daha iyi olabileceği sonucuna varmıştır . İntegral çok yavaş bir şekilde birleştiğinde, pratikte hiç birleşmemiş gibi pratiktedir. Bir yakınsak integralden sonra elde edilen pratik faydalar, yavaş yakınsak durumda bir kimeradır! Bu, NN Taleb'in http://fooledbyrandomness.com/complexityAugust-06.pdf'deki sonucunu anlamanın bir yoludur.

— kjetil b halvorsen
kaynak

2

Harika cevap

— Karl

2

Varyans, rastgele bir değişkenin değerlerinin dağılımının dağılımının ölçüsüdür. Bu tek önlem değil, örneğin ortalama mutlak sapma alternatiflerden biri.

Sonsuz varyans, rastgele değerlerin ortalamanın etrafında çok sıkı bir şekilde yoğunlaşma eğiliminde olmadığı anlamına gelir . Bir sonraki rasgele sayının ortalamanın çok uzağında olması için yeterince büyük bir olasılık olduğu anlamına gelebilir.

Normal (Gaussian) gibi dağılımlar, ortalamanın çok uzağında rasgele sayılar üretebilir, ancak bu tür olayların olasılığı , sapmanın büyüklüğü ile çok hızlı bir şekilde azalır .

Bu bakımdan, Cauchy dağılımının ya da Gaussian (normal) dağılımın grafiğine baktığınızda, görsel olarak çok farklı görünmüyorlar. Bununla birlikte, Cauchy dağılımının varyansını hesaplamaya çalışırsanız, Gaussian'ın sonlu olduğu halde, sonsuz olacaktır. Bu nedenle normal dağılım, Cauchy'lere kıyasla ortalamasının üzerinde daha sıkı.

BT, eğer matematikçilerle konuşursanız, Cauchy dağılımının iyi tanımlanmış bir anlamı olmadığı, sonsuz olduğu konusunda ısrar edecekler. Bu, Cauchy'nin simetrik olduğu gerçeğine işaret eden fizikçilere saçma geliyor, bu nedenle, bir anlamı olması şart. Bu durumda, sorunun Cauchy'nin dağılımıyla değil, sizin tanımınızla olduğunu savunuyorlardı.

— Aksakal
kaynak

2

\infty

$\infty$

- \infty

$-\infty$

1

@kjetilbhalvorsen, "hiçbir matematikçi Cauchy'nin sonsuz anlamına gelmediğini söyleyemez" - bu tam olarak tanımlanmamış demek, istatistik profesörümün söylediği tam anlamıyla değil; "elbette sıfır, ve eğer aynı fikirde değilsen, demek istediğin tanımında bir sorun var"

— Aksakal

Ona ortalamanın tanımını sordunuz mu?

— kjetil b halvorsen

@kjetilbhalvorsen, Riemann integralinden bahsediyorsanız, matematik prof. Onun argümanı, Riemann toplamında, belirli bir miktar ya da toplamın bölümlenmesi sırasını tanımlamamanızdır, bu nedenle toplamınız sonsuz olacaktır. Fizikçiler nokta bir simetri, açıkça, "sıfır olması gerekiyor"

— Aksakal

1

O zaman belki ortalamayı tanımladı, medyanı tanımladığını söyleyebilirsin.

— kjetil b halvorsen

2

Bakmanın alternatif bir yolu da nicel işlevdir.

S (F (x)) = x

$Q(F(x)) = x$

O zaman bir anı veya beklentiyi hesaplayabiliriz

E (T (x)) = \int_{- \infty}^{\infty} T (x) f (x) d x

$E(T(x)) = \int_{-\infty}^\infty T(x) f(x) dx\\$

$f(x)dx = dF$

E (T (x)) = \int_{0}^{1} T (S (F)) d F

$E(T(x)) = \int_{0}^1 T(Q(F)) dF \\$

$T(x) = x$ . Aşağıdaki resimde bu, F ile dikey çizginin arasındaki alana karşılık gelir . $x=0$ (Sol taraftaki alan ne zaman negatif olarak sayılabilir? $T(x)<0$ ). İkinci an, aynı alanın hat boyunca döndürüldüğünde süpürdüğü hacme karşılık gelir. $x=0$ (bir faktör ile $\pi$ fark).

Resimdeki eğriler, her bir nicelinin hesaplamaya ne kadar katkıda bulunduğunu göstermektedir.

Normal eğri için büyük bir katkısı olan sadece çok az miktar vardır. Fakat Cauchy eğrisi için büyük katkısı olan daha birçok nicelik var. Eğer eğri $T(Q(F))$ F sıfıra ya da birine yaklaştığında sonsuzluğa yeterince hızlı gider, o zaman alan sonsuz olabilir.

Bu sonsuzluk çok tuhaf olmayabilir, çünkü integrandin kendisi mesafe (ortalama) veya kare mesafe (varyans) sonsuz olabilir. Bu sadece ne kadar ağırlık , ne kadar F, yüzde sonsuz kuyrukların olduğu bir sorudur .

Sıfırdan (ortalama) uzaklığın veya ortalamadan (varyanstan) kare mesafenin toplanmasında / bütünleşmesinde, çok uzakta olan tek bir nokta, ortalama mesafeyi (veya kare mesafeyi) yakınlardaki bir çok noktadan daha fazla etkileyecektir.

Bu yüzden sonsuzluğa doğru hareket ettiğimizde yoğunluk düşebilir, ancak bazı (artan) miktarların, örneğin uzaklık veya kare mesafenin toplamı üzerindeki etki mutlaka değişmez.

Belirli bir mesafedeki her kütle miktarı için $x$ bir mesafede yarım veya daha fazla kütle var $\sqrt{2}x$ o zaman toplam kütlenin toplamını elde edersiniz. $\sum \frac{1}{2^n}$ birleşecektir çünkü kütlenin katkısı azalır, ancak bu katkı azalmadığından sapma sonsuz olur $\sum ((\sqrt{2}x)^n)^2 \frac{1}{2^n} \to \infty$

— Sextus Empiricus
kaynak

1

Karşılaştığınız çoğu dağıtım muhtemelen sonlu varyansa sahiptir. İşte ayrık bir örnek $X$ Bu sonsuz varyansa sahip ancak sonlu demek:

Olasılık kütle fonksiyonu olsun $p(k) = c/|k|^3$ , için $k \in \mathbb{Z} \setminus\{0\}$ , $p(0) = 0$ , nerede $c = (2\zeta(3))^{-1} := (2\sum_{k=1}^\infty 1/k^3)^{-1} < \infty$ . Her şeyden önce çünkü $\mathbb{E} \mid X\mid < \infty$ sonlu ortalamaları vardır. Ayrıca sonsuz varyansa sahiptir çünkü $2 \sum_{k=1}^\infty k^2 / |k|^3 = 2\sum_{k=1}^\infty k^{-1} = \infty$ .

Not: $\zeta(x) :=\sum_{k=1}^\infty k^{-x}$ Riemann zeta işlevidir. Başka pek çok örnek var, yazmak çok hoş değil.

— John Jiang
kaynak

4

Dağıtım (yani eşit bir fonksiyonu) simetriktir diye, yok değil mutlaka ortalama yapmak

0

$0$ ; Toplam olmayabilir, çünkü toplam / integral biçimden çıkıyor

\infty - \infty

$\infty - \infty$

— Dilip Sarwate