sezgisi (geometrik veya diğer)


19

Varyansın temel kimliğini düşünün:

Var(X)=E[(XE[X])2]=...=E[X2](E[X])2

Merkezi bir moment tanımının merkezi olmayan momentlere basit bir cebirsel manipülasyonudur.

'un diğer bağlamlarda uygun şekilde manipülasyonuna izin verir . Ayrıca, ortalamanın hesaplanması ve daha sonra varyansın hesaplanması için, iki geçiş yerine veri üzerinden tek bir geçiş yoluyla varyansın hesaplanmasına izin verir.Var(X)

Fakat bu ne anlama geliyor ? Bana göre, yayılımın yaklaşık 0'a yayılma ortalaması ile ilgili olan anında geometrik bir sezgi yoktur. tek bir boyutta bir set olduğu için, bir ortalama etrafındaki yayılımı, başlangıçtaki yayılma alanı ile kare arasındaki fark olarak nasıl görüyorsunuz? anlamına gelmek?X

Bu kimliğe bakış açısı kazandıracak iyi doğrusal cebir yorumları veya fiziksel yorumlar veya başka şeyler var mı?


7
İpucu: Bu Pisagor Teoremi.
whuber

1
@Matthew " " nin ne anlama geldiğini merak ediyorum . Bunun bir beklenti değil , aritmetik ortalama için kısayol olduğunu düşünüyorum. Aksi takdirde denklemler yanlış olur (ve neredeyse anlamsızdır, çünkü rastgele değişkenleri sayılarla eşitlerler). E
whuber

2
@whuber iç ürünler mesafeler ve açılar fikrini ve tanıtmak beri gerçek değerli rastgele değişkenlerin vektörü alanı iç çarpımı olarak tanımlanır (?) bazı geometrik sezgi yoluyla verilebilir eğer, acaba üçgen eşitsizliği. Nasıl ilerleyeceğime dair hiçbir fikrim yok, ama bunun bir anlamı olup olmadığını merak ediyordum. E[XY]
Antoni Parellada

1
@Antoni Üçgen eşitsizliği çok genel. Bir iç ürün çok daha özel bir nesnedir. Neyse ki, uygun geometrik sezgi tam olarak Öklid geometrisidir. Dahası, rastgele değişkenler ve durumunda bile , gerekli geometri ve tarafından üretilen iki boyutlu gerçek vektör uzayıyla , yani Öklid düzleminin kendisiyle sınırlandırılabilir . Mevcut örnekte bir RV gibi görünmüyor: sadece bir vektörü. Burada, ve ile yayılan alan tüm geometrinin gerçekleştiği Öklid düzlemidir. Y X Y X n X ( 1 , 1 , , 1 )XYXYXnX(1,1,,1)
whuber

3
ayarı yapmak ve tüm terimleri bölmek (isterseniz), varyans için tam cebirsel çözümü verecektir: her şeyi tekrar kopyalamak için bir neden yoktur. Yani en yüzünden aritmetik ortalamasıdır , nereden sadece buradan tanımlandığı gibi katı varyans, olduğu kere kare aritmetik ortalaması ve olduğu kere kare değerlerinin aritmetik ortalaması. , n β 0y| | y - y | | 2n| | y | | 2n| | y| | 2nβ^1=0nβ^0y||yy^||2n||y^||2n||y||2n
whuber

Yanıtlar:


21

Yorumlarda @ whuber'in noktasını genişleterek, ve dikey ise, Pisagor Teoremine sahipsiniz :ZYZ

Y2+Z2=Y+Z2

Dikkate bu geçerli olan iç çarpım ve , bu iç ürünün neden olduğu normdur .Y,ZE[YZ]Y=E[Y2]

Let rastgele değişken olsun. Let , Let . Eğer ve ortogonaldir:XY=E[X]Z=XE[X]YZ

Y2+Z2=Y+Z2E[E[X]2]+E[(XE[X])2]=E[X2]E[X]2+Var[X]=E[X2]

Ve bu iç ürünün altında ve in dik olduğunu göstermek kolaydır :Y=E[X]Z=XE[X]

Y,Z=E[E[X](XE[X])]=E[X]2E[X]2=0

Üçgenin bacaklarından biri , diğer bacak ve hipotenüs . Ve Pisagor teoremi uygulanabilir, çünkü demeaned rastgele değişken ortalamasına diktir.XE[X]E[X]X


Teknik açıklama:

YBu örnekteki gerçekten vektörü , yani skaler sabit vektörün katından (ör. ayrık, sonlu sonuç durumunda). bir vektör çıkıntı arasında sabit vektör üzerine .Y=E[X]111 1 = [ 1 , 1 , 1 , , 1 ] Y X 1E[X]11=[1,1,1,,1]YX1

Basit Örnek

olduğu bir Bernoulli rasgele değişkeni olduğu durumu düşünün . Sahibiz:p = .2Xp=.2

X=[10]P=[.2.8]E[X]=iPiXi=.2

Y=E[X]1=[.2.2]Z=XE[X]=[.8.2]

Ve resim: resim açıklamasını buraya girin

Kırmızı vektörün kare büyüklüğü varyansı , mavi vektörün kare büyüklüğü ve sarı vektörün kare büyüklüğü .E [ X ] 2 E [ X 2 ]XE[X]2E[X2]

UNUTMAYIN bu büyüklükleri, diklik vb ... Her zamanki nokta ürüne göre olmadığını gerçi ama iç çarpım . Sarı vektörün büyüklüğü 1 değil, .2'dir.i P i Y i Z iiYiZiiPiYiZi

Kırmızı vektör ve mavi vektör iç ürünün altında diktir ama dik değiller , lise geometri duygusu. Unutmayın, normal ürün olarak iç ürün olarak kullanmadığımızı unutmayın!Z = X - E [ X ] i P i Y i Z i i Y i Z iY=E[X]Z=XE[X]iPiYiZiiYiZi


Bu gerçekten iyi!
Antoni Parellada

1
İyi cevap (+1), ancak bir rakamı yok ve aynı zamanda OP için biraz kafa karıştırıcı olabilir, çünkü
Z'niz

@ MatthewGunn, harika cevap. ortogonalitenin Öklid anlamda olduğu bir temsil için aşağıdaki cevabımı kontrol edebilirsiniz.
YBE

Geniş olmaktan nefret ediyorum, ama , ve mantığın yönünü düz tutmakta zorlanıyorum ('çünkü' bana mantıklı olmayan yerlerde geliyor). Pek çok (iyi kanıtlanmış) gerçek rasgele belirtilmiş gibi geliyor. İç ürün hangi alanda? Neden 1 ? V a r ( X )ZVar(X)
Mitch

@Mitch Mantıksal sıra: (1) Bir olasılık uzayının bir vektör uzayını tanımladığını gözlemleyin; rastgele değişkenleri vektör olarak ele alabiliriz. (2) ve rasgele değişkenlerinin iç çarpımını olarak tanımlayın . Bir iç çarpım uzayında, ve vektörleri , iç çarpımları sıfırsa dik olarak tanımlanır. (3a) rastgele bir değişken olsun. (3b) ve . (4) Bu şekilde tanımlanan ve dik olduğunu gözlemleyin . (5) ve beriZ E [ Y Z ] Y Z X Y = E [ X ] Z = X - E [ X ] Y Z Y ZYZE[YZ]YZXY=E[X]Z=XE[X]YZYZdik, pisagor teoremi geçerlidir (6) Basit cebir ile Pisagor teoremi kimliğe eşdeğerdir.
Matthew Gunn

8

Çok özel bir senaryo için tamamen geometrik bir yaklaşım benimseyeceğim. Şimdi olasılıkları olan değerlerini alan ayrık değerli rastgele değişken ele . Ayrıca, bu rastgele değişkenin içinde bir vektör, . X{x1,x2}(p1,p2)R2X=(x1p1,x2p2)resim açıklamasını buraya girin

Uyarı uzunluğu kare bu olan eşittir . Böylece, .Xx12p1+x22p2E[X2]X=E[X2]

Yana , vektörün ucu , aslında bir elips izler. ve ve olarak yeniden görmek daha kolay hale gelir . Bu nedenle, ve .p1+p2=1Xp1p2cos2(θ)sin2(θ)p1=cos(θ)p2=sin(θ)

Elips çizmenin bir yolu , Arşimet Trammel adlı bir mekanizmadır . Wiki'de anlatıldığı gibi: Dikey kanallar veya raylar ile sınırlandırılmış ("trammelled") iki mekik ve çubuk boyunca sabit pozisyonlarda pivotlarla mekiklere bağlanan bir çubuktan oluşur. Servisler her biri kanalı boyunca ileri geri hareket ettikçe, çubuğun ucu eliptik bir yolda hareket eder. Bu ilke aşağıdaki şekilde gösterilmiştir.

Şimdi dikey mekik ve yatay mekik bir açısı oluşturacak şekilde bu trammelin bir örneğini geometrik olarak analiz edelim . Yapım nedeniyle, ve , (burada olduğu varsayılır).ABθ|BX|=x2|AB|=x1x2θx1x2

resim açıklamasını buraya girin

Çubuğa dik olan bir çizgi çizelim. Biri . Bu belirli rastgele değişken için Bu nedenle, dikey mesafeKökten çubuğa kadar aslında standart sapmaya eşittir .OC|OC|=(x1x2)sin(θ)cos(θ)

Var(X)=(x12p1+x22p2)(x1p1+x2p2)2=x12p1+x22p2x12p12x22p222x1x2p1p2=x12(p1p12)+x22(p2p22)2x1x2p1p2=p1p2(x122x1x2+x22)=[(x1x2)p1p2]2=|OC|2
|OC|σ

Biz dan parçasının uzunluğunu hesaplamak ise için : CX

|CX|=x2+(x1x2)cos2(θ)=x1cos2(θ)+x2sin2(θ)=x1p1+x2p2=E[X]

OCX üçgeninde Pisagor Teoremini uygulayarak, ile sonuçlanır

E[X2]=Var(X)+E[X]2.

Özetlemek gerekirse , , değerlerini alan olası tüm ayrık değerli rasgele değişkenleri tanımlayan bir trammel için başlangıç ​​noktasından mekanizmanın ucuna olan mesafe ve standart sapma çubuğa dik mesafedir.{x1,x2}E[X2]σ

Not : zaman Uyarı bu olan veya , tamamen deterministik. Ne zaman is biz maksimum varyans ile bitirmek.θ0π/2Xθπ/4


1
+1 Güzel cevap. Ve vektörleri olasılıkların karesiyle çarpmak, olağan olasılıklı ortogonallik kavramını dik görünmesini sağlamak için havalı / kullanışlı bir numaradır!
Matthew Gunn

Harika grafikler. Simgelerin hepsi mantıklı (bir elipsi tanımlayan trammel ve daha sonra Pisagor Thm geçerlidir) ama bir şekilde anları nasıl 'sihirli bir şekilde' ilişkilendirdiğini (yayılma ve merkez) nasıl sezgisel olarak anlamıyorum.
Mitch

trammeli olası tüm değerli rastgele değişkenleri tanımlayan bir süreç olarak düşünün . Çubuk yatay veya dikey olduğunda belirleyici bir RV'ye sahip olursunuz. Ortada rastgelelik vardır ve önerilen geometrik çerçevemde bir RV'nin (std) tam olarak çubuğun başlangıç ​​noktasına olan uzaklığıyla ne kadar rastgele ölçüldüğü ortaya çıkmaktadır. Eliptik eğriler matematikteki çeşitli nesneleri birbirine bağladığı için burada daha derin bir ilişki olabilir ama matematikçi değilim, bu yüzden bu bağlantıyı gerçekten göremiyorum. (x1,x2)
YBE

3

Aşağıdaki gibi yeniden düzenleyebilirsiniz:

Var(X)=E[X2](E[X])2E[X2]=(E[X])2+Var(X)

Ardından, aşağıdaki gibi yorumlayın: rastgele bir değişkenin beklenen karesi, ortalamasının karesine artı ortalamasından beklenen kare sapmasına eşittir.


Ah. Huh. Basit. Ancak kareler hala yorumlanmamış gibi görünüyor. Demek istediğim, kareler olmadan mantıklı (biraz gevşek).
Mitch

3
Ben bunun üzerinde satılmadım.
Michael R.Chickick

1
Pisagor teoremi geçerliyse, hangi kenarlara sahip üçgen nedir ve iki bacak nasıl diktir?
Mitch

1

Ayrıntılı bir cevap verme ve uygun bir cevap sağlama yeteneğine sahip olmadığım için üzgünüm, ancak cevabın fiziksel klasik mekanik anlar kavramı, özellikle 0 merkezli "ham" anlar ve ortalama merkezli merkezi anlar arasındaki dönüşümde olduğunu düşünüyorum. Varyansın rastgele bir değişkenin ikinci derece merkezi momenti olduğunu unutmayın.


1

Genel sezgi, bu anları, iki anın dik ve üçüncünün hipotenüs olduğunu göstererek, uygun şekilde tanımlanmış bir vektör uzayında Pisagor Teoremi (PT) kullanarak ilişkilendirebileceğinizdir. Gereken tek cebir, iki bacağın gerçekten dik olduğunu göstermektir.

Aşağıdakiler uğruna, tam dağılım anlarından ziyade hesaplama amaçlı örnek araçlar ve varyanslar demek istediğinizi varsayacağım. Yani:

E[X]=1nxi,mean,first central sample momentE[X2]=1nxi2,second sample moment (noncentral)Var(X)=1n(xiE[X])2,variance,second central sample moment

(tüm toplamlar öğenin üzerindedir ).n

Referans için, temel kanıtı sadece sembol basmaktır: Var(X)=E[X2]E[X]2

Var(X)=1n(xiE[X])2=1n(xi22E[X]xi+E[X]2)=1nxi22nE[X]xi+1nE[X]2=E[X2]2E[X]2+1nnE[X]2=E[X2]E[X]2

Burada çok az anlam var, sadece cebirin temel manipülasyonu. un toplamın içinde sabit olduğunu fark edebilir , ama bu onunla ilgilidir.E[X]

Şimdi vektör uzayında / geometrik yorumlamada / sezgide göstereceğimiz, PT'ye karşılık gelen biraz yeniden düzenlenmiş denklemdir.

Var(X)+E[X]2=E[X2]

Bu nedenle , örneği olan içindeki bir vektör olarak düşünün . Ve iki vektör ve .XnRnE[X]1XE[X]1

vektörü , koordinatlarının her biri gibi numunenin ortalamasına sahiptir.E[X]1

Vektör olduğunu .XE[X]1x1E[X],,xnE[X]

İki vektörün nokta çarpımı 0 olduğu için bu iki vektör diktir:

E[X]1(XE[X]1)=E[X](xiE[X])=(E[X]xiE[X]2)=E[X]xiE[X]2=nE[X]E[X]nE[X]2=0

Yani iki vektör diktir, yani sağ üçgenin iki ayağıdır.

Daha sonra PT ( ) tarafından, iki bacağın uzunluklarının karelerinin toplamı hipotenüsün karesine eşittir.Rn

Üstteki sıkıcı cebirsel kanıtta kullanılan aynı cebirle, nin hipotenüs vektörünün karesi olduğunu elde ettik :E[X2]

(XE[X])2+E[X]2=...=E[X2] burada kare, nokta çarpımdır (ve gerçekten ve , .E[x]1(XE[X])2Var(X)

Bu yorumla ilgili ilginç kısım, tek değişkenli bir dağılımdan öğenin bir örneğinden boyutunda bir vektör uzayına dönüşümdür . Bu benzer gerçekten iki örnek olarak yorumlanmasını değişkenli örnekleri değişkenleri.nnnn

Bu yeterli olan bir anlamda, vektörlerden ve den sağ üçgen hipotnenüs olarak ortaya çıkar. Bu değerler için bir yorum (vektörler) verdik ve karşılık geldiğini gösterdik. Bu yeterince havalı, ancak istatistiksel veya geometrik olarak aydınlatıcı. Gerçekten neden söylemiyordu ve en başta, zaten başlangıçta sahip olduğumuz tamamen cebirsel kanıtı yeniden üretmek için çok fazla ekstra kavramsal makine olurdu.E[X2]

Bir başka ilginç kısım, ortalama ve varyansın, sezgisel olarak merkezi ölçtükleri ve bir boyutta yaydıklarına rağmen, boyutlarında diktir . Bu dik olduklarının anlamı nedir? Bilmiyorum! Dikey olan başka anlar var mı? Bu dikliği içeren daha geniş bir ilişki sistemi var mı? merkezi anlar mı, merkezi olmayan anlar mı? Bilmiyorum!n


Ayrıca yüzeysel olarak benzer önyargı varyans tolerans denkleminin arkasındaki bir yorum / sezgi ile ilgileniyorum. Orada ipucu var mı?
Mitch

Let devletin olasılık olmak meydana. Eğer o olduğunu, basitçe arasında nokta ürün ve ile bölünen . Eğer Bir iç ürün olarak kullanılabilir, ne ( ) temel olarak bölünmesiyle nokta ürün . Tüm bu Pisagor yorumunun hala belirli bir iç ürün (bir olasılık ölçüsü için klasik nokta ürününe cebirsel olarak yakın olsa da)piipi=1nipiXiYi=1niXiYiE[XY]XYnipi=1nE[XY]=ipiXiYinE[XY]Pöyle ki ). ipi=1n
Matthew Gunn

Btw, @YBE'nin yaptığı hile ve gibi vektörleri ve . Sonra nokta ürün . ve , (iç ürün olarak kullandığım şey) karşılık gelir. Y x i=xix^y^y i=xix^i=xipix y =Σixiy^i=xipi x y e[X-Y]x^y^=ixipiyipi=ipixiyi=E[xy]x^y^E[xy]
Matthew Gunn
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.