Eklem dağılımı çok değişkenli normalse neden Pearson ρ sadece kapsamlı bir ilişki ölçüsüdür?


Yanıtlar:


15

Değerler keyfi olarak yeniden ölçeklendiğinde ve yeniden girildiğinde aynı kalan tüm özelliklerden oluşan çok değişkenli bir dağıtımdaki "ilişkilendirme ölçüsü" nü anlamak en iyisi olabilir . Bunu yapmak, araçları ve varyansları teorik olarak izin verilen herhangi bir değere değiştirebilir (varyanslar pozitif olmalıdır; araçlar herhangi bir şey olabilir).

Korelasyon katsayıları ("Pearson ") daha sonra çok değişkenli bir Normal dağılımı tamamen belirler. Bunu görmenin bir yolu, yoğunluk fonksiyonu veya karakteristik fonksiyon için formüller gibi herhangi bir formül tanımına bakmaktır. Sadece araçlar, varyanslar ve kovaryanslar içerirler - ancak varyansları bildiğinizde kovaryanslar ve korelasyonlar birbirinden çıkarılabilir.ρ

Çok değişkenli Normal ailesi, bu mülke sahip olan tek dağıtım ailesi değildir. Örneğin, herhangi bir Çok Değişkenli t dağılımı ( aşan serbestlik dereceleri için ) iyi tanımlanmış bir korelasyon matrisine sahiptir ve ayrıca ilk iki anı tarafından tamamen belirlenir.2


Burada uyguladığınız tanıma göre kovaryansın bir birliktelik ölçüsü olmayacağı doğru mudur? Varyanslar genişledikçe genişleme eğilimi göstereceğinden.
user1205901 - Monica'yı eski durumuna döndür

2
Bu doğru. Kovaryans açık bir şekilde bir ilişki ölçüsü ile ilgili olsa da, kendisi de değildir çünkü diğer faktörlerden de etkilenir.
whuber

19

Değişkenler Pearson korelasyonunun tamamen kör olduğu şekillerde ilişkilendirilebilir.

Çok değişkenli normalde, Pearson korelasyonu mümkün olan tek ilişkinin ile endekslenmesi anlamında "kapsamlı" dır.ρ. Ancak diğer dağılımlar için (normal marjlı olanlar için bile), korelasyon olmadan ilişki olabilir. İşte 3 normal rasgele değişkeni (x, y ve x, z) içeren bir kaç grafik; son derece ilişkilidirler (eğer banax-değişken, size diğer ikisini anlatacağım ve eğer bana y Sana söyleyebilirim z), ancak hepsi ilişkisizdir.

resim açıklamasını buraya girin

İlişkili ancak ilişkisiz değişkenlerin başka bir örneği:

resim açıklamasını buraya girin

(Burada verilerle göstermeme rağmen temel nokta dağıtımlar hakkındadır.)

Değişkenler korelasyon dahi, genel olarak Pearson korelasyon size gelmez nasıl - aynı Pearson korelasyonuna sahip çok farklı ilişkilendirme biçimleri alabilirsiniz, (ancak değişkenler çok değişkenli olduğunda, size söylersem standartlaştırılmış değişkenlerin tam olarak nasıl ilişkili olduğunu söyleyebileceğiniz korelasyon).

Bu nedenle Pearson korelasyonu, değişkenlerin ilişkilendirilme yollarını "tüketmez" - ilişkilendirilebilir, ancak ilişkisiz olabilir veya ilişkilendirilebilir ancak oldukça farklı şekillerde ilişkilendirilebilir. [İlişkinin tamamen korelasyonla yakalanma yollarının çeşitliliği oldukça büyüktür - ancak herhangi biri olursa, çok değişkenli bir normaliniz olamaz. Ancak, tartışmamdaki hiçbir şeyin bununρ olası ilişkilendirmeyi tanımlar) başlık alıntısı bunu önerse bile çok değişkenli normal karakterize eder.]

(Çok değişkenli ilişkiyi ele almanın yaygın bir yolu copulastır. Sitede copulas ile ilgili çok sayıda soru vardır; bazılarını yararlı bulabilirsiniz)


Bu tür dağılımlarla gerçek dünya verileri var mı?

@What Normal dağılımlardan elde edilen gerçek dünya verileri var mı? Şüpheliyim, bu yüzden (marjinallerim diyagramlarda normal olduğundan) hemen "hayır" cevabını verecektir. Örneklerin amacı, rasgele değişkenler arasındaki ilişkinin neden bazen varsayıldığı kadar basit olmadığını göstermek (insanların ilişkiyi ölçmek için Pearson korelasyonunu ne sıklıkla hesaplıyor?) Ve ayrıca normal marjlara sahip olmanın ve çok değişkenli olduğunu belirtmekti. normal farklıdır. Pearson korelasyonunun olup biteni yakalamadığı çok gerçek örnekler kesinlikle gerçekleşir.
Glen_b

Bir an için dağılımlar hakkında konuşmayalım. Bir nokta bulutundan korelasyonları hesapladığımızda, buluttaki noktaların bazı "hata" nedeniyle saptığı altta yatan "geometrik olarak şekillendirilmiş" (doğrusal, hiperbolik, logaritmik, sinüs vb.) İdeal korelasyon olduğunu varsayıyoruz. Şimdi gördüğüm tüm ideal şekiller gerçek verilerden soyutlanmış, sürekli (aralıksız) ve her zaman en az bir eksen boyunca (örneğin, dairesel değil) artmaktadır. Veri bilgim sınırlıdır, bu yüzden korelasyonu sürekli olmayan veya dairesel olan gerçek dünya verileri olup olmadığını merak ediyordum.

Örneğin, eğer çizersem iki nokta bulutu gibi görünecek veriler olabilir. Bu verilerdeki korelasyonları körü körüne hesaplarsam, bir tane bulabilirim, (ya da öyle söylendi), arsa açık bir şekilde, eğer hesaba katılırsam, sahte ilişkiyi çözecek bazı bilinmeyen karıştırıcı değişkenin eksik olduğunu gösteriyor. veri. Profesör "x" veya "y" şeklindeki örneklerinize baksaydı, bana iki farklı veri alt kümesinin karıştığını söylerdi.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.