Bir değişkenin standart sapması 0 ise korelasyon nedir?


15

Anladığım kadarıyla, denklemi kullanarak kovaryansı normalleştirerek korelasyon elde edebiliriz

ρi,j=cov(Xi,Xj)σiσj

burada σi=E[(Xiμi)2] ait standart sapmaXi.

Endişem, standart sapma sıfıra eşitse? Sıfır olamayacağını garanti eden herhangi bir koşul var mı?

Teşekkürler.


11
Standart sapma 0'a sahip hiçbir değişken muhtemelen başka (sabit olmayan) bir değişkenle ilişkilendirilemez. Korelasyon, bir değişkendeki büyük / küçük değerlerin başka bir değişkendeki büyük / küçük değerlere nasıl karşılık geldiğinin bir ölçüsüdür - değişkenlerden biri olasılık 1 (standart sapma 0'a sahip olmanın bir sonucu) ile bir sabite eşitse, o zaman ' t Diğer değişkenin küçük mü yoksa büyük mü olduğu hakkında bilgi vermesi. Sözleşmenin ne olduğunu bilmiyorum ama bu durumda korelasyon 0 olarak tanımlanmış gibi görünüyor.
Makro

Çok teşekkürler Macro. Bence senin fikrin aşağıdaki cevapla aynı. Ancak, puanlardaki sınırlama nedeniyle yorumunuzu oylayamadım. Teşekkürler.
chepukha

4
Zaten bir cevabı kabul ettiniz, bu yüzden sadece bir yorum yazacağım. Bir rastgele değişken standart sapma σ Y = 0 ise , o zaman diğer herhangi bir rastgele değişken X için cov ( X , Y ) = E [ ( X - μ X ) ( Y - μ Y ) ] = 0 ( ( Y - μ Y ) = olasılık 1 ile 0YσY=0
cov(X,Y)=E[(XμX)(YμY)]=0
X(YμY)=01). Böylece korelasyon katsayısının tanımlanması belirsiz bir form verir0ρX,Y=cov(X,Y)σXσY . Bu konvansiyoneldirtanımlamakρX,Y,eşit olacak şekilde, 0, bu durumda, ve bu sınır değeri temelinde savunulabilirρX,Y,olarakσY0vs00 ρX,Y0ρX,YσY0
Dilip Sarwate

6
@Dilip, eğer bir cevapsa cevap olarak gitmeli. Bir cevabın zaten kabul edilip edilmemesi önemli değil.
Andy W

1
@Dilip 0 ile ilgili sorun biçimi, bir sınırlama işlemi aracılığıyla belirli bir değere sahip olunabilse bile, değerinsınırınasılaldığınızabağlı olmasıdır. Bu nedenle,ρX,Y=0argümanıeksiktir (ve ikna edici değildir). Bu sözleşmeyi kabul eden ve geçerli bir sebeple destekleyen bir kaynak gösterebilir misiniz? 00ρX,Y=0
whuber

Yanıtlar:


14

SD'lerinizden biri 0 ise, bu denklemin tanımsız olduğu doğrudur. Bununla birlikte, bunu düşünmenin daha iyi bir yolu, SD'lerinizden biri 0 ise, korelasyon olmadığıdır. Gevşek kavramsal terimlerle, bir korelasyon size bir değişkenin diğer değişken hareket ederken nasıl hareket ettiğini anlatır. 0 SD'si, değişkenin 'hareket etmediği' anlamına gelir. Gibi bir sabitin vektörüne sahip olmanız gerekir rep(constant, n_times).


Çok teşekkürler. Bence bu mantıklı. Bu durumdan bahseden herhangi bir ders kitabı görmem ilginçti.
chepukha

@gung Yani korelasyon katsayısı tanımında bir sınırlama var, yani korelasyon denkleminin iki değeri olabilir, biri yukarıdaki denklemde ve 0 değişkenlerden birinin
SD'si

@ sanırım.
gung - Monica'yı eski

2

Düşünülmesi gereken diğer bir şey, araçlar ve standart sapmalar ve korelasyonlar hakkında konuşurken temel varsayımlardır.

Bir veri örneğinden bahsediyorsak, yaygın bir varsayım, verilerin (en azından yaklaşık olarak) normal olarak dağıtıldığı veya (örneğin bir günlük dönüşümü yoluyla) dönüştürülebileceğidir. Standart bir sıfır sapması gözlemlerseniz, iki senaryo vardır: ya standart sapma aslında sıfır değildir, ancak çok küçüktür ve bu nedenle sahip olduğunuz veri kümesinin ortalama değerde olan örnekleri vardır (bu, örneğin, verileri kaba bir hassasiyet düzeyinde ölçüyorsanız); ya da model yanlış yazılmış.

Bu ikinci senaryoda, standart sapma ve dolayısıyla korelasyon anlamsız bir ölçüttür.

Daha genel olarak, korelasyonun geçerli bir kavram olabilmesi için temel dağılımların hem sonlu ikinci momentlere hem de sıfır olmayan standart sapmalara sahip olması gerekir.


Orijinal sorunun verilerle değil, (teorik) dağılımlarla ilgili olduğunu belirtmek gerekir.
whuber

Durum böyleyse, standart bir sıfır sapması, sadece ortalama (yani sabit fonksiyon) ölçüsünde dejenere bir dağılım anlamına gelecektir ... yine standart sapma sadece altta yatan dağılımın normal olduğu anlamına gelir. Standart sapma sıfırsa, Gaussian'ın PDF'si doğru şekilde tanımlanmamıştır ve bu nedenle modelde izin verilmez.
tdc

Yorumunuzda Gauss'ların ortaya çıkmasına şaşırdım Tom. Bu gereksiz bir kısıtlama gibi görünüyor. Bir pdf'in varlığını zorunlu kılmak da kısıtlayıcı görünmektedir (sonuçta, hiçbir ayrık dağıtımın pdf'si yoktur). Ayrıca, ikinci moment sonlu olduğunda SD'nin iyi tanımlanmış - "anlamlı" - olduğuna dikkat edin ve buna olasılık atomları ("Dirac delta" fonksiyonlarınız) dahildir.
whuber

Tamam, muhtemelen aşırı kısıtlayıcı olduğunu kabul ediyorum, ancak genel olarak insanlar SD tarafından kastedilen budur. örneğin Wolfram'dan: "Sonlu ilk iki an ile herhangi bir dağılım için standart sapma tanımlanabilir, ancak altta yatan dağılımın normal olduğunu varsaymak en yaygın olanıdır." Gerçi, değişkenlerden biri için SD = 0 ise, istatistiksel korelasyon kavramının altında yatan temel varsayımların karşılanmadığını mı düşünüyorsunuz?
tdc

Evet, Tom, son ifaden yerinde ve memnuniyetle kabul ediyorum. Bununla birlikte, ifade ettiği fikir cevabınızda çok belirgin görünmüyor; oradaysa, normal dağılımlar, günlükler, delta fonksiyonları ve dağılımların kendisinden ziyade verilere odaklanma ile ilgili açıklamalara gömülür. BTW, Wolfram sitesinde görünen istatistiksel ifadelere dikkat edilmelidir: matematiksel o kadar yoğun bir şekilde yönlendirilir ki, istatistiksel uygulama ile ilgili karakteristikleri sorgulanabilir. Burada hata var: SD kullanımı Normal dağıtım ayarlarının çok ötesine geçiyor.
whuber

2

Bir korelasyon, iki vektör arasındaki açının kosinüsüdür. Y için standart sapmanın sıfır olduğunu söylemek, Y-ortalaması (Y) vektörünün sıfır (ya da daha titizlikle, uygun vektör uzayında sıfırı temsil ettiğini) söylemekle aynıdır. Böylece soru "Sıfır vektör ile X-ortalaması (X) vektörü arasındaki açının (kosinüsü) hakkında ne söylenebilir?" Olur. Daha genel olarak, bir iç ürün ile herhangi bir vektör uzayında, sıfır vektör ve başka bir vektör arasındaki açı ile kastedilen nedir? Bence bunun tek bir cevabı var ve bu durumda "açı" kavramı anlamsız, dolayısıyla bu durumda korelasyon kavramı anlamsız.


0

Feragatname, kabul edilmiş bir kalite cevabı olduğunu fark ediyorum, bu yüzden bu bir yanıt olmalı, ancak buna izin verecek deneyim puanım yok. @Dilip, korelasyonu konvansiyon için 0 olarak tanımlayabileceğinizi belirtti, ancak bu gerçekten sorunlu görünüyor (sıfır olmayan SD'lerle) gerçekten sıfır olan bir korelasyondan çok farklı bir yorumu olacak. Orijinal soru "bir değişkenin SD'si sıfırsa" diyor. Eğer durup 'değişken' tanımını düşünürsek, cevaba çok daha doğrudan bir yol alırız. 0 SD olan bir değişken hiç bir değişken değildir, sabittir. Bu durumda iki değişkeniniz yoktur, bu nedenle kavramsal olarak hiç bir korelasyon tanımlamak mantıklı değildir.


Yorum yapmak için yeterli puanınız yoksa cevaplarla yorum yapmamalısınız.
Michael R.Chernick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.