Ortalama merkezleme kovaryansı azaltır mı?


11

İki bağımsız olmayan rasgele değişkenim olduğunu ve çok fazla "sinyal" kaybetmeden aralarındaki kovaryansı olabildiğince azaltmak istediğimi varsayarsak, ortalama merkezleme yardımcı olur mu? Ortalama merkezlemenin korelasyonu önemli bir faktör azalttığı bir yerde okudum, bu yüzden kovaryans için de aynısını yapması gerektiğini düşünüyorum.

Yanıtlar:


30

Eğer ve rastgele değişkenler ve vardır ve sabit ise, o zaman Merkezleme ve özel durumudur , bu nedenle merkezleme kovaryansı etkilemez.XYab

Cov(X+a,Y+b)=E[(X+aE[X+a])(Y+bE[Y+b])]=E[(X+aE[X]E[a])(Y+bE[Y]E[b])]=E[(X+aE[X]a)(Y+bE[Y]b)]=E[(XE[X])(YE[Y])]=Cov(X,Y).
a=E[X]b=E[Y]


Ayrıca, korelasyon o görebilir dolayısıyla özellikle korelasyon da merkezlemeden etkilenmez.

Corr(X,Y)=Cov(X,Y)Var(X)Var(Y),
Corr(X+a,Y+b)=Cov(X+a,Y+b)Var(X+a)Var(Y+b)=Cov(X,Y)Var(X)Var(Y),


Hikayenin nüfus versiyonu buydu. Örnek sürüm aynıdır: arasındaki kovaryans tahminimiz olarak Eşleştirilmiş bir örnekten , ardından ve

Cov^(X,Y)=1ni=1n(Xi1nj=1nXj)(Yi1nj=1nYj)
XY(X1,Y1),,(Xn,Yn)
Cov^(X+a,Y+b)=1ni=1n(Xi+a1nj=1n(Xj+a))(Yi+b1nj=1n(Yj+b))=1ni=1n(Xi+a1nj=1nXjnna)(Yi+b1nj=1nYjnnb)=1ni=1n(Xi1nj=1nXj)(Yi1nj=1nYj)=Cov^(X,Y)
için herhangi ve .ab


Detaylı cevap için teşekkürler. Örnek kovaryans için örnek boyutunun da herhangi bir etkisi olmadığı anlamına mı geliyor? yani numune boyutunun küçültülmesi numune kovaryansını azaltmaz mı?
lvdp

3
@lvdp Bu muhtemelen ayrı bir soru olmalı.
Biriktirme

Azalan örnek boyutu yalnızca farklı bir örnekle gelebilir. Farklı bir örnek farklı kovaryans gösterebilir. Ancak örnek kovaryansı ortalama olarak tanımlandığından, örnek boyutu prensipte ölçeklenir.
Nick Cox

5

Kovaryans tanımı ve ise . Sentezleme formül l'de olduğu ortalanmış versiyonu . Yani kovaryansı aldığımızda ortalıyoruz ve merkezleme idempotent bir operatördür; bir değişken merkezlendiğinde, merkezleme işlemini daha sonra uygulamak değişmez. Formül değişkenlerin ortalanmış versiyonlarını almadıysa, sıcaklık ile başka bir değişken arasındaki kovaryans, santigrat veya Kelvin cinsinden sıcaklığı ölçmemize bağlı olarak farklı garip etkiler olur.XYE[(XE[X])(YE[Y])]XE[X]X XXX


3

"bir yerlerde" güvenilmez bir kaynak olma eğilimindedir ...

Kovaryans / korelasyon açık merkezleme ile tanımlanır . Verileri ortalamazsanız, kovaryans / korelasyon hesaplamıyorsunuz demektir. (Tam olarak: Pearson korelasyonu)

Temel fark, teorik bir modele (örneğin, beklenen değerin tam olarak 0 olması gerekir) veya verilere (aritmetik ortalama) dayalı olarak merkezlenmenizdir. Aritmetik ortalamanın, herhangi bir farklı merkezden daha küçük Kovaryans sağlayacağını görmek kolaydır.

Bununla birlikte, daha küçük kovaryans, daha küçük korelasyon veya tersi anlamına gelmez. Varsayalım ki veriler X = (1,2) ve Y = (2,1). Aritmetik ortalama merkezleme ile bunun mükemmel negatif korelasyon sağlayacağını görmek kolaydır, ancak üretim sürecinin ortalama 0 ürettiğini bilersek, veriler aslında pozitif korelasyonludur. Bu örnekte, merkezliyoruz - ancak teorik olarak beklenen 0 değeri ile.

Bu kolayca ortaya çıkabilir. Hücreler -5 ila +5 arasında olan 11x11'lik bir sensör dizimiz olduğunu düşünün. Aritmetik ortalamayı almak yerine, sensör olaylarının korelasyonunu ararken sensör dizimizin "fiziksel" ortalamasını kullanmak mantıklıdır (0 ila 10 arasındaki hücreleri numaralandırırsak, 5'i sabit ortalama olarak kullanırdık, ve aynı sonuçları alacağız, böylece indeksleme seçimi analizden kaybolur - güzel).


Teşekkürler @ Anony-Mousse, örnek kovaryans örnek boyutuna bağlı olacak mı? Daha küçük örnek boyutu daha küçük kovaryans sağlayacaktır (merkezlemeden önce).
lvdp

1
Açıkça örnek bağlıdır. Ortalama olarak - bilmiyorum. Daha küçük örneklerin daha fazla değişkenliğe sahip olmasını beklerdim, bu yüzden belki daha sık daha aşırı değerler. Ama bu sadece bir sezgi.
ÇIKIŞ - Anony-Mousse
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.