Değişkenlerin log-dönüşümünden önce veya sonra korelasyon alınması


9

Günlük dönüşümlerini almadan önce veya sonra iki rastgele değişken X ve Y için pearson korelasyonunun hesaplanıp hesaplanmayacağına dair genel bir prensip var mı? Hangisinin daha uygun olduğunu test etmek için bir prosedür var mı? Log dönüşümü doğrusal olmadığı için benzer fakat farklı değerler verirler. Günlükten sonra X veya Y'nin normale yakın olup olmadığına bağlı mı? Eğer öyleyse, bu neden önemli? Ve bu, X ve Y üzerinde log (X) ve log (Y) 'ye karşı bir normallik testi yapması gerektiği ve pearson (x, y)' nin pearson (log (x), log ( y))?


@vinux'un güzel bir cevabı var ve korelasyondaki normalliğin rolünü anlamak için bilgilendirici bir bağlantı sağlıyor. Sadece bu soruya işaret etmek istedim: stats.stackexchange.com/questions/298 ki bu, günlüklerin regresyonda ne yaptığını anlamak için çok iyi.
gung - Monica'yı eski durumuna getirin

Yanıtlar:


5

Çünkü günlük(X) ve günlük(Y) verilerin tekdüze dönüşümleri X ve Y, Spearman'ın sıralama korelasyonunu kullanmayı da seçebilirsiniz (ρS) ve verilerinizi dönüştürme konusunda endişelenmeyin, alacağınız gibi ρS(X,Y)=ρS(günlük(X),günlük(Y))


4

Korelasyon (pearson) iki sürekli değişken arasındaki doğrusal ilişkiyi ölçer. (X, Y) veya (log X, log Y) için böyle bir seçenek yoktur. İlişkilerin anlaşılması için değişkenlerin dağılım grafiği kullanılabilir.

Aşağıdaki bağlantı normallik konusunda cevap verebilir. bağlantı


-3

Pearson korelasyonu parametrik test içindir ve parametirc dışı testten daha güçlüdür. Dolayısıyla, parametrik olmayan prosedürlerden önce dönüşümü kullanmayı tercih ediyoruz. Verilerinizi dönüştürün ve inci korelasyonu alın. Bu kadar.


@ abi: Örnek büyüklüğüne bağlı olarak, Spearman ve Kendall'ın katsayıları güç ve MSE açısından normal olarak dağıtılmış verilerle Pearson'a nispeten benzerdir ve küçük veri kirlenmesinden bile çok daha üstündür.
Patrick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.