Spearman korelasyonunun Pearson'dan kesin bir miktar az olması ne anlama gelir?


12

Bir grup ilgili veri setim var. Çiftleri arasındaki pearson korelasyonları tipik olarak mızrakçı korelasyonlarından kesinlikle daha büyüktür. Bu, herhangi bir korelasyonun doğrusal olduğunu gösterir, ancak pearson ve mızrakçı aynı olsa bile beklenebilir. Pearson ve mızrakçı korelasyonu arasında kesin bir boşluk olduğunda ve pearson daha büyük olduğunda ne anlama gelir? Bu, veri kümelerimde tutarlı bir özellik gibi görünüyor.


Yanıtlar:


14

Spearman korelasyonu sadece gerçek sayısal değerler yerine sıraları (sıra istatistikleri) kullanan Pearson korelasyonudur. Sorunuzun cevabı aynı şeyi ölçmemeleri. Pearson: doğrusal eğilim, Spearman: monotonik eğilim. Pearson korelasyonunun daha yüksek olması, doğrusal korelasyonun sıra korelasyonundan daha büyük olduğu anlamına gelir. Bunun nedeni büyük olasılıkla dağılım kuyruklarında sıralanan değerlerine göre büyük etkisi olan etkili gözlemlerdir. Pearson korelasyonunu kullanarak ilişkilendirme testleri, doğrusallık verilerde tutulduğunda daha yüksek güce sahiptir.


1
Mızrakçının saflarda sadece tavus kuşu olduğunu biliyordum. Buna da neden olabilecek başka yollar olup olmadığını görmek zorundayım, ancak verilerin büyüklüğünden daha doğrusal olarak ilişkili olan, ancak sıralamaları ile değiştirildiğinde etkilerini kaybeden etkili kuyruk gözlemleri kesinlikle ne olduğuma neden olacak görme.
John Robertson

0

Pearson Korelasyonu, doğru olması için birkaç varsayım varsayar: 1) Her değişken normal olarak dağıtılır; 2) Homossedastisite, her değişkenin varyansı sabit kalır; ve 3) Doğrusallık, yani ilişkiyi gösteren bir dağılım grafiğinin regresyon çizgisi etrafında simetrik olarak kümelenmiş veri noktaları gösterdiği anlamına gelir.

Spearman Korelasyonu, gözlemlerin sırasına göre Pearson olana parametrik olmayan bir alternatiftir. Spearman Korelasyonu, veri kümeniz hakkındaki üç varsayımı rahatlamanızı ve hala makul derecede doğru korelasyonlar elde etmenizi sağlar.

Verileriniz, iki korelasyonun önemli ölçüde farklı olması için söz konusu varsayımların bir veya daha fazlasını maddi olarak önemli bir şekilde kırmasıdır.

İki korelasyon arasında büyük bir boşluğa sahip olduğunuz göz önüne alındığında, veri kümenizin değişkenlerinin bir dağılım grafiğinde normal olarak dağıtılmış, homossedastik ve doğrusal olup olmadığını araştırmalısınız.

Yukarıdaki soruşturma, Spearman veya Pearson korelasyon katsayısının daha temsili olup olmadığına dair kararınızı kolaylaştıracaktır.


2
t

4
Yanlış. Pearson korelasyonuna yönelik çıkarım, bu varsayımların hiçbirinin geçerli olmasını gerektirmez. Biri heterossedastik, normal olmayan verilerle eğrisel bir ilişkiye sahip olabilir ve Pearson korelasyon testi (lineer regresyon modelinde çıkarımla eşdeğerdir) birinci dereceden eğilimi saptamaya çalışır. Pearson korelasyonunun birinci dereceden eğilimin gücü olarak yorumlanması halen devam etmektedir. Pearson korelasyonu ile ölçülen birinci dereceden eğilimin bir analiz için yeterli olmadığı birkaç durum vardır.
AdamO
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.