Pearson parametrik ve Spearman neden parametrik değildir


19

Görünüşe göre Pearson'un korelasyon katsayısı parametrik ve Spearman'ın rho parametrik olmadığı.

Bunu anlamakta güçlük çekiyorum. Anladığım kadarıyla Pearson olarak hesaplanır ve Spearman aynı şekilde hesaplanır, ancak tüm değerleri değiştiririz.

rxy=cov(X,Y)σxσy

Wikipedia diyor

Parametrik model ile parametrik olmayan model arasındaki fark, birincisinin sabit sayıda parametreye sahip olması, ikincisinin ise eğitim verisi miktarı ile parametre sayısını arttırmasıdır.

Ancak numunelerin kendileri dışında herhangi bir parametre görmüyorum. Bazı diyelim parametrik testler, normal dağılımlar üstlenecek ve devam olduğunu söylemek Pearson, normal dağıtılmış veri varsayalım olmadığını, ancak Pearson gerektirmektedir neden göremiyorum.

Öyleyse sorum şu: İstatistik bağlamında parametrik ve parametrik olmayan ne anlama geliyor? Pearson ve Spearman oraya nasıl oturuyor?


6
Bu iyi bir soru ve orada çok fazla yanlış bilgi var. Örneğin, parametrik testlerin denklemi ve normal dağılımların varsayılması maalesef sık görülen bir karışıklıktır, bu nedenle birçok ders kitabı yazarı, ders öğretmeni ve internet posteri, sadece veya daha fazla karışık olan diğerlerinden kopyalar.
Nick Cox

5
Belki de sorunun en basit pozitif çözümü şudur: evet, Spearman'ın korelasyonu, bir ilişkinin gücünü ölçmek için tahmin edilecek bir parametredir ve bu nedenle Pearson'a benzer (kökte, işaret ettiğiniz gibi aynı fikirdir); ancak hayır, Spearman'ın korelasyonu bir dağılımda özellik gösteren bir parametre değildir, Pearson ise iki değişkenli normal dağılımda bir parametredir (korelasyon yaptığınızda ne yaptığınızın tarihi ancak önemsiz bir yorumudur). "Parametre" kelimesinin birden fazla duyu olduğunu görmek iyi anlaşılır.
Nick Cox

@ NickCox, bunu neden cevap olarak göndermiyorsun?
Richard Hardy

5
Dağılımın normalliği ile ilgili nokta sadece korelasyon ile anlamlılık testleri yapmak istediğinizde gerçekten ısırır. Eğer korelasyonları sadece tanımlayıcı önlemler olarak kullanırsanız, normallik olmaması korelasyonları kullanmanın önünde bir engel olmak zorunda değildir. Her iki değişken de değiştiği sürece iki ikili değişkenle korelasyonlar biraz faydalı olabilir. Hala aykırı değerlerin vb. Etkilerine dikkat etmelisiniz
Nick Cox

1
Henüz açık bir şekilde söylenmediği için hiçbir istatistiğin "parametrik" olmadığını vurgulamak isterim . Bu rakamların lezzetli olduğunu söylemek gibidir: sıfat sadece isme uygulanmaz. İstatistiksel modeller parametrik olabilir (Wikipedia alıntısı ile belirtildiği gibi) ve bunlara dayalı testler ve prosedürler. Spearman ve Pearson istatistikleri hem parametrik hem de parametrik olmayan ortamlarda kullanılabilir. Daha fazla bilgi için stats.stackexchange.com/questions/67204 . Bir modeli parametrik yapan, durum alanıdır .
whuber

Yanıtlar:


17

Sorun şu ki, "parametrik olmayan" bu günlerde gerçekten iki ayrı anlama sahip. Wikipedia'daki tanım, eğri çizgiler veya lokal regresyon gibi parametrik olmayan eğri uydurma gibi şeyler için geçerlidir. Daha eski olan diğer anlam, daha çok "dağıtımdan bağımsız" - yani verilerin varsayılan dağılımından bağımsız olarak uygulanabilecek teknikler üzerindedir. İkincisi Spearman'ın rho için geçerli olanıdır, çünkü rütbe dönüşümü, orijinal dağılımınız ne olursa olsun aynı sonucu vereceğini ima eder.


2
Parametrik olmayanın iki anlamı vardır, ancak wikipedia'daki yorum gerçekten her ikisi için de geçerlidir. Parametrik olmayan regresyonda ilişkinin sonlu parametrik olmadığı anlamına gelir. Şeylerin 'dağılımsız' tarafında, dağılım modellerinin sonlu parametrik olmadığı anlamına gelir.
Glen_b -Monica

1
Hmm, Wikipedia'dan alıntı ben değilim. Başka biri ekledi.
Hong Ooi

2
Bir ayrıntıda yanlış olduğunu ve özellikle yararlı bir şey eklemediğini düşündüğüm ana düzenleme, düşük = rep kullanıcısı tarafından yapıldığı ve bir kişi tarafından reddedildiği için inceleme için geldi, ancak daha sonra otomatik olarak kabul edildi üçüncü bir kişi onu geliştirmek için düzenlemeye çalıştı (bunun bir sonuç olacağını fark etmemiş olabilirler). Bu düzenlemeyi orijinalinize geri getireceğim. Sevmediğin bir düzenleme olduğunda bunu yapabilirsin.
Glen_b

Şimdi orijinal postanıza geri döndü, çünkü sözleşmenizi aramadan postanızı çok değiştirdiğini ve kabul ettiğinizi düşünmüyorum. Bu konuda hoşunuza giden bir şey varsa,
adımın üstündeki

Spearman'ı ne zaman kullanmalı? Pearson, Spearman'ı kullanırken nasıl yardımcı olabilir?
Léo Léopold Hertz 준영

3

Bence Pearson korelasyon katsayısının parametrik olarak adlandırılmasının tek nedeni, çok değişkenli normal dağılımın parametrelerini tahmin etmek için kullanabilmenizdir. örneğin, iki değişkenli normal dağılımın 5 parametresi vardır: iki ortalama, iki varyans ve korelasyon katsayısı. İkincisi Pearson korelasyon katsayısı ile tahmin edilebilir.

ρ


önemini test etmek için normallik varsaymanız gerektiği anlamında pearson korelasyon katsayısı parametresi değil mi? yani, istatistik olarak normalliği kabul etmez, ancak örnek korelasyon katsayısının dağılımını hesaplarken verilerin normal olduğunu varsayar ve test eder misiniz? bu dürüst bir soru,% 100 yanlış olabilirim.
mugen

Sperman ve kendall'da herhangi bir dağıtım varsayımı yaparsanız lütfen açıklayabilir misiniz?
Léo Léopold Hertz 준영

bir Pearson korelasyonunun önemini test etmek için normallik varsaymanız gerekmez; Pearson korelasyonunun ortak bir testi bunu yapar. Farklı bir parametrik varsayım yapabilir ve farklı bir test yapabilirsiniz ... ya da aslında, Pearson korelasyon popülasyonunun sıfır olduğu null'un permütasyon testi yapabilir ve parametrik olmayan bir testle sonuçlanabilir.
Glen_b

0

En basit cevap, Spearmen'in rho testinin sıralı veriler kullandığını (sayılar sıralanabilir, ancak sayılar arasındaki aralık hakkında bir şey söylemediğidir, örneğin 3 tat çeşidi 1, 2 ve 3'te sıralanır, ancak bu sadece lezzet ne kadar tercih edilmedi). Sıradan veriler parametrik testlerde kullanılamaz.

Pearson r testi aralık veya oran verisi kullanır (sabit aralıklara sahip sayılar, örneğin saniye, kg, mm). 1mm sadece 5mm'den daha küçük değil, aynı zamanda ne kadar olduğunu da biliyorsunuz. bu tip veriler bir parametrik testte kullanılabilir.


1
Elbette parametrik modelleri - ve dolayısıyla parametrik testleri - sıralı verilerle kullanmak mümkündür. Bu değişken için sonlu ve sabit sayıda parametre ile bir dağılım önermek ve bu parametreler ve voila ile ilgili bazı uygun hipotezler , bir parametrik test vardır. Değişkenlerden birinin veya her ikisinin iki kategoriye sahip olduğu durumlarda (tipik olarak 0/1 olan) hesaplanan Pearson korelasyonu, bu durumlar için yaygın olarak kullanılan ilişkilendirme ölçümleriyle sonuçlanır.
Glen_b
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.