Sürekli ve kategorik (nominal) değişkenler arasındaki korelasyon


40

Sürekli (bağımlı değişken) ile kategorik (nominal: cinsiyet, bağımsız değişken) değişken arasındaki ilişkiyi bulmak isterim. Sürekli veri normalde dağılmaz. Daha önce Spearman's kullanarak hesaplamıştım . Ancak bunun doğru olmadığı söylendi.ρ

İnternette arama yaparken, kutu grafiğinin ne kadar ilişkili oldukları hakkında bir fikir verebileceğini; Ancak, Pearson'un ürün moment katsayısı veya Spearman's gibi nicel bir değer arıyordum . Lütfen bunun nasıl yapılacağı konusunda bana yardımcı olabilir misiniz? Veya hangi yöntemin uygun olacağı konusunda bilgi verin?ρ

Nokta Biserial Katsayısı doğru seçenek olur mu?


Normalde, yalnızca veri formatı temelinde tavsiye verilmez! Veriler neyi temsil ediyor ve analizinizle neler elde etmek istiyorsunuz?
kjetil b halvorsen

1
Teşekkürler kjetil, cinsiyet ve diğer sürekli değişkenler arasındaki ilişkiyi karşılaştırmak istiyorum. Basitçe bilmek, hangi sürekli değişkenlerin orta / kuvvetle korelasyonlu olduğunu ve hangilerinin değişken olmadığını.
Md. Ferdous Wahid

1
Stats.stackexchange.com/questions/25229/… bir kopyası gibi görünüyor Bu sorunun cevabının size yardımcı olup olmadığını bize söyleyebilir misiniz?
kjetil b halvorsen

Evet, sorum buna benzer. Ancak, gözden geçirenin Spearman's uygun olmadığını belirttiği bir geri bildirim aldım . Örneklem büyüklüğüm 31. Cevaba göre (verilen bağlantı), normal olmayan bir sorun olmaz ve büyük veri setleri için herhangi bir korelasyon yöntemi (Spearman / Pearson / Point-Biserial) kullanılabilir. Küçük veri kümesi için de doğru mu? Bu arada, cinsiyet yapay olarak oluşturulmuş iki yönlü bir nominal ölçek değildir. Yukarıdaki link biserial korelasyon katsayısını kullanmalıdır. ρ
Md. Ferdous Wahid

3
Nominal ve aralık veya sıra değişkenleri arasındaki korelasyon istatistik.stackexchange.com/q/73065/3277
ttnphns

Yanıtlar:


25

ρ(Zi,Ii)ZIρZ,IIρTemel olarak, iki grup arasındaki ortalama değerlerin yeniden ölçeklendirilmiş halleri olacaktır. Sadece araçları karşılaştırmak daha basit (daha yorumlanabilir) olurdu! Başka bir yaklaşım ise şudur.

X1,,XnY1,,YmXYP(X>Y)

θ=P(X>Y)
XYθ(Xi,Yj)Xi>YjMXi<YjWθ
MM+W

5
Spearman'ın rank korelasyonu sadece sayısal değişkenin saflarına uygulanan orijinal Pearson korelasyonu ve orijinal ikili değişkenin değerleridir (sıralamanın burada etkisi yoktur). Spearman's rho, Point-biserial korelasyonunun rütbe analoğudur. Bu durumda Spearman's rho'yu tanımlayıcı olarak kullanmakta bir sorun görmüyorum.
Michael M,

Michael Mayer: Evet, belki işe yarayabilir, ama içinde herhangi bir nokta var mı? Bazı araçlar arasında bulunmayan bilgiler vermiyor! ve bu daha doğrudan yorumlanabilir.
kjetil b halvorsen

1
Rütbelerdeki fark Spearman's rho olarak yorumlanması çok daha mı basit? Öyle olsa bile, Spearman’ın yanlış olduğunu mu söylersiniz? Üzgünüm, hakemlerin mantığını göremiyoruz.
Michael M

1
Önerdiğin şey güzel. Wilcoxon'un iki örnekli testin test istatistiğiyle ilişkili olduğu görülüyor; bu, Kendall'ın sayısal sonuç ve ikili grup değişkeni arasındaki sıra korelasyonuna benziyor.
Michael M

1
θθ^1θ

8

Şimdi aynı sorunu yaşıyorum. Henüz kimseye başvuruda bulunmadığını görmedim, ancak Pearson korelasyon katsayısını temel alan Point-Biserial Korelasyonunu araştırıyorum. Sürekli bir değişken ve iki değişkenli bir değişken için anlam ifade eder.

Hızlı okuma: https://statistics.laerd.com/spss-tutorials/point-biserial-correlation-using-spss-statistics.php

R kullanıyorum, ancak SPSS'in harika belgeleri var.


1
Sürekli değişken ve iki değişkenli bir değişken arasında bir korelasyon bulmak için harika bir referans! Ancak, listelenen varsayımlar biraz güçlüdür.
SUNDONG

1

En uygun karşılaştırmanın medyanları (normal olmadığı için) karşılaştırmak ve ikili kategoriler arasındaki dağılımdan kaynaklandığı görülmektedir. Parametrik olmayan Mann-Whitney testini öneririm ...


6
Mann-Whitney bir ikili kategorik değişken boyunca değişken (ya da daha genel olarak stokastik baskınlık biçimleri) içindeki yer değişimini tanımlamanın bir yolu olsa da, Mann-Whitney medyanları karşılaştırmaz, en azından ek varsayımlar olmadan değil.
Glen_b

0

Belirtilen problem için, bir Alıcı Operatör Karakteristik Eğrisi Altındaki Alanın Ölçülmesi yardımcı olabilir.

Bu konuda uzman değilim, bu yüzden basit tutmaya çalışıyorum. Lütfen herhangi bir hata veya yanlış yorum hakkında yorum yapın, böylece onu değiştirebilirim.

xyxxx

xx

xx

Yukarıdaki ifade Eğrinin Altındaki Alan ile hesaplanmıştır.

İyi korelasyon örneği (sağda) ve adil anti-korelasyon (solda)İyi korelasyon örneği (sağda) ve adil anti-korelasyon (solda).


1
CV'ye Hoşgeldiniz! Cevabınız biraz kısa, ve aramaya yardımcı olacak gibi görünmüyor: "sürekli (bağımlı değişken) ve kategorik (nominal: cinsiyet, bağımsız değişken) değişken arasındaki korelasyon" . Cevabınızı AUROC'un bunu nasıl başarması gerektiğini içerecek şekilde düzenleyebilir misiniz?
Frans Rodenburg,

-3

bağımsızlığa alternatif doğrusal trend kullanmalısınız. Bu şekilde bilmiyorsanız, kategorik veri analizine giriş sayfa 41.


4
Zaten kabul edilmiş bir cevap var. Ve cevabınızın neye katkıda bulunduğu net değil. Daha fazla açıklayabilir misiniz? Agresti'nin kategorik veri analizine girişinden bahsettiğini sanıyorum. Lütfen tam alıntı yapınız.
TEG - Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.