Hızlı bir şekilde sıralı kategorik veriler arasındaki korelasyonları (görsel olarak) R?


11

Bir anketteki farklı soruların cevapları arasındaki korelasyonları arıyorum ("umm, 11. soruya verilen cevapların 78. soruya cevap verip vermediğine bakalım") Tüm cevaplar kategoriktir (çoğu "çok mutsuz" ile "çok mutlu" arasındadır), ancak birkaçı farklı cevaplara sahiptir. Birçoğu sıra sayılabilir, bu yüzden bu durumu burada ele alalım.

Ticari bir istatistik programına erişimim olmadığından, R kullanmalıyım.

Rattle'ı (R için ücretsiz bir veri madenciliği paketi, çok şık) denedim ama maalesef kategorik verileri desteklemiyor. Kullanabileceğim bir hack, R'nin "çok mutsuz" ... "mutlu" yerine sayıları (1..5) olan kodlanmış sürümünü içe aktarmak ve Rattle'ın sayısal veriler olduğuna inanmasına izin vermektir.

Bir dağılım çizmeyi ve her çift için sayı sayısıyla orantılı nokta boyutuna sahip olmayı düşünüyordum. Bazı googling sonra http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/ buldum ama (benim için) çok karmaşık görünüyor.

Ben bir istatistikçi değilim (ama bir programcı) ama bu konuda bir şeyler okudum ve eğer doğru anlarsam , Spearman'ın rho burada uygun olurdu.

Acele edenler için sorunun kısa versiyonu: Spearman'ın rho'sunu hızlı bir şekilde çizmenin bir yolu var mı? Bir sayı matrisine göre bir arsa tercih edilir, çünkü göz küresi daha kolaydır ve ayrıca malzemelere dahil edilebilir.

Şimdiden teşekkür ederim.

PS Bir süre bu ana SO sitede veya burada göndermek için düşündüm. Her iki siteyi de R korelasyonu aradıktan sonra, bu sitenin soru için daha uygun olduğunu hissettim.


2
R, uygun bir yazılımdan daha düşük gibi geliyor. :)
Roman Luštrik

Benim için durumunuzda pearson ürün-moment-korelasyonunu (sürekli veri varsayarak) kullanmak tamamen mantıklı geliyor (ölçeğinizde yeterli puan varsayarak orta noktayı bilmiyorum). Psikoloji içindeki tüm alanlar (örneğin, kişilik veya sosyal psikoloji), çok un-X'ten çok X'e kadar değişen beş noktalı (veya yedi noktalı) bir ölçekte tek bir öğeye yanıt veren varsayımına dayanır (başarılı bir şekilde). sürekli kabul edilir. Bu konuya da bakınız: stats.stackexchange.com/questions/539/…
Henrik

@romunov: R'nin diğer s / w'den daha düşük olduğuna inandığım izlenimini nasıl aldığınızdan emin değilim. Ama durum böyle değil.
wishihadabettername

Ben sadece akıllı bir eşek oluyordum. Umarım zor duygular yoktur. :)
Roman Luštrik

Yanıtlar:


19

Korelasyonun bir başka iyi görselleştirmesi, düzeltme tablosu paketi tarafından sunulur ve size böyle şeyler verir: alternatif metin

Harika bir paket.

Ayrıca buradaki cevaba bir göz atın, bilmeniz iyi olabilir.

Son olarak, atıfta bulunduğunuz gönderinin kodunun nasıl daha basit olabileceğine dair önerileriniz varsa lütfen bize bildirin.


1
Teşekkürler Tal, şimdi düzeltmeyi deneyeceğim. Ayrıca çözümün nasıl basitleştirileceğini bilseydim (ki bu soruya bağlandım) ama ben sadece R'de bir acemi olduğum için benden daha fazlasını biliyorsun. Çözümün benim için
wishihadabettername

Düzeltme alanı iyi görünüyor. Korelasyonların boyutu ve yönünün mükemmel bir görsel görüntüsünü verir. 5 noktalı sıralı kategorik değişkenler söz konusu olduğunda, Pearson korelasyonunun yanı sıra başka bir ilişki ölçüsü sağlamak da yararlı olabilir: örneğin, polikrik korelasyonlar. Sıralı kategorik değişkenlerin standart Pearson korelasyonlarının büyüklüğü, iki değişkenin ortalamasından bir miktar etkilenir.
Jeromy Anglim

3

Birkaç ek çizim fikri:


Ayçiçeği eğlenceli bir çözümdür. Konuya ilk baktığımda bir titreme kullanmak denedim, ancak korelasyon matrislerinin çizilmesi için yeterince etkili olmadığını buldum ...
Tal Galili

Evet, jitter çok değişkenli bir scattermatrix ile oldukça dağınık olabilir. Jitter ve ayçiçeği faydası ham verileri (jitter durumda olsa da) göreceksiniz olmasıdır.
Jeromy Anglim

Kabul etti (Ben titremeyi seviyorum, bunun için değil :))
Tal Galili
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.