Bir anketteki farklı soruların cevapları arasındaki korelasyonları arıyorum ("umm, 11. soruya verilen cevapların 78. soruya cevap verip vermediğine bakalım") Tüm cevaplar kategoriktir (çoğu "çok mutsuz" ile "çok mutlu" arasındadır), ancak birkaçı farklı cevaplara sahiptir. Birçoğu sıra sayılabilir, bu yüzden bu durumu burada ele alalım.
Ticari bir istatistik programına erişimim olmadığından, R kullanmalıyım.
Rattle'ı (R için ücretsiz bir veri madenciliği paketi, çok şık) denedim ama maalesef kategorik verileri desteklemiyor. Kullanabileceğim bir hack, R'nin "çok mutsuz" ... "mutlu" yerine sayıları (1..5) olan kodlanmış sürümünü içe aktarmak ve Rattle'ın sayısal veriler olduğuna inanmasına izin vermektir.
Bir dağılım çizmeyi ve her çift için sayı sayısıyla orantılı nokta boyutuna sahip olmayı düşünüyordum. Bazı googling sonra http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/ buldum ama (benim için) çok karmaşık görünüyor.
Ben bir istatistikçi değilim (ama bir programcı) ama bu konuda bir şeyler okudum ve eğer doğru anlarsam , Spearman'ın rho burada uygun olurdu.
Acele edenler için sorunun kısa versiyonu: Spearman'ın rho'sunu hızlı bir şekilde çizmenin bir yolu var mı? Bir sayı matrisine göre bir arsa tercih edilir, çünkü göz küresi daha kolaydır ve ayrıca malzemelere dahil edilebilir.
Şimdiden teşekkür ederim.
PS Bir süre bu ana SO sitede veya burada göndermek için düşündüm. Her iki siteyi de R korelasyonu aradıktan sonra, bu sitenin soru için daha uygun olduğunu hissettim.