İki sıra değişken arasındaki ilişkiyi göstermek için uygun bir grafik nedir?
Aklıma gelen birkaç seçenek:
- Birbirini gizleyen noktaları durdurmak için rastgele titreşim eklenmiş dağılım grafiği. Görünüşe göre standart bir grafik - Minitab buna "bireysel değerler grafiği" diyor. Benim düşünceme göre, sanki veriler bir aralık ölçeğindeymiş gibi sıradan seviyeler arasında bir tür doğrusal enterpolasyonu görsel olarak teşvik ettiği için yanıltıcı olabilir.
- Her bir örnekleme birimi için bir nokta çizmek yerine, noktanın büyüklüğü (alan) bu seviye kombinasyonunun sıklığını temsil edecek şekilde uyarlanmış dağılım grafiği. Uygulamada zaman zaman böyle araziler gördüm. Okumak zor olabilir, ancak noktalar, dağınık dağılım grafiğinin, verileri görsel olarak "aralıklandırdığı" yönündeki eleştirinin biraz üstesinden gelen, düzenli aralıklarla yerleştirilmiş bir kafesin üzerinde yatıyor.
- Özellikle değişkenlerden biri bağımlı olarak değerlendirilirse, bağımsız değişken seviyelerine göre gruplanmış bir kutu grafiği. Bağımlı değişken seviyelerinin sayısı yeterince yüksek değilse (eksik bıyıkları olan çok "düz" ya da hatta medyanın görsel olarak tanımlanmasını imkansız kılan çökmüş çeyrekler) korkunç olabilir; ancak en azından medyan ve çeyreklerin dikkatini çeker. Bir sıra değişkeni için ilgili tanımlayıcı istatistikler.
- Değer tablosu veya sıklığı belirtmek için ısı eşlemeli hücrelerin boş ızgarası. Görsel olarak farklı fakat kavramsal olarak nokta grafiği, nokta alanını sıklıkta gösteren dağılım grafiğine benzer.
Arazilerin tercih edilebileceği başka fikirler veya düşünceler var mı? Ordinal-vs-ordinal parsellerin standart olduğu düşünülen herhangi bir araştırma alanı var mı? (Genomikte frekans ısı haritasının yaygın olduğunu hatırlıyor gibiyim ama nominal-nominal-nominal için daha sık olduğundan şüpheliyim.) İyi bir standart referans için öneriler de memnuniyetle karşılanacaktır, Agresti'den bir şey tahmin ediyorum.
Herhangi biri bir çizim ile göstermek isterse sahte numune verisi için R kodu takip eder.
"Sizin için egzersiz ne kadar önemli?" 1 = hiç önemli değil, 2 = biraz önemsiz, 3 = ne önemli ne de önemsiz, 4 = biraz önemli, 5 = çok önemli.
"10 dakikalık veya daha uzun bir süreyi ne kadar düzenli alıyorsunuz?" 1 = asla, 2 = iki haftada bir kezden az, 3 = her iki haftada bir veya iki haftada bir, 4 = haftada iki veya üç kez, 5 = haftada dört veya daha fazla kez.
Eğer "sık sık" bağımlı bir değişken olarak ele almak doğal ve bağımsız bir değişken olarak "önem" olarak değerlendirilirse, eğer bir arsa ikisi arasında ayrım yaparsa.
importance <- rep(1:5, times = c(30, 42, 75, 93, 60))
often <- c(rep(1:5, times = c(15, 07, 04, 03, 01)), #n=30, importance 1
rep(1:5, times = c(10, 14, 12, 03, 03)), #n=42, importance 2
rep(1:5, times = c(12, 23, 20, 13, 07)), #n=75, importance 3
rep(1:5, times = c(16, 14, 20, 30, 13)), #n=93, importance 4
rep(1:5, times = c(12, 06, 11, 17, 14))) #n=60, importance 5
running.df <- data.frame(importance, often)
cor.test(often, importance, method = "kendall") #positive concordance
plot(running.df) #currently useless
Sürekli değişkenler için ilgili bir soru faydalı, belki de yararlı bir başlangıç noktası buldum: İki sayısal değişken arasındaki ilişkiyi incelerken saçılma noktalarına alternatifler nelerdir?