Kesikli veriler için çizgi grafikleri kullanmak yanlış mı?


13

Sıklıkla çizgi grafikleri olarak çizilen ayrık veri kümelerini gördüm, ancak bana göre çizgi, ayrık veri kümeleri için anlamsız olan ölçüm aralıkları arasındaki bir noktada bir değer verdi. Bu nedenle, ayrık veriler için çizgi grafiklerinin kullanılması yanlış mı?

Örnek olarak, biri sürekli (kilom, sabahları günlük olarak ölçülür) ve bir ayrık (günde yediğim çörek sayısı) olmak üzere iki zaman serisi veri kümesi alın. İlk veri kümesinin bir çizgi grafiği olması mantıklıdır, çünkü herhangi bir öğleden sonra kilonun önceki ve sonraki sabahları kilonumla ilgili olacağı sonucunu çıkarmak mantıklıdır. Bununla birlikte, çörek sayısı bir çizgi grafiği olarak temsil edilirse, noktalar arasındaki çizgiler bu çizgiden anlam çıkarılamaz.

DÜZENLE

Başka bir örnek: http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html adresindeki Kuruluşundan Bu Yana Federal Saatlik Asgari Ücret.

Yanılmıyorsam, asgari ücret değişiklikleri ayrıdır ve bu nedenle rastgele seçilen bir zamana bakmak ve noktaları birbirine bağlayan çizgiyi kullanarak noktada asgari ücreti belirlemek mümkün değildir.


3
(+1) Saatlik asgari ücret örneği mükemmel. Sorunuzun tam olarak ifade edilmesi iyi bir yanıt önerir: yani, bir grafik üzerindeki bağlantı noktalarının, okuyucunun yanlış (veya tamamen geçersiz) enterpolasyonlar yapmasına neden olacağı durumlarda geçerli olmadığı anlamına gelir. Ayrıklık ve süreksizlik arasında bir ayrım yapmak daha fazla analizde yardımcı olacaktır: asgari ücret kesintili iken donut tüketimi ayrıktır. Her biri farklı bir arsa biçimini hak ediyor.
whuber

Ayrık verilere sahip bir dağılım grafiğinin bir çizgi grafiği üzerinde yanıltıcı olduğu grafikler vardır. Bir dizi olayın gerekli olduğu (histerezis) veya iki seviye arasında salınımların olduğu ve durum değişikliklerini ve konumlarını izlemenin gerekli olduğu eample vakaları için. Bu yüzden: enterpolasyonu ima etmek için çizgi grafikleri kullanmayın, ancak uygunsa onları kılavuz olarak kullanın. Basit bir seçim kuralı oluşturmak için yeterince basit değildir, ancak eldeki verilerin ve modelin dikkate alınması gerekir.
wirrbel

1
İlginç soru! Bunun için teşekkürler. Kısmen ayrık modellerden ve kısmen ölçülen verilerden kaynaklanan zamanla ilgili birçok veriyle uğraşıyorum. Kesikli veriler için kademeli çizgi grafikleri kullanma seçeneği (bir şekilde sürekli olabilir, ancak hala tek noktalar arasında hiçbir fonksiyonumuz yoktur ve sadece bir tane olduğunu varsayamayız) ve sürekli veriler için düzenli olanlar. Bununla başa çıkma
şeklim

@CordKaldemeyer yorum yaptığınız için teşekkürler - Grafik türü "kademeli çizgi" farkında değildi, ama kesinlikle aradığım şey bu. Ayrıca Excel'de kademeli çizgi çizimleri yapmak için bu yararlı öğreticiyi buldum: trumpexcel.com/step-chart-in-excel
user1379351 21:09

@ user1379351: Yardımcı olabildiğime sevindim!
Cord Kaldemeyer

Yanıtlar:


9

Bağlantılı çizgi grafiklerinin tek bir yorumu sınırlamak için çok yararlı olduğu kanıtlanmıştır. Birkaç önemli kullanım:

  • Enterpolasyonlu değerler . Her iki değişkenin de sürekli olduğu ve hat boyunca her enterpolasyonlu noktanın anlamlı bir yorum olarak belirtildiği durum.
  • Değişim oranı . Aradaki değerler anlamlı olmasa bile, her bir çizgi parçasının eğimi, değişim oranının iyi bir temsilidir. Bu yorum için, X ve Y değerlerinin uygun aralıklarla yerleştirilmesi gerektiğini unutmayın; bu, alıntıladığınız ücret planında geçerli değildir.
  • Profil Karşılaştırması . Küçük katlar veya üst üste binmiş ölçümleri karşılaştırırken, hatlar kategorik faktörler için bile yararlı olabilir. Bu durumda, çizgiler sınırlı örüntü tanıma için yanıt gruplarını birleştirmeye yarar. Peltiertech.com'dan , etiket okunabilirliği için Y (X yerine) eksenindeki faktörle ilgili bir örnek :

resim açıklamasını buraya girin


1
Doğru, ancak 2. ve 3. grafikler birinciden kesinlikle daha az güçlüdür, çünkü hiç kimse hesabı kullanamaz.
Milind R

5

Peki, çörekler ağırlıkla ilgili olabilir :-)

Ne demek istediğini anlasam da bu örnek o kadar da kötü değil çünkü zaman (yatay eksende, çizgilerin işaret ettiği şey) süreklidir. Hattın anlamı, benim için çok fazla değil, günün her saatinde belirli sayıda donut yedin, ancak günlük donut sayısının düzenli bir şekilde değiştiği. Böylece, çizgiye daha yumuşak bir şey gibi bir şey ekleyebiliriz ve mantıklı olur. Her saatte ve hatta her dakika yenen çörekleri düşünmek en azından mantıklıdır (her ne kadar günlük sayımın daha yüksek olduğu bir değişkenle daha mantıklı olsa da)

Daha endişe verici olan şey, yatay eksen ayrık olduğunda (ve özellikle nominal olduğunda), ancak çizgiler çizildiğinde. Bu gerçekten bir anlam ifade etmiyor. Örneğin, ABD'nin farklı bölgelerindeki sakinler arasında (örneğin) Obama'nın oy oranına (örneğin) bakıyorsanız, Kuzeydoğu ve Orta Batı arasında bir çizgi çizmek mantıklı değildir; özellikle bölgelerin sıralaması keyfi olduğundan, sıraların değiştirilmesi satırları değiştirecektir. Yine de böyle grafikler gördüm.


1
Kesinlikle orada çizgi grafik kötüye kullanımı çok katılıyorum. Noktaları birleştirmediği için pürüzsüz bir yaklaşımı seviyorum ve bu nedenle orada olmayan verileri ima etmiyor. Ancak, donut tüketimindeki endişe verici eğilimi vurgulamaya hizmet ediyor. Teşekkürler!
user1379351

3
Bir değişkeni - çörek tüketimini - başka bir değişkenle değiştirmeyi teklif ediyor gibi görünüyorsunuz; yani, bir çörek tüketim yoğunluğu (birim zaman başına çörek). Her ne kadar bu - özellikle iki boyutlu analizlerde (nüfus yoğunluğu haritaları gibi) - ve çok etkili olabilse de, okuyucuların bir ayrım olduğunu bilmeleri ve bu ayrımın nasıl olabileceğini düşünmeleri iyi olurdu. grafiksel olarak ortaya çıkarmak.
whuber

2
@whuber Bu adil bir nokta; hat bu değişikliği yapıyor gibi görünüyor. Bu değiştirmeyi yapmayan bir grafik sadece noktalar olabilir, bağlantısız olabilir, ancak bu, donut tüketiminin belirli bir noktada bulunmasına en azından bir ipucu veriyor gibi görünüyor. Böylece, zamanı sürekli olarak işleyebilir ve bir çörek tüketildiği anda bir nokta koyabiliriz.
Peter Flom - Monica'yı eski durumuna döndürün
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.