Çizim için farklı büyüklük derecelerinde olan verileri ölçekleme


9

Aşağıdaki veri kümesine bakın:

 Date        Visits   Carts      carts       Orders
                      Created   converted    Created
2011-11-11    12277     161        9          36  
2011-11-12    11871     93         5          19    
2011-11-13    13072     107        8          8     
2011-11-14    13594     112        4          34    
2011-11-15    12741     129        8          43    
2011-11-16    15491     261        16         57 
2011-11-17    13418     186        17         42    

Tarihin X Ekseni ve Y Ekseni üzerindeki verilerin geri kalanını kullanarak bunu bir grafik üzerinde çizmem istendi. Sorun, verilerin ölçeğinin önemli ölçüde farklı olmasıdır. Ziyaretlerin binlerce olduğu ve Oluşturulan Siparişlerin onlarca düşük olduğu durumlarda, veriler bir grafiğe iyi çizilmez.

Bir istatistikçinin bu senaryoda ne yapacağını merak ediyordum, Ziyaretleri 1000'e bölebilir ve daha sonra açıklamayı (Ziyaretler (K)) koyabilirdim, ancak daha sonra Carts Created ile aynı sorunu yaşamaya başladım. yüzlerce ve her şey düşük onlarca.

Bu senaryoda ne tür şeyler yapılır?

Yanıtlar:


14

Başlangıçta çizgi grafiklerini Y ekseni için farklı ölçeklere sahip ancak X ekseni (tarihler) hizalı bir dizi küçük kat olarak çizmek mantıksız değildir. resim açıklamasını buraya girin

Bence bu iyi bir başlangıç, çünkü ham verileri incelemek ve farklı çizgi grafikler arasındaki eğilimleri karşılaştırmak için izin verir. IMO önce ham verilere bakmalı, sonra ham verileri inceledikten sonra karşılaştırılabilir olması için dönüşümleri veya grafikleri normalleştirmenin yollarını düşünmelisiniz.

King'in daha önce de bahsettiği gibi, değişkenlerinizin isimlere ve sayılara göre doğal bir sıralaması olduğu ve uygun olduğunu varsayarak, her bir durumda dönüştürülen yüzdeye göre üç yeni değişken yarattım. Yeni değişkenler;

% Carts Created = Carts_Created/Visits
% Orders Created = Orders_Created/Carts_Created
% Carts Converted = Carts_Converted/Orders_Created

Yüzdeler oluşturmak, diziyi ortak bir ölçeğe yaklaştırmanın bir yoludur, ancak o zaman bile tüm çizgileri bir grafiğe yerleştirmek (aşağıda olduğu gibi) diziyi etkili bir şekilde görselleştirmek hala zordur. Oluşturulan siparişlerin ve arabaların dönüştürülen serilerin seviyesi ve değişimi diğer serilerinkini gösterir. Bu ölçekte oluşturulan arabalarda seriyi değiştiremezsiniz (ve en çok ilgilendiğiniz şüpheliyim). resim açıklamasını buraya girin

Yani IMO bunu incelemenin daha iyi bir yolu farklı ölçekler kullanmaktır. Farklı ölçekler kullanan Yüzde grafiği aşağıdadır.

resim açıklamasını buraya girin

Bu grafiklerle, seri arasında bana gerçek anlamlı bir korelasyon olduğu görünmüyor, ancak her seri içinde (özellikle dönüştürülen oran) bol miktarda ilginç varyasyon var. Ne var ne yok 2011-11-13? Oluşturulan siparişin çok daha düşük bir oranına sahiptiniz, ancak siparişin yaratılan her biri dönüştürülmüş bir alışveriş sepetiydi. Site ziyaretlerindeki veya oluşturulan oran veya yüzde arabalarındaki eğilimleri açıklayabilecek başka müdahaleleriniz var mı?

Bu sadece keşifsel veri analizi ve daha fazla adım atmak için veriler hakkında daha fazla bilgiye ihtiyacım var (umarım bu iyi bir başlangıçtır). Çizgi grafiklerini karşılaştırılabilir bir ölçekte çizebilmek için başka şekillerde normalleştirebilirsiniz, ancak bu zor bir görevdir ve bence bazı verileri seçmekten ziyade verilere göre bilgilendirici olan rastgele ölçekleri etkili bir şekilde seçmek gibi yapılabilir. varsayılan normalleştirme şemaları. Birçok çizgi grafiğini aynı anda görüntülemenin bir başka ilginç uygulaması da ufuk grafikleridir , ancak bu aynı anda birçok farklı çizgi grafiğini görüntülemek için daha fazladır .


Cevabınızdaki detay için teşekkür ederim, başlangıçta birden fazla grafiğim vardı. Patronum grafikteki tüm dizileri istemeye karar verdiler (sanırım muhtemelen çok fazla dizi ama ona bakacak olan ben değilim :)) Sanırım verileri normalleştirmeyi düşüneceğim, belki Grafiği yalnızca eğilimleri görüntülemek için kullanmak isterler, tablo verileri genellikle grafiğin altında görüntülenir.
Mike

@Mike, makul bir istek. Serinin normalleştirilmesi eğilimi değiştirmemelidir (sadece her serinin seviyesi ve değişimi). İnşallah serinin bazı etkili, ama yine de anlamlı yollarla normalleştirilmesi konusunda daha anlayışlı cevaplar alırsınız. Dikkatli bir kelime olsa da, tipik olarak sadece bir grafikte 3-5 satır çizmek istiyorsanız, tüm bu karşılaştırmaları yapmak çok daha zordur (küçük katlar bu soruna bir çözümdür).
Andy W

1
@Mike Evet, bu durumda (sadece numarasız verileri görselleştirmek için), verilerinizi paralel ekranlarda olduğu gibi bir min / maks ölçekte ifade edebilirsiniz . Tablonun altındaki sayıları göstermek de iyi bir fikirdir.
chl

1
@ Chl'nin önerdiği gibi, min / maks ölçeğine normalleştirme hakkında daha fazla not. İlk önce ham verileri görmek iyidir, eğer büyük bir aykırı değer varsa, normalleştirme sürecine bu değeri dahil etmemeyi düşünebilirsiniz (normalleştirilmiş grafikte yapıyorsanız, örneğin bir çizgi grafiğiniz varsa, açık olmalıdır) bir yüksek / düşük değer ve geri kalanı düz). Michael Friendly'ın grafiğin altındaki tabloyu da dahil etmeyi kabul edeceğini düşünüyorum .
Andy W

2

2 ayrı y eksenine sahip olabilirsiniz, Ziyaretler (k) ve Arabalar Birinde, diğeri 2'de (veya amacınıza uygun şekilde).

Bu kesinlikle zarif bir yöntem değil, ama yıllar önce sadece zaman içindeki eğilimleri karşılaştırmak istediğimde bunu hatırlıyorum.

VEYA

Amacınıza uygunsa, zaman içindeki yüzde değişimini çizebilirsiniz.


2 farklı Y ekseni ile bahsettiğiniz rotayı düşündüm, ancak bu konuda hoşlanmadığım şey şuydu: iki Y ekseninden birine uymayan yeni bir seri tanıtıldıysa, muhtemelen sıkışmış olurdum. öneri için teşekkür ederim, ve belki başka bir zaman ben bunu daha düşünün :)
Mike

Yüzde kullanımı ile ilgili ikinci öneri ne olacak? yani her şeyi başlangıç ​​tarihinde 100 olarak dizine eklemek (veya hangi tarihte grafiğinizi güzelleştirir). İstediğiniz kadar yeni seri ekleyebilirsiniz!
Kral

Bu bir seçenektir, şu anda excel bu verilerin nasıl normalleştirileceğini ve çalışıp çalışmadığını anlamaya çalışıyorum. başarısızlık yüzde fikir bir gitmek vereceğim :)
Mike

2

Sonunda, her bir değeri maksimum değere bölerek ve sonra 100 ile çarparak verileri normalleştirmeye karar verdim.

  1. Maksimum değeri bulun:

      Date        Visits   Carts      carts       Orders
                          Created   converted    Created
    2011-11-11    12277     161        9          36  
    2011-11-12    11871     93         5          19    
    2011-11-13    13072     107        8          8     
    2011-11-14    13594     112        4          34    
    2011-11-15    12741     129        8          43    
    2011-11-16    15491     261        16         57 
    2011-11-17    13418     186        17         42    
    
    maximum       15491     261        17         57
    
  2. Her sayıyı maksimuma bölün ve ardından 100 ile çarpın:

      Date        Visits   Carts      carts       Orders
                          Created   converted    Created
    2011-11-11    79.25     61.68      52.94      63.15  
    2011-11-12    76.63     35.63      29.41      33.33    
    2011-11-13    84.38     40.99      47.05      14.03      
    2011-11-14    87.75     42.91      23.52      59.64    
    2011-11-15    82.24     49.42      47.05      75.43    
    2011-11-16    100       100        94.11      100
    2011-11-17    86.61     71.26      100        73.68    
    
  3. Daha sonra bunu grafiğe çizdim, açıkçası bu sadece eğilimi gösteriyor ve kullanıcının sayfanın alt kısmında veri tablosu var.


0

Bu benim yaklaşımım da olacaktır - - farklı boyutları X'e bölerek aynı ölçeğe ayarlamak için, ancak max veya min değerini değil, avg değerini kullanırdım. Bunun nedeni - zaman içinde veri ekledikçe, maks veya min değeriniz muhtemelen değişecektir ve daha sonra son grafikte% 100 olan şey bu sefer başka bir şeydir - grafik önceki grafiklerle kolayca mutabık değildir - - eğer avg kullanırsanız, değişiklikler bu kadar sert değildir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.