Kırılmış eksenlere alternatifler nelerdir?


28

Kullanıcılar genellikle aynı grafikte farklı büyüklükteki siparişlerin verilerini sunmak için eksen değerlerini kırmaya çalışırlar ( buraya bakın ). Bu uygun olsa da, verileri görüntülemek için her zaman tercih edilen yol değildir (en iyi ihtimalle yanıltıcı olabilir). Farklı büyüklük derecelerinde farklı olan verileri göstermenin alternatif yolları nelerdir?

Verileri log-dönüştürmek veya kafes çizimleri kullanmak için iki yol düşünebilirim. Diğer seçenekler nelerdir?


1
Bu Excel rehberleri oldukça ürkütücü görünüyor ...

5
R ile ilgili bir öğreticinin hayatında hiç bir kod satırı görmemiş birine nasıl göründüğünü hayal edebiliyor musunuz? :)
Roman Luštrik 17:10

3
Tamam, ancak tüm bu kişilerin Excel'de onlarca çubuk kırılmasıyla el çizdiğini ve bunun bunu yapmanın tek (ve en kolay ve en hızlı) yol olduğuna inandığını hayal edebiliyorum. Veya saatlerini harcayan insanlar biçimlendirmeyi büyük bir Word belgesinde birleştirmeye çalışıyor.

1
"Baba, onları affet, çünkü ne yaptıklarını bilmiyorlar." akla gelir. :)
Roman Luštrik 17:10

3
Stats.stackexchange.com'un resmi grubu: Kırık Eksenler.
Matt Parker

Yanıtlar:


17

Çubuk grafiklerde logaritmik eksenleri kullanmaktan çok çekiniyorum . Sorun şu ki, eksenin başlangıç ​​noktasını seçmek zorundasınız ve bu neredeyse her zaman keyfi. İki çubuğun yalnızca eksen üzerindeki minimum değeri değiştirerek çok farklı yüksekliklere veya neredeyse aynı yüksekliğe sahip olmasını seçebilirsiniz. Bu üç grafik, aynı verileri çizer: alt metin

Henüz kimsenin bahsetmediği süreksiz eksenlere bir alternatif, basit bir değer tablosu göstermektir. Çoğu durumda, tabloların anlaşılması grafiklerden daha kolaydır.


3
Bu grafikler de çok aldatıcı görünüyor çünkü üzerlerinde hata çubukları yok. Hata çubukları eklerseniz, fark daha az önemli görünecektir. Veya çoğunlukla bu tür sorunlardan kaçınan kutu ve bıyık parsellerini kullanabilirsiniz.
nico

5
IMHO menşei, çubuk grafiklerin bir sorunudur ve logaritma ile ilgisi yoktur. Doğrusal eksenlerle aynı aldatıcı izlenime ulaşabilirsiniz.
cbeleites, Monica

@cbeleites. Evet, taban çizgisini değiştirerek doğrusal eksenli yanıltıcı çubuk grafikler oluşturabilirsiniz. Ancak doğrusal bir eksende doğal taban çizgisi sıfırdır. Logaritmik eksenlerle, çoğu durumda, doğal bir temel yoktur.
Harvey Motulsky

@ HarveyMotulsky: Ben katılmıyorum yalvarıyorum. Günlük eksenleri tarafından iyi tanımlanmış ve doğal bir temele sahip olan bir veri sınıfı vardır: çarpımsal değişiklikler / oranlar. Örneğinizde, belki de tedavi edilen sinyal kontrol sinyalinin 15 katıdır. Bu varsayım başvuru için anlamlıysa, kayıt için "doğal" bir temeliniz vardır. Değilse, belki başka bir dönüşüm daha mantıklı?
cbeleites, Monica

1
@cbeleites Eğer değişken bir oran o kadar 1.0 ise, doğal bir taban çizgisi ise, o zaman onu bir log ölçeğinde göstermenin bir anlamı olduğunu kabul ediyorum.
Harvey Motulsky

11

Bazı ek fikirler:

(1) Kendinizi logaritmik bir dönüşümle sınırlamanız gerekmez. Örneğin bu siteyi "veri dönüşümü" etiketi için arayın. Bazı veriler bir kök veya logit gibi bazı dönüşümlere kendilerini iyi borç verir. (Bu tür dönüşümler - loglar bile - teknik olmayan bir izleyici için grafik yayınlanırken genellikle kaçınılmalıdır. Öte yandan, verilerdeki modelleri görmek için mükemmel araçlar olabilirler.)

(2) Grafiğinizin içinde veya yanında bir grafiğin detayını eklemek için standart bir kartografik teknik ödünç alabilirsiniz. Spesifik olarak, uç değerleri bir grafik üzerinde kendi başlarına çizersiniz ve verilerin tamamını (ya da) diğerlerine daha sınırlı bir eksen aralığına sahip olarak çizersiniz, ardından ikisini grafiksel olarak ilişkinin göstergeleriyle (görsel ve / veya yazılı) düzenlersiniz. onların arasında. Alaska'nın ve Hawaii'nin farklı ölçeklerde iç içe geçtiği ABD haritasını düşünün. (Bu her türlü grafikte işe yaramaz, ancak resminizdeki çubuk grafiklerde etkili olabilir.) [Bunun, Mbq'nin son cevabına benzer olduğunu düşünüyorum.]

(3) Kırılmamış komployu yan yana olmayan eksenlerde aynı komplo ile yan yana gösterebilirsiniz.

(4) Çubuk grafik örneğinizde, uygun (muhtemelen çok gerilmiş) bir dikey eksen seçin ve bir kaydırma aracı sağlayın. [Bu, gerçekten faydalı bir teknik olan IMHO'dan daha bir numaradır, ancak bazı özel durumlarda yararlı olabilir.]

(5) Verileri görüntülemek için farklı bir şema seçin. Değerleri temsil etmek için uzunluk kullanan bir çubuk grafik yerine, örneğin sembollerin alanlarının değerleri temsil ettiği bir grafik seçin. [Açıkçası, burada takaslar var.]

Teknik seçiminiz büyük olasılıkla arsanın amacına bağlı olacaktır: örneğin veri araştırması için yaratılan arsalar genellikle genel izleyiciler için arsalardan farklıdır.


8

Belki kafes olarak sınıflandırılabilir, ama deneyeceğim; bir panelde en yükseğe ölçeklenen tüm çubukları çizin ve daha düşük olanları yakınlaştırmayı gösteren başka bir panel yerleştirin. Saçılma lekesi durumunda bu tekniği bir kez kullandım ve sonuç oldukça güzeldi.


8

Günlük eksen problemini çubuk grafik probleminden ayırırdım.


bir=lgben0-lgbenben0

Kontrol rolünü alan (taban çizgisi, boş), mantıklı ve sabit bir kökeni yoksa, çubuk grafikler hiçbir zaman mantıklı olamaz. Ancak bunun log eksenleriyle ilgisi yok.
Çubuk grafikler için sahip olduğum tek normal kullanım histogramlardır. Ancak, bu kökene olan farkı göstermek için iyi olduklarını hayal edebiliyorum (hemen farkın olumlu mu olumsuz mu olduğunu da hemen görebilirsiniz). Çubuklar bir alanı gösterdiği için, çubuk grafikleri bir eğri altındaki alanın ayrık bir versiyonu olarak düşünme eğilimindeyim. Diğer bir deyişle, x ekseni metrik bir anlama sahip olmalıdır (bu, zaman içinde olabilir, ancak şehirlerde olmayabilir).

Kendimi 0'da "doğal" bir kökene sahip bir şeyin günlüğü için hangi kökenin kullanılacağını merak ediyorsam, geriye dönüp ne olup bittiğini biraz düşünürdüm. Çok sık olarak, bu tür sorunlar sadece kütüğün mantıklı bir dönüşüm olmadığını gösteriyor.

Şimdi kütük eksenlerine sahip bir çubuk grafik, katlarda meydana gelen artışları veya azalmaları vurgulayacaktır. Şu anda düşünebildiğim mantıklı örneklerin hepsinin ilgi değeriyle doğrusal bir ilişkisi var. Ama belki başka biri iyi bir örnek bulur.

Bu nedenle, eldeki verilerin anlamlarına göre veri dönüşümünün mantıklı olması gerektiğini düşünüyorum. Bu, yukarıda bahsettiğim fiziko-kimyasal birimler için geçerlidir (A, konsantrasyonlarla orantılıdır ve pH, örneğin, bir pH-metre içindeki voltajla doğrusal bir ilişkiye sahiptir). Aslında, o kadar ki durum böyledir ki, kayıt birimi yeni bir isim alır ve doğrusal bir şekilde kullanılır.

Son olarak, fakat en az değil, kırılmış eksenlerin düzenli olarak kullanıldığı titreşimsel spektroskopiden geliyorum. Ve bunun, baltaların kırılmasının aldatmadığı birkaç örnekten birini kullandığını düşünüyorum. Ancak, büyüklük sırasına göre değişiklik yapmıyoruz. X serimizin% 30 - 40'ını oluşturan bilgisiz bir bölgeye sahibiz: İşte bir örnek: spektrum Bu örnek için 1800 - 2800 / cm arasındaki bölüm hiçbir faydalı bilgi içeremez.
Bu nedenle, bilgi vermeyen spektral aralık kaldırılır (bu, aynı zamanda kemometrik modelleme için kullandığımız spektral aralıkları da gösterir): spektrum uninformative kısmı kaldırıldı

Ancak verilerin yorumlanması için, x pozisyonunun kesin okumalarına ihtiyacımız var. Ancak genel olarak farklı aralıkları kapsayan katlara ihtiyacımız yoktur (yani, böyle ilişkiler vardır, ancak çoğu bağlantı daha karmaşıktır. Örneğin: 3050 / cm'de sinyal, bu nedenle doymamış veya aromatik bir maddeye sahibiz. Fakat 1000 / cm'de güçlü sinyal yok. yani mono, meta veya 1,3,5-sübstitüe edilmiş aromatik halka yoktur ...)
Bu nedenle, x'i daha büyük bir ölçekte göstermek daha iyidir (aslında genellikle milimetrik yaprak kılavuzları gibi kullanırız veya tam konumları etiketleriz). Böylece ekseni kırarız ve daha büyük bir x ölçeklendiririz: spektrum - kırılmış eksen

Aslında, facetting'e çok benziyor: fasetli versiyon
ancak kırılmış eksen IMHO, her iki kısımdaki x-ekseni ölçeğinin aynı olduğunu vurgulamaktadır. Yani, çizilen bölgelerdeki aralıklar aynıdır.

Küçük yoğunlukları vurgulamak için (y ekseni), büyütülmüş ekleri kullanıyoruz:
görüntü tanımını buraya girin
[ ... Ayrıntılar için, büyütülmüş (x 20) νCH bölgesini mavi renkte görün. ]

Ve bu, bağlantılı alanlardaki örneklerle de kesinlikle mümkündür.


2

Mükemmel cevaplara ve yorumlara baktığımda açıkça açıklanmayan, ancak açıkça açıklanmayan iki fikir, “etiketleme ile tutarsız bir şekilde” ve normalize / boyutsuz verileri içeren bir çubuk grafik kullanıyor olmanızdı.

Arsa türü:

Yıldız / örümcek / radar tarzı grafik (link) (link) , genellikle birden fazla koordinat boyunca birkaç farklı şeyi karşılaştırmak için çok iyidir. İş sunumlarında (ne yazık ki) ender rastlanan çok sayıda yararlı alan vardır, çünkü liderlik, anlayışı elde etmek için bilgileri kullanmak yerine kararlar için kararları kullanmayı tercih eder ve ardından kararları almak için anlayışı kullanır. İş dünyasında fikir birliği oluşturmak bazen çok zordur ve bu nedenle yalnızca sonuç yaklaşımı, fikir birliği ilk önce karar verilmiş bir ortamda daha yüksek verime sahip olabilir. Bu, çubuk / sütun grafiğinin popülerliğini bildirir. Lütfen anlayış kazanmak için iyi olan diğer grafik türlerinin örneklerini düşünün (link) .

Dönüşüm:

Grafik çizdiğiniz değerleri "karakteristik" bir değere bölerseniz, bilgi kaybetmeden okunabilirliği artırmak için ölçeklendirmeyi dönüştürebilirsiniz. Akışkan Dinamiği, öngörücü yararları ve uygulamadaki esneklikleri nedeniyle boyutsuz sayıları tercih eder. Buckingham Pi Teoremi gibi şeylere aday boyutsuz formlar için kaynak olarak bakıyorlar (bağlantı) . Popüler ve kullanışlı, boyutsuz sayılar arasında Reynolds Numarası, Mach numarası, Biot numarası, Grashof numarası, Pi, Raleigh numarası, Stokes numarası ve Sherwood numarası bulunur. (bağlantı) Boyutsuz sayıları sevmek için fizikçi olmak zorunda değilsiniz çünkü fizik dışı uygulamalarda faydalıdırlar. Yoğunluk, homojenlik, dairesellik ve eşitlik gibi ölçüler görüntüleri, piksel alanlarını veya çok değişkenli olasılık dağılımlarını tanımlayabilir. Sadece bir logaritma veya bilinen bir değerden göreceli bir mesafe almayı düşünmeyin - sayıları ters çevirmeyi, kareköklerini almayı da düşünebilirsiniz.

İyi şanslar. Lütfen işlerin nasıl sonuçlandığını bize bildirin.


1
Çoğu veri kurtarma makamı radar haritalarının kullanılmasına şiddetle karşı çıkmaktadır. Yorumlamaları zor. Çok daha iyi bir alternatif paralel koordinat şemasıdır .
Jon Peltier

@JonPeltier - Katılıyorum, ancak Excel'in (cevap verdiğimde) paralel bir koordinat çizelgesi oluşturmak için temiz bir yolu yoktu, bu yüzden izleyicisinin büyük ölçüde anlamak için mücadele edeceği bir şey.
EngrStudent - Monica'yı

1

Kırık eksenli çözüm, arsa üzerinde net bir kırılma olduğunda ve koordinat etiketlendiğinde en iyi sonucu verir, böylece boşluk belirgindir. Bunun avantajı, ölçeğin iki değer kümesinde korunmasıdır. Farklı ölçeklere sahip panel çizimleri, alçak ve yüksek gruplar içindeki bağıl değişimi iletemez. Scatterpots için programladığım ancak bar arazileri için kullanmayı düşünmedim yakınlaştırma fikrini seviyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.