Bunun gibi verilerle sonuçları dönüştürülmüş bir ölçekte göstermeniz gerektiğini söyleyebilirim. Bu, bir kutu grafiğinin nasıl çizileceğinden daha önemli ve daha önemli bir konudur.
Ancak Frank Harrell'i, bazı aşırı noktalar belirlenmiş olsa bile, minimal bir kutu planından daha bilgilendirici bir şey çağırmak için tekrar ediyorum. Daha fazla bilgi göstermek için yeterli alanınız var. İşte birçok örnekten biri, hibrit bir kutu ve kantil grafik. Verilerinizde olduğu gibi, karşılaştırılan iki grup vardır.
Bu iki noktayı tek tek alıp daha fazlasını söyleyeceğim.
Dönüştürülmüş ölçek
En basit durumda, tüm değerleriniz olumlu olabilir ve önce logaritmik bir ölçek kullanmayı denemelisiniz.
Kesin sıfırlarınız varsa, kare bir kök veya küp kök ölçeği yine de aşırı çarpıklığı geliştirecektir. Bazı insanlar sıfırlarla başa çıkmanın bir yolu olarak sabitin en yaygın olarak 1 olduğu log (değer + sabit) ile mutludurlar.
Dönüştürülmüş bir ölçek kullanmanın kutu çizimleri için imaları incedir.
Üst çeyrek + 1.5 IQR veya alt çeyrek - 1.5 IQR ötesindeki tüm noktaları tek tek göstermek için ortak Tukey kuralını kullanırsanız, bu sınırlar dönüştürülmüş ölçekte hesaplanmalıdır. Bu, orijinal ölçekte bu limitleri hesaplamak ve sonra dönüştürmekle aynı şey değildir .
Bunun yerine, hala bıyıkların uçları için kantilleri seçmenin bir azınlık sözleşmesi gibi görünen şeyi destekliyorum. Bunun birkaç avantajından biri, kuantil dönüşümün - dönüşüm kuantil dönüşümünün, çoğu durumda grafiksel amaçlar için en azından yeterince yakın olmasıdır. (Küçük baskı, bitişik sıra istatistikleri arasındaki doğrusal enterpolasyon ile miktarlar hesaplandığında ortaya çıkar.)
Bu kantil konvansiyon Cleveland (1985) tarafından oldukça belirgindi. Kayıt için coğrafya ve klimatolojide (örn.) Matthews (1936) ve Grove (1956) "dağılım diyagramları" adı.
Kutu grafiklerinden daha fazlası
Kutu arsaları 1970'lerde Tukey tarafından yeniden icat edildi ve en belirgin şekilde 1977 kitabında tanıtıldı. Amacının çoğu, gayri resmi keşifte kalem (cil) ve kağıt kullanılarak hızlı bir şekilde çizilebilecek grafikleri tanıtmaktı. Ayrıca olası aykırı değerleri tanımlamanın yollarını da önerdi. Bu iyiydi, ama şimdi hepimiz bilgisayarlara erişimimiz var, tüm veriler olmasa da, en azından çok daha fazla ayrıntı gösteren grafikler çizmek acı çekmiyor. Kutu grafiklerinin özet rolü değerlidir, ancak bir grafik, ilginç veya önemli olması durumunda, ince yapıyı da gösterebilir. (Ve araştırmacıların ilgisiz veya önemsiz olduğunu düşündükleri okuyucuları için daha çarpıcı olabilir.)
Tam olarak neyin en iyi işe yaradığına dair kibar anlaşmazlıklara yer var, ancak bence çıplak kutu arazileri oldukça fazla satıldı.
Stata kullanıcıları bu Statalist gönderisinde figürü çizen program hakkında daha fazla bilgi bulabilirler . Diğer yazılım kullanıcıları, iyi veya daha iyi bir şey çizmekte zorluk çekmemelidirler (bu yazılımı neden kullanmalısınız?).
Cleveland, WS 1985. Grafik veri unsurları. Monterey, CA: Wadsworth.
Grove, AT 1956. Nijerya'da toprak erozyonu. Steel, RW ve Fisher, CA (Eds)
İngiliz tropik topraklarında coğrafi denemeler. Londra: George Philip, 79-111.
Matthews, HA 1936. Bazı tanıdık Hint yağışlarının yeni bir görünümü. İskoç Coğrafi Dergisi 52: 84-97.
Tukey, JW 1977. Keşifsel veri analizi. Reading, MA: Addison-Wesley.