Tabloya konacak anlamlı rakam sayısı?


13

Yayınlanacak önemli sayıların sayısı için iyi kurulmuş bir kural var mı?

İşte bazı özel örnekler / sorular:

  • Önemli rakamların sayısını varyasyon katsayısı ile ilişkilendirmenin bir yolu var mı? Örneğin, tahmin 12.3 ve CV% 50 ise, '.3' ile temsil edilen bilgilerin sıfıra yaklaştığı anlamına mı geliyor?

  • Bir güven aralığı bir dizi büyüklük sırasına sahipse, yine de aynı sayıda önemli rakama sahip olmaları gerekiyorsa, örneğin:

    12,3 (1,2, 123,4) - 12 (1,2, 120) karşılaştırması

  • Hata tahminindeki anlamlı rakamların sayısı ortalamadaki anlamlı rakamların sayısıyla aynı mı yoksa daha az mı olmalı?


Mümkünse, tablo kullanmayın :) Bir grafik IMO, neredeyse her zaman bir tablodan daha kolay okunur (çok sayıda numaranız yoksa açık bir istisna). Dergiler ve hakemleri maalesef her zaman aynı fikirde değiller ....
JMS

3
@JMS İyi bir nokta, ancak Tablolar, istatistiksel birimlerin ayrıntılı özelliklerini (faktör ilgisine göre, örneğin klinik tanı veya herhangi bir şekilde sınıflandırılmış), farklı tipteki değişkenlerle (sürekli, nominal ve sıralı) ve türetilmiş diğer sonuçların ayrıntılı özelliklerini özetlemek için yararlıdır. Şekillere uymayan kendi başına istatistiksel modelleme (konfüzyon matrisi, regresyon katsayısı vb.) (veya Gelman'ın regef katsayısını dotcharts olarak gösterme yaklaşımını her zaman düşünmüyorsanız). İkisine de ihtiyacımız var; asıl soru, ne zaman bir Tablo, IMO yerine bir Figüre gerçekten ihtiyacımız var.
chl

@chi Fuarı. Neredeyse her zaman söyledim :). Büyük n-yollu tablolar gibi şeylerin (tamamen) grafik olarak çoğaltılması imkansızdır. Söyleyeceğim foruma bağlı. Tablolar emin, tam olmanın yararı vardır ancak okuyucu aslında yok absorbe tüm bu ekstra bilgi? Bir grafiğe sığacak çok fazla parametre varsa, bir tablonun okunması genellikle en az zor olduğunu iddia ediyorum. Ancak, tekrarlanabilirlik dışında hiçbir şey için tam sonuçların erişilebilir olması gerektiğini düşünüyorum (çevrimiçi, ek, vb). Bu durumda veri ve kod da istiyorum! Gezinti OT, üzgünüm ..
JMS

Ayrıca regresyon katsayıları ve karışıklık (korelasyon, kovaryans, ...) matrislerinin genellikle bir grafik gösterim, dotplotlar veya benzerleri için daha iyi ve ikincisi için ısı haritaları veya grafikler için daha uygun olduğunu düşünüyorum.
JMS

@JMS Senin fikrinle aynı fikirdeyim, ama bu durumda bir rakam limiti var, diğer bazı durumlarda rakam ücretleri var. Ayrıca, bu durumda, okuyucular masaya bakıp sunulan rakamlara odaklanırlarsa, ezoterik bir figürün noktasını anlamaya çalışırken zaman kaybetmezler. Ama ben tekrarlanabilirliği tamamen destekliyorum ve ben bunu yaparken, ekli koda tablo görselleştirme ekleyebilirsiniz.
David LeBauer

Yanıtlar:


19

Evrensel bir kural olduğundan şüpheliyim, bu yüzden telafi etmeyeceğim. Bu düşünceleri ve arkasındaki nedenleri paylaşabilirim:

  • Özetler verinin kendisini yansıttığında - maks, min, sipariş istatistikleri vb. - verileri ilk etapta kaydetmek için kullanılan aynı sayıda anlamlı rakam kullanın. Bu, verilerin doğruluğu konusunda belge boyunca tutarlı bir sunum sağlar.

  • Özetler verilerden daha yüksek hassasiyete sahip olduğunda, değerleri bu ekstra hassasiyeti yansıtacak şekilde yazın . Örneğin, değerlerinin ortalaması , tek tek değerlerin kesinliğinin katıdır: kabaca, için bir ekstra anlamlı rakam , için iki , vb. . (Bu açıkça bir log-10 ölçeğinde yuvarlanıyor.)nn3n3030<n300

    CV olmadığını -NOT değil bu konuda yararlı bilgiler sağlamaktadır.

    -Bazı tahminler büyük bir hassasiyetle elde edilebilir. Başka bir şeyle eşleşmek için yuvarlanmaları gerekmez. Örneğin, 1.000.000 tamsayının ortalaması 10.977 olabilir ve standart hata 0.00301'dir. Ortalamayı üç ondalık basamağa (ve 4-5 sig incir) yazma kararım, son basamağın kısmen güvenilir olduğunu gösteren SE'nin büyüklüğüne dayanıyordu. SE'yi üç sig incire (beş ondalık basamak) yazma kararı daha keyfidir: iki sig inciri işe yarar; muhtemelen olmazdı; dört sig incir de çalışır ve ortalama 4-5 sig incir ile tutarlıdır; dörtten fazla sig incir aşırıya kaçar. (Verilerin dördüncü anı açısından SE'nin standart hatasını tahmin edebilir ve bunu uygun bir yuvarlama miktarını belirlemek için kullanabiliriz, ancak çoğumuz böyle bir belaya gitmeyiz ...)

  • Önemli miktarda yuvarlama yaparken okuyucuya sinyal verin . Rapor istatistiksel testin kendisini tartışırken özellikle dikkatli olun . Bunun nedeni, insanların kendi hesaplarını kontrol etmek için çalışmanızı kullanabilmeleridir. Bazen küçük bir fark bile bir hata ortaya çıkarabilir. Bela etmek istemezsiniz çünkü 123'den 120'ye yuvarladınız ve bir başkası işi kontrol ediyor, 123'ü alıyor ve birinizin eridiğinden şüpheleniyor.

  • Tutarlı olun . Bir değeri bir noktada 123 olarak listelerseniz ve daha sonra 120 olarak referans verirseniz bazı okuyucuları kaybedebilirsiniz.

  • Saçmalama . (Örneğin, verilerin yalnızca iki sig inciri olduğunda 15 sig incirine istatistiksel sonuçlar veren raporlarla karşılaştığımda otomatik olarak yetersiz olduğundan şüpheleniyorum.)


2
Benim çok büyük +1 çünkü gerçekten çok iyi tavsiyeler. Aynı şekilde, öğrencilere anketlerden (veya oylardan) toplanan verileri% ondalık sayılarla (örnek hatayı etkilemeden) standart olarak özetlemenin gerçekten anlamsız olduğunu göstermeyi seviyorum.
chl

0

12 öneririm (1.2, 123.4). .3'ü neredeyse anlamsız olduğu için atlayın, ancak birçok insan (1.2, 120) gördüklerinde 120'deki son '0'ın önemli olduğunu varsayacaktır.


Eğer CI'lerde göstermeyi kabul ediyorsanız, neden istatistiğin ondalık kısmını atlamayı öneriyorsunuz (yani, 12 için anlamsızsa, neden 123.4 için mantıklıdır)?
chl

@chl: pek mantıklı değil, ama ihmal edilmesi yanıltıcı olabilir. Eğer 123.4 koyarsam, sizin gibi biri fazladan rakamları görecek ve sadece dikkate almayacaktır, zarar vermez. 120 koyarsam, birçok okuyucu bunun 3 basamak için doğru olduğunu düşünecektir - kötü.
AVB

neden 123 yerine 123.4'ü önerdiğinizi hala net değil (örnekte neden
.3'ü atlayın
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.