Bildirilecek önemli basamak sayısı


12

Oldukça standart olan bir durumda ortalama veya güven aralığı için raporlanacak anlamlı basamak sayısını belirlemenin daha bilimsel bir yolu var mı - örneğin, üniversitedeki birinci sınıf sınıfı.

Bir tabloya koymak için önemli rakamların sayısını gördüm , Neden önemli basamakları ve chi kare uyumunda anlamlı rakamlar kullanmıyoruz , ancak bunlar parmağını soruna sokmuyor gibi görünüyor.

Derslerimde öğrencilerime, sonuçlarında bu kadar geniş bir standart hatayla karşılaştıklarında 15 önemli haneyi rapor etmenin bir mürekkep israfı olduğunu açıklamaya çalışıyorum - bağırsak hissim, . Bu, ASTM - E29'a atıfta bulunan ve ile arasında olması gerektiğini söyledikleri Test Sonuçlarının Raporlanmasından çok farklı değildir .0.05 σ 0.5 σ0.25σ0.05σ0.5σ

DÜZENLE:

xAşağıdaki gibi bir sayı kümem olduğunda, ortalama ve standart sapmayı yazdırmak için kaç basamak kullanmalıyım?

set.seed(123)
x <- rnorm(30) # default mean=0, sd=1
# R defaults to 7 digits of precision options(digits=7)
mean(x) # -0.04710376 - not far off theoretical 0
sd(x) # 0.9810307 - not far from theoretical 1
sd(x)/sqrt(length(x)) # standard error of mean 0.1791109

SORU: Buradaki ortalama ve standart sapma için hassasiyetin ne olduğunu (çift kesinlikli sayıların bir vektörü olduğunda) ayrıntılı olarak açıklayın ve ortalama ve standart sapmayı önemli sayıda basamağa bastıracak basit bir R pedagojik fonksiyon yazın vektöre yansıtılır x.


Neden "Bir tabloya konacak anlamlı figürlerin sayısı" sorunuzu tam olarak ele almıyor anlamıyorum: Bu soru hangi noktayı kaçırıyor?
whuber

Bu soruya vereceğiniz cevabı @whuber, ama biraz daha detay istiyorum.
Sean

1
Ama ne hakkında ayrıntı? Her halükarda, sorunuz gerçekten bunun tam bir kopyası gibi görünüyor ve ne yapmak istediğinizi cevaplarında iyileştirmeler görmek . Doğrumuyum? BTW, pedagojik rehberlik arıyorsanız, coğrafi koordinatların raporlanmasıyla ilgili olarak gis.stackexchange.com/questions/8650 adresinde yayınladığım bir (uzman) örneğe işaret etmek istiyorum: önemli sayıları ilişkilendirmek için bir fikir var boyutları en çok okuyucuları kolayca ve sezgisel olarak kavrayacak nesnelerle rakamlar. Benzer bir yaklaşım diğer uygulamalarda da işe yarayabilir.
whuber

1
@whuber evet haklısın ve bu örneği beğendim. Sanırım hassasiyetin standart sapmayla nasıl ilişkili olduğu hakkında daha fazla ayrıntı arıyorum. Örneğin R, x <rnorm (30); (x) anlamına gelir; sd (x) # burada açıkça sd yaklaşık 1'dir, ancak R'de ortalama 7 basamaklı hassasiyetle varsayılan olarak yazdırılır. sd (x) / 30 yaklaşık 0.18'dir. Teşekkürler
Sean

Gelen Rbaskı global değeri tarafından kontrol edilmektedir (yanı sıra hemen hemen tüm yazılım) (bkz options(digits=...)değil kesinliğin herhangi dikkate tarafından).
whuber

Yanıtlar:


9

Ölçümde Belirsizlik Kılavuzu (GUM), belirsizliğin 2 basamaktan fazla olmamasını ve sonucun belirsizliğe uygun hale getirilmesi için gereken önemli basamak sayısıyla rapor edilmesini önerir. Aşağıdaki Bölüm 7.2.2'ye bakın

http://www.bipm.org/utils/common/documents/jcgm/JCGM_100_2008_E.pdf

Aşağıdaki kod, R'deki bu öneriyi uygulama girişimimdi. Noe, R'nin anlamlı olsalar bile, çıkıştaki sıfırları tutma girişimleriyle işbirliği yapamayabileceğini söyledi.

gumr <- function(x.n,x.u) {
  z2 <- trunc(log10(x.u))+1
  z1 <- round(x.u/(10^z2),2)
  y1 <- round(x.n*10^(-z2),2)
  list(value=y1*10^z2,uncert=z1*10^z2)
}

x.val <- 8165.666
x.unc <- 338.9741
gumr(x.val,x.unc)

> gumr(x.val,x.unc) $value [1] 8170 $uncert [1] 340
Tamlık

@rhombidodecahedron burada belirsizliğin sadece bir önemli rakamı olmamalı mı? 82 ± 3 (× 10²)
jfs

@jfs önerinin belirsizlik içinde iki önemli rakam kullanmasını söylüyor, değil mi?
rhombidodecahedron

@rhombidodecahedron cevabı "en fazla 2" diyor GUM'daki kriterler benim için belirsiz. Arxiv.org/pdf/1301.1034.pdf adresindeki tablo 3, 7'den az ölçüm için raporlanacak 1 önemli basamak önerir.
jfs

Örnek kod, önerilen GUM kuralına uymuyor. Eğer val = 8165.666ve unc = 338.9741ölçüm olarak rapor edilmelidir val = 8.17(34)*10^3(değil val = 8170ile unc = 340verildiği gibi), belirsizlik sadece iki basamak önemli olduğunu açıklığa kavuşturmak.
divenex

6

Güven aralığını ve istatistiğin değerini gösterirseniz, istediğiniz kadar önemli rakam vermekle ilgili bir sorun yoktur, çünkü bu durumda çok sayıda önemli rakam, güven aralığı verdiği gibi sahte hassasiyet anlamına gelmez. olası gerçek hassasiyetin bir göstergesi (güvenilir bir aralık daha iyi olurdu). O zaman esasen masayı düzgün, özlü ve okunabilir hale getirme meselesidir, bu yüzden esasen tüm olaylara uygun basit bir kural olması olası değildir.

Tekrarlanabilirlik bilimsel çalışmalarda önemlidir, bu yüzden ideal olarak sonuçları herhangi bir sayıda belirleyici rakama (pratik öneme sahip olsun ya da olmasın) çoğaltmak mümkün olmalıdır. Az sayıda önemli rakama yuvarlama, sonuçların yuvarlanmasıyla hatalar maskelenebileceğinden, bir çalışmanın tekrarlanmasına olan güveni azaltabilir, bu nedenle bazı durumlarda yuvarlamanın olası bir dezavantajı vardır.

Fazla ileri gitmemenin bir başka nedeni, başkalarının çalışmanızı gerçekte tekrar etmeden uzatmasını imkansız kılabilmesidir. Örneğin, Friedman testini kullanarak çeşitli makine öğrenme algoritmalarını karşılaştıran bir makale yayınlayabilirim; bu, bir dizi karşılaştırma veri kümesindeki farklı algoritmaların sıralamasına bağlıdır. Her veri kümesindeki bireysel sınıflandırıcılar için istatistikler, standart hatalarına bağlı olarak bir dizi önemli rakama verilirse, bu şüphesiz sıralamalarda birçok görünür bağ yaratacaktır. Bu, (i) makalenin okuyucusunun / değerlendiricisinin, makalede verilen sonuçlardan Friedman testini kopyalayamayacağı ve (ii) daha sonra bir başkasının karşılaştırma veri kümelerindeki algoritmalarını değerlendiremeyeceği ve Friedman'ı kullanamayacağı anlamına gelir. benim çalışmamın sonuçları bağlamına koymak için test.


4

Kesinlikle objektif veya öznel olarak alınan herhangi bir karar, ölçtüğünüz şeye ve ölçüm enstrümanınızın ne kadar kesin olduğuna bağlı olacaktır. İkincisi, gözlemlenen varyasyonun sadece bir parçasıdır ve mevcut kanıtları fark etmek veya bulmak her zaman kolay değildir. Dolayısıyla, nesnel ve evrensel olarak uygulanabilir bir karar olmadığından şüpheleniyorum. Beyninizi kullanmanız ve her durumda en iyi kararı vermeniz yeterlidir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.