Ecdf neden doğrusal enterpolasyon değil bir adım fonksiyonu kullanıyor?


13

Ampirik CDF fonksiyonları genellikle bir basamak fonksiyonu ile tahmin edilir. Bunun doğrusal bir enterpolasyon kullanarak değil, böyle yapılmasının bir nedeni var mı? Adım fonksiyonunun bizi tercih eden ilginç teorik özellikleri var mı?

İşte ikisinin bir örneği:

ecdf2 <- function (x) {
  x <- sort(x)
  n <- length(x)
  if (n < 1) 
    stop("'x' must have 1 or more non-missing values")
  vals <- unique(x)
  rval <- approxfun(vals, cumsum(tabulate(match(x, vals)))/n, 
                    method = "linear", yleft = 0, yright = 1, f = 0, ties = "ordered")
  class(rval) <- c("ecdf", class(rval))
  assign("nobs", n, envir = environment(rval))
  attr(rval, "call") <- sys.call()
  rval
}


set.seed(2016-08-18)
a <- rnorm(10)
a2 <- ecdf(a)
a3 <- ecdf2(a)

par(mfrow = c(1,2))
curve(a2, -2,2, main = "step function ecdf")
curve(a3, -2,2, main = "linear interpolation function ecdf")

resim açıklamasını buraya girin


İlgili ...................................

8
x1,x2,,xn(Ω,S,P)Ω={1,2,,n}SPXxiiX

Yanıtlar:


22

Tanım gereği.

(Xn)

Fe(t)=#{XnXnt}n

#

P(X=x)0x

FX(x)=pχx0+(1p)χx1
χx0(p+(1p)min(x,1))(0,p)(1,1)

Teşekkürler Alex. Yazdığım fonksiyon için başka bir isim var mı? (çünkü aynı zamanda gerçek CDF'ye de yaklaştığını tahmin ediyorum)
Tal Galili

5
@TalGalili Yapmaz. Bir Bernoulli dağılımı düşünün. Bu durumda ecdf2'niz yakınslanmaz. Buna düzgünleştirilmiş bir ecdf diyebilirsiniz. Gerçek
CDF'nin

@AlexR, bu dağılımı eklemek için cevabınızı düzenleyebilirsiniz, çünkü ayrık dağılımlar böyle kesin bir nedendir - bu yüzden "neden" sorusunu cevaplar.
Tim

1
@Tim Bitti.
AlexR

Teşekkürler. Adım işlevine yaklaşacak ancak tamamen monoton olacak (yani: keskin bir "sıçrama" olmadan) sürekli ampirik bir işlevi tanımlamanın bir yolu var mı?
Tal Galili
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.