Sıralanan verilerin olmasına izin verin . Ampirik CDF anlamak için G , değerleri birini düşünün x i o --let çağrısı y --ve bazı numara varsayalım k bir x i olan az γ ve t ≥ 1 arasında x i eşit y . Mümkün olan tüm veri değerlerinin yalnızca γ olduğu bir aralık [ α , β ] seçinx1≤x2≤⋯≤xnGxiγkxiγt≥1xiγ[α,β]γbelirir. Daha sonra, tanımı gereği, bu aralık içinde sabit değer alır k / n az numaraları y ve sabit bir değere atlar ( k + t ) / n daha büyük sayılar için y .G,k / nγ( k + t ) / nγ
[ Α , β ] aralığından değerine katkıyı göz önünde bulundurun . Her ne kadar h bir fonksiyonu değildir - bu boyut noktası ölçümüdür t / n de y --Forum tamamlayıcı olan tanımlı bir sade ve basit entegrali haline dönüştürmek için parçaları ile entegrasyon yoluyla. Bunu [ α , β ] aralığı boyunca yapalım :∫b0x sa ( x ) dx[ α , β]ht / nγ[ α , β]
∫βαx sa ( x ) dX = ( x G ( x ) ) |βα- ∫βαG ( x ) dx = ( βG ( β) - α G ( α ) ) - ∫βαG ( x ) dx .
En süreksiz olmasına rağmen yeni integrand, , integrallenebilirdir. Değeri, G'deki atlamadan önceki ve sonraki parçalara entegrasyon alanını kırarak kolayca bulunabilir :γG
∫βαG(x)dx=∫γαG(α)dx+∫βγG(β)dx=(γ−α)G(α)+(β−γ)G(β).
Bunu yukarıdaki yerine koymak ve verimlerini geri çağırmakG(α)=k/n,G(β)=(k+t)/n
∫βαxh(x)dx = ( βG ( β) - α G ( α ) ) - ( ( γ- α ) G ( α ) + ( β- γ) G ( β) ) = γtn.
Başka bir deyişle, bu integral her atlamanın konumunu ( ekseni boyunca ) o atlamanın boyutuyla çarpar . Atlamanın boyutuX
tn= 1n+ ⋯ + 1n
eşit olan her veri değeri için bir terim . Tüm bu tür atlar katkıları ekleme G gösterileri olduğunuγG,
∫b0x sa ( x ) dx = ∑i :0 ≤ xben≤ b( xben1n) = 1nΣxben≤ bxben.
Buna "kısmi ortalama" diyebiliriz, bunun kısmi bir toplamın katına eşit olduğunu görür . (O olduğunu lütfen not olmayan bir beklenti Bu aralığı kesildi altta yatan dağılımının bir versiyonunun beklentisi ile ilgili olabilir. [ 0 , b ] : değiştirmek gerekir 1 / n göre faktör 1 / m burada m , [ 0 , b ] içindeki veri değerlerinin sayısıdır1 / n[ 0 , b ]1 / n1 / mm[ 0 , b ] .)
verildiğinde , hangi b bulmak istiyorum 1kb1nΣxben≤ bxben= k .kj
1nΣi = 1j - 1xben≤ k < 1nΣi = 1jxben,
b[ xj - 1, xj)b
R
aşağıdaki gibi, arama ailesini cumsum
kullanarak herhangi bir belirtilen değeri geçtiği yerde kısmi toplamı hesaplar ve bulur which
:
set.seed(17)
k <- 0.1
var1 <- round(rgamma(10, 1), 2)
x <- sort(var1)
x.partial <- cumsum(x) / length(x)
i <- which.max(x.partial > k)
cat("Upper limit lies between", x[i-1], "and", x[i])
Bu Üstel dağılımdan çekilen veri örneğindeki çıktı:
Üst sınır 0,39 ile 0,57 arasındadır
0.1 = ∫b0x exp( - x ) dx ,0.531812
G,