Çekirdek yoğunluk tahminleri yapmak için R'de ' yoğunluk ' işlevini kullanmaya çalışıyorum . Sonuçları yorumlamakta ve çeşitli veri kümelerini eğri altındaki alanın mutlaka olması gerekmediği gibi karşılaştırmakta zorluk çekiyorum. Herhangi bir olasılık yoğunluk fonksiyonu (pdf) , ∫ ∞ - ∞ ϕ ( x ) d x = 1 . Çekirdek yoğunluk tahmininin pdf rapor ettiğini varsayıyorum. Ben kullanıyorum integrate.xy gelen sfsmisc eğri altında kalan alan tahmin etmek.
> # generate some data
> xx<-rnorm(10000)
> # get density
> xy <- density(xx)
> # plot it
> plot(xy)
> # load the library
> library(sfsmisc)
> integrate.xy(xy$x,xy$y)
[1] 1.000978
> # fair enough, area close to 1
> # use another bw
> xy <- density(xx,bw=.001)
> plot(xy)
> integrate.xy(xy$x,xy$y)
[1] 6.518703
> xy <- density(xx,bw=1)
> integrate.xy(xy$x,xy$y)
[1] 1.000977
> plot(xy)
> xy <- density(xx,bw=1e-6)
> integrate.xy(xy$x,xy$y)
[1] 6507.451
> plot(xy)
Eğrinin altındaki alan her zaman 1 olmamalı mı? Küçük bant genişlikleri bir sorun gibi görünüyor, ancak bazen kuyruklarda ayrıntıları vb. Göstermek istiyorsunuz ve küçük bant genişliklerine ihtiyaç var.
Güncelleme / Cevap:
> xy <- density(xx,n=2^15,bw=.001)
> plot(xy)
> integrate.xy(xy$x,xy$y)
[1] 1.000015
> xy <- density(xx,n=2^20,bw=1e-6)
> integrate.xy(xy$x,xy$y)
[1] 2.812398