“Çekirdek yoğunluğu kestirimi” neyin bir dönüşümüdür?


25

Çekirdek yoğunluğu tahminini daha iyi anlamaya çalışıyorum.

Vikipedi tanımını kullanarak: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition

fh^(x)=1ni=1nKh(xxi)=1nhi=1nK(xxih)

yi , ile ile arasında olması durumunda , (pencere boyutu) 1 olması için 1 veren dikdörtgen bir fonksiyon olarak alalım .1 x - 0.5 , 0.5 0 hK()1x0.50.50h

Yoğunluğun iki fonksiyonun katlanması olduğunu anlıyorum, ancak bu iki fonksiyonu nasıl tanımlayacağımı bildiğimden emin değilim. Bunlardan biri (muhtemelen) R'deki her nokta için bize o konumda kaç tane veri noktamız olduğunu söyleyen verinin bir fonksiyonu olmalıdır (çoğunlukla ). Ve diğer işlev muhtemelen çekirdek boyutunda, pencere boyutuyla birleştirilmiş bir düzenleme olmalıdır. Ama nasıl tanımlayacağımı bilmiyorum0

Baska öneri?

Körük, yukarıda tanımladığım ayarları (iki Gauss ve karışımıyla) çoğaltan , üzerinde fonksiyonların şüpheli olduğumuzu gösteren bir "kanıt" görmeyi umduğum bir örneği olan R kodudur. .n=100

# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)

görüntü tanımını buraya girin


3
Dipteki kiliminiz biraz kaba sezgiler veriyor. Her bir değer düşünün gelen üzere bağlantılı bir ağırlığa sahip bir çivi olan . Şimdi, çekirdeğinizin şeklini ve genişliğini kullanarak her bir başaktan sürün, böylece başak, aynı alan ve genişlikte olacak şekilde dönüştürülecek şekilde, aşağıdaki alan yükselmelidir . Sonuçları ekleyin ve bir çekirdek yoğunluğu tahmininiz olsun. i = 1 n 1 / n 1 / nxii=1n1/n1/n
Nick Cox

Merhaba Nick, yorumunuz için teşekkürler. Şimdiye kadar sahip olduğum sezgide, resmen görmek istediğim konvolüsyon biçimine dönüyor :) (şimdi Whuber'in cevabını almaya istekliyim!)
Tal Galili

Yanıtlar:


27

Herhangi bir veri karşılık gelen "ampirik yoğunluk işlevi" dirX=(x1,x2,,xn)

fX(x)=1ni=1nδ(xxi).

Burada, "genelleştirilmiş bir işlevdir". Bu isme rağmen, hiçbir şekilde bir fonksiyon değil: sadece integrallerde kullanılabilecek yeni bir matematiksel nesne. Tanımlayıcı özelliği, mahallesinde sürekli olan herhangi bir kompakt destek fonksiyonu için ,δg0

Rδ(x)g(x)dx=g(0).

( adları "atomik" veya "nokta" ölçüsü ve " Dirac delta işlevi " içerir. Aşağıdaki hesaplamada, bu kavram yalnızca bir taraftan sürekli olan işlevlerini içerecek şekilde genişletilmiştir .)δgg

Bu karakterizasyonu Justifying gözlem olmasıdırfX

xfX(y)dy=x1ni=1nδ(yxi)dy=1ni=1nxδ(yxi)dy=1ni=1nRI(yx)δ(yxi)dy=1ni=1nI(xix)=FX(x)

burada normal deneysel CDF ve her zamanki karakteristik fonksiyonudur (e eşit argümanı doğrudur ve başka bir şekilde). (I üzerinden tanımlanan işlevlere kompakt destek fonksiyonları taşımak için gerekli temel bir sınırlama argüman atlama ; çünkü tek aralığında değerleri için tanımlanması gerekir kompakt, bunun herhangi bir sorundur.)FXI10RIX

Evrişim herhangi bir başka fonksiyonu olarak, tanım olarak, verilirfX(x)k

(fXk)(x)=RfX(xy)k(y)dy=R1ni=1nδ(xyxi)k(y)dy=1ni=1nRδ(xyxi)k(y)dy=1ni=1nk(xix).

İzin vermek (aynıdır Ara formül evrişim: Biz talep edilen bir sonuç elde etmek - ve en çekirdekleri simetriktir simetrik çekirdekler için).k(x)=Kh(x)Kh(x)


1
İki boyuttaki durum (daha açık ifadelerle) açıklanmakta ve GIS sitesinde gis.stackexchange.com/questions/14374/… adresinde gösterilmektedir .
whuber

1
Sevgili Whuber, Sadece gittim ve cevabını sevinçle okudum! Açıklama ve detaylar için çok teşekkür ederim, cevaplarınız (bu ve genel olarak diğerleriniz) gerçekten ilham veriyor. Sevgiler, Tal
Tal Galili 23:13

1
@Jan Anlayışınız tam olarak doğru değil. Sonlu bir sürekli ölçü anlamında herhangi bir ampirik "yoğunluk" yoktur. Verilerin gösterge işlevi sıfıra entegre olur (Lebesgue entegrasyonunu veya Riemann entegrasyonunu kullanmanız farketmez). Genelleştirilmiş işlev hiç bir işlev değildir: yalnızca integraller içinde kullanılabilecek yeni bir matematiksel nesnedir. Ampirik dağılım , herhangi bir bütünleştirilebilir fonksiyona bütünleştiğinde değerlerinin toplamını (tüm veri üzerinde ) döndüren matematiksel bir nesnedirg , x i g ( x i ) .δg,xbeng(xben).
whuber

1
@whuber Teşekkürler. Cümle Genelleştirilmiş fonksiyon δ hiç bir fonksiyon değildir: sadece integrallerde kullanılabilecek yeni bir matematiksel nesnedir. daha net yaptı. her zamanki gibi ;)
Jan Vainer

1
@Jan Yardımın için teşekkürler: Bu cevabı bu fikri dahil ettim.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.