Parzen pencere (çekirdek) yoğunluk tahminini mesleğin cinsinden açıklayabilir misiniz?


24

Parzen pencere yoğunluğu tahmini

p(x)=1nΣben=1n1h2φ(xben-xh)

burada vektörün elemanların sayısı, X bir vektördür p ( x ) bir olasılık yoğunluk olan x , s Parzen pencere boyutu ve φ bir pencere fonksiyonudur.nxp(x)xhφ

Benim sorularım:

  1. Parzen Pencere İşlevi ile Gauss İşlevi gibi diğer yoğunluk işlevleri arasındaki temel fark nedir?

  2. Pencere İşlevi'nin ( ) x'in yoğunluğunu bulmasındaki rolü nedir ?φx

  3. Neden diğer yoğunluk fonksiyonlarını Pencere Fonksiyonunun yerine takabiliriz?

  4. Rolü nedir yoğunluğunu bulmakta içinde x ?hx

Yanıtlar:


44

Parzen pencere yoğunluğu tahmini , çekirdek yoğunluğu tahmini için bir başka isimdir . Verilerden sürekli yoğunluk fonksiyonunu tahmin etmek için parametrik olmayan bir yöntemdir.

Ortak bilinmeyen, muhtemelen sürekli dağıtım dağılımından gelen x1,...,xn veri noktalarına sahip olduğunuzu hayal edin f . Verilerinizi verilen dağılımı tahmin etmekle ilgileniyorsunuz. Yapabileceğiniz bir şey sadece ampirik dağılıma bakmak ve bunu gerçek dağılıma eşdeğer bir örnek olarak ele almaktır. Ancak, verileriniz sürekli ise, o zaman büyük olasılıkla her xbennokta, veri kümesinde yalnızca bir kez görünür, bu nedenle, bu değere göre, verilerinizin her birinin eşit olasılık olması nedeniyle verilerinizin tek tip bir dağıtımdan geldiği sonucuna varırsınız. Umarım, bundan daha iyisini yapabilirsiniz: Verilerinizi eşit sayıda aralıklı aralıklarla toplayabilir ve her aralığa giren değerleri sayabilirsiniz. Bu yöntem, histogramın tahmin edilmesine dayanacaktır . Ne yazık ki, histogram ile, sürekli dağıtımdan ziyade bazı kutulara sahip olursunuz, bu sadece kabaca bir yaklaşımdır.

Çekirdek yoğunluğu kestirimi üçüncü alternatiftir. Ana fikir yaklaşık olmasıdır f bir yan karışımın sürekli dağılımlar K (sizin notasyonu kullanarak φ ) adı verilen çekirdekleri de ortalanır, xben datapoints ve ölçek (sahip bant genişliği ) için eşit h :

fh^(x)=1nhΣben=1nK(x-xbenh)

Bu, normal dağılımın çekirdek K olarak kullanıldığı ve bant genişliği h için farklı değerlerin , yedi veri noktasından (parsellerin üstündeki renkli çizgilerle işaretlenmiş) verilen dağılımı tahmin etmek için kullanıldığı aşağıdaki resimde gösterilmiştir . Alanlardaki renkli yoğunluklar, çekirdeklerde xben noktalarında ortalanmıştır . Bildirim o h bir olan göreceli parametre, 's değeri her zaman veri ve aynı değerine bağlı olarak seçilir h farklı veri setleri için benzer sonuçlar vermeyebilir.

Aynı verilerde tahmin edilen dört çekirdek yoğunluğu

KK(x)=K(-x)

h

xbenfxbenhKfh^fh^xfh^(x)f(x)

f

Çekirdek yoğunluğu ile diğer yoğunluklar arasındaki fark, normal dağılım olarak, "normal" yoğunlukların matematiksel fonksiyonlar olduğu halde, çekirdek yoğunluk, verilerinizi kullanarak tahmin edilen gerçek yoğunluğun bir yaklaşımıdır, bu nedenle bunlar "bağımsız" dağılımlar değildir.

Silverman (1986) ve Wand ve Jones (1995) tarafından bu konuda iki güzel tanıtım kitabını öneririm.


Silverman, BW (1986). İstatistikler ve veri analizi için yoğunluk tahmini. CRC / Chapman ve Salon.

Wand, MP ve Jones, MC (1995). Çekirdek Pürüzsüzleştirici. Londra: Chapman ve Hail / CRC.


x

xbenx

1
@anonymous "Bu düz İngilizce olarak söyleniyor ..." paragrafının sonunda sorunuza yorum yapan düzenleme ekledim.
Tim

4

φ

xφh(xben-x)xx1=1x2=2σ=1φhxN-1,1(x)+N-2,1(x)2

3) Pencere işleviniz olarak istediğiniz herhangi bir yoğunluk işlevini takabilirsiniz.

h

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.