Parzen pencere yoğunluğu tahmini , çekirdek yoğunluğu tahmini için bir başka isimdir . Verilerden sürekli yoğunluk fonksiyonunu tahmin etmek için parametrik olmayan bir yöntemdir.
Ortak bilinmeyen, muhtemelen sürekli dağıtım dağılımından gelen x1, … , Xn veri noktalarına sahip olduğunuzu hayal edin f . Verilerinizi verilen dağılımı tahmin etmekle ilgileniyorsunuz. Yapabileceğiniz bir şey sadece ampirik dağılıma bakmak ve bunu gerçek dağılıma eşdeğer bir örnek olarak ele almaktır. Ancak, verileriniz sürekli ise, o zaman büyük olasılıkla her xbennokta, veri kümesinde yalnızca bir kez görünür, bu nedenle, bu değere göre, verilerinizin her birinin eşit olasılık olması nedeniyle verilerinizin tek tip bir dağıtımdan geldiği sonucuna varırsınız. Umarım, bundan daha iyisini yapabilirsiniz: Verilerinizi eşit sayıda aralıklı aralıklarla toplayabilir ve her aralığa giren değerleri sayabilirsiniz. Bu yöntem, histogramın tahmin edilmesine dayanacaktır . Ne yazık ki, histogram ile, sürekli dağıtımdan ziyade bazı kutulara sahip olursunuz, bu sadece kabaca bir yaklaşımdır.
Çekirdek yoğunluğu kestirimi üçüncü alternatiftir. Ana fikir yaklaşık olmasıdır f bir yan karışımın sürekli dağılımlar K (sizin notasyonu kullanarak φ ) adı verilen çekirdekleri de ortalanır, xben datapoints ve ölçek (sahip bant genişliği ) için eşit h :
fh^( x ) = 1n sΣi = 1nK( x - xbenh)
Bu, normal dağılımın çekirdek K olarak kullanıldığı ve bant genişliği h için farklı değerlerin , yedi veri noktasından (parsellerin üstündeki renkli çizgilerle işaretlenmiş) verilen dağılımı tahmin etmek için kullanıldığı aşağıdaki resimde gösterilmiştir . Alanlardaki renkli yoğunluklar, çekirdeklerde xben noktalarında ortalanmıştır . Bildirim o h bir olan göreceli parametre, 's değeri her zaman veri ve aynı değerine bağlı olarak seçilir h farklı veri setleri için benzer sonuçlar vermeyebilir.
KK( x ) = K( - x )
h
xbenfxbenhKfh^fh^xfh^( x )f( x )
f
Çekirdek yoğunluğu ile diğer yoğunluklar arasındaki fark, normal dağılım olarak, "normal" yoğunlukların matematiksel fonksiyonlar olduğu halde, çekirdek yoğunluk, verilerinizi kullanarak tahmin edilen gerçek yoğunluğun bir yaklaşımıdır, bu nedenle bunlar "bağımsız" dağılımlar değildir.
Silverman (1986) ve Wand ve Jones (1995) tarafından bu konuda iki güzel tanıtım kitabını öneririm.
Silverman, BW (1986). İstatistikler ve veri analizi için yoğunluk tahmini. CRC / Chapman ve Salon.
Wand, MP ve Jones, MC (1995). Çekirdek Pürüzsüzleştirici. Londra: Chapman ve Hail / CRC.