Çekirdek yoğunluk tahmininde çekirdek bant genişliği


10

Ağırlıklı noktalar ayarlanmış (yani her bir numunenin gerekli olmayan bir ağırlığı vardır), N boyutlarında bazı Çekirdek yoğunluk tahmini yapıyorum. Ayrıca, bu örnekler sadece bir metrik uzaydadır (yani, aralarındaki mesafeyi tanımlayabiliriz) ama başka bir şey değildir. Örneğin, numune noktalarının ortalamasını, standart sapmayı veya bir değişkeni diğerine göre ölçekleyemeyiz. Çekirdek sadece bu mesafeden ve her örneğin ağırlığından etkilenir:

f(x)=1.Σwebenghtsben*Σwebenghtbenh*Kernel(dbenstbirnce(x,xben)h)

Bu bağlamda, çekirdek bant genişliği , muhtemelen mekansal olarak değişen ve tercihen eğitim veri kümesi üzerinde kesin bir yeniden yapılandırma sağlayan sağlam bir tahmin bulmaya çalışıyorum . Gerekirse, işlevin nispeten pürüzsüz olduğunu varsayabiliriz.hxben

İlk veya ikinci en yakın komşuya olan mesafeyi kullanmayı denedim ama oldukça kötü sonuçlar veriyor. Bir defaya mahsus optimizasyon ile denedim, ancak Nd'de bu bağlamda optimize etmek için iyi bir önlem bulmakta zorlanıyorum, bu nedenle özellikle eğitim örnekleri için çok kötü tahminler buluyor. Standart sapmayı hesaplayamadığım için normal varsayımı temel alan açgözlü tahmin yapamıyorum. Anizotropik çekirdekler elde etmek için kovaryans matrislerini kullanarak referanslar buldum, ama yine de, bu alanda tutamazdı ...

Birinin bir fikri veya referansı var mı?


Mesafeyi ölçebilirseniz, bir ortalama ölçebilirsiniz. Bu doğru mu? "Kelimeler için kosinüs mesafesi kullanıyorum" diyebilirim, bu yüzden "ortalama bir kelimenin gerçekten fazla bir anlamı yok", ama neden hala hesaplanamadığını anlamıyorum. Sıralı bir alanda olduğunuzu söyleyebilirsiniz, bu nedenle ortalama sürekli değerlenmez. Ortalama neden tanımlanamaz?
EngrStudent

Yanıtlar:


3

Başlamak için bir yer Silverman'ın en yakın komşu tahmincisi olacaktır , ancak bir şekilde ağırlık eklemek. (Ağırlıklarınızın burada ne olduğundan tam olarak emin değilim.) En yakın komşu yöntemi mesafeler açısından açık bir şekilde formüle edilebilir. İlk ve ikinci en yakın komşu yönteminizin en yakın komşu yönteminin sürümleri olduğunu, ancak çekirdek işlevi olmayan ve değerinin küçük olduğunu düşünüyorum .k


2

Matlab Dosya Değişimi'nde, Gauss çekirdeğinin kullanıldığı varsayımıyla en uygun bant genişliğini sağlayan bir kde işlevi vardır: Çekirdek Yoğunluk Tahmincisi .

Matlab'ı kullanmasanız bile, optimum bant genişliğini hesaplama yöntemi için bu kodu ayrıştırabilirsiniz. Bu dosya alışverişinde yüksek puan alan bir işlevdir ve birçok kez kullandım.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.