Uyarlanabilir çekirdek yoğunluk tahmin edicileri?

Herhangi biri uyarlanabilir bir çekirdek yoğunluğu tahmincisi ile deneyimlerini rapor edebilir mi?
(Birçok eşanlamlı vardır: uyarlanabilir | değişken | değişken genişlik, KDE | histogram | enterpolatör ...)

Değişken çekirdek yoğunluğu tahmini , "örnek alanının farklı bölgelerindeki çekirdeğin genişliğini değiştiririz. İki yöntem vardır ..." aslında, daha fazlası: bazı yarıçaplardaki komşular, KNN en yakın komşuları (K genellikle sabit), Kd ağaçları, multigrid ...
Elbette tek bir yöntem her şeyi yapamaz, ancak uyarlanabilir yöntemler çekici görünür.
Örneğin, Sonlu elemanlar yönteminde uyarlanabilir bir 2d ağın güzel resmine bakınız .

Gerçek veri için neyin işe yarayıp neyin işe yaramadığını duymak istiyorum, özellikle> = 100k dağınık veri noktaları 2d veya 3d.

2 Kas eklendi: İşte "topaklı" yoğunluk (parçalı x ^ 2 * y ^ 2), en yakın komşu tahmini ve Scott faktörü ile Gauss KDE'nin bir grafiği. Bir (1) örnek hiçbir şeyi kanıtlamasa da, NN'nin keskin tepelere oldukça iyi sığabileceğini gösteriyor (ve KD ağaçlarını kullanarak 2d, 3d'de hızlı ...) alternatif metin

kde k-nearest-neighbour

— denis
kaynak

"Neyin işe yaradığı" veya projenizin özel hedefleriyle ne demek istediğinizle ilgili daha fazla bağlam verebilir misiniz? Onları mekansal nokta süreçlerini görselleştirmek için kullandım, ancak bu soruyu sorduğunuzda aklınızda bulundurduğunuz şeyden şüpheliyim.

— Andy W

Yanıtlar:

* DG Terrell; DW Scott (1992). Msgstr "Değişken çekirdek yoğunluğu tahmini". İstatistik 20 Annals. 1236-1265 * Kendinizi açıkça alıntı Vikipedi makalenin sonunda belirtilen gözlemler boşluk olmadığı sürece çok seyrek değişken çekirdek yöntemi olduğunu belirtiyor değil küresel kök ortalama kare hatası bazında (hem yerel önerilen ve global) Gauss dağıtılmış rasgele değişkenler için: (teorik argümanlarla) ( örnek boyutudur) ve (önyükleme sonuçları aracılığıyla) ( $n\leq 450$ $n$ $p\geq 4$ $p$ boyut sayısıdır), değişken çekirdek yönteminin sabit genişlikte olanlarla rekabet ettiği ayarlar olarak (sorunuzdan yola çıkarak bu ayarlarda bulunmuyorsanız).

Bu sonuçların arkasındaki sezgi, çok seyrek ayarlarda değilseniz, o zaman yerel yoğunluğun, verimlilik kaybını aşmak için önyargıdaki kazanım için yeterince değişmediğidir (ve dolayısıyla değişken genişlikli çekirdeğin AMISE'si Sabit genişlikli AMISE). Ayrıca, sahip olduğunuz büyük örnek boyutu (ve küçük boyutlar) göz önüne alındığında, sabit genişlik çekirdeği halihazırda çok yerel olacaktır ve sapma açısından olası kazanımları azaltacaktır.

— user603
kaynak

Teşekkürler Kwak. "... Gauss dağıtılmış rastgele değişkenler için"; "engebeli" dağıtımlar için daha yeni işler biliyor musunuz?

— denis

@Denis:> 'Clumpy' =? Konsantre =? Gaussiandan daha dar kuyruklarla?

— user603

Uzman değilim ama Lang ve ark., "Hızlı Çekirdek Yoğunluğu Tahmini algoritmalarına dair görüşler", 2004, 8p

— denis

@Denis:> Sorunu en kötü hale getirdiğini söyleyebilirim (yani NN çekirdeği daha az karmaşık verilerde daha iyi çalışmalıdır). Sezgisel bir açıklamam var, ancak buraya sığmayacak, ayrıca ek fikirleri almak için bunu ana tahtada ayrı bir soru olarak sormak isteyebilirsiniz.

— user603

Kağıt

Maxim V. Shapovalov, Roland L. Dunbrack Jr., Uyarlanabilir Çekirdek Yoğunluğu Tahminlerinden ve Regresyonlarından Kaynaklanan Proteinler için Düzleştirilmiş Omurgaya Bağlı Bir Rotamer Kütüphanesi, Yapı, Cilt 19, Sayı 6, 8 Haziran 2011, Sayfa 844-858, ISSN 0969- 2126, 10.1016 / j.str.2011.03.019.

verinin seyrek olduğu bölgelerde yoğunluk tahminlerini pürüzsüz hale getirmek için uyarlanabilir çekirdek yoğunluk tahminini kullanır.

— momeara
kaynak

-1

Lös / düşük temelde değişken bir KDE yöntemidir, çekirdek genişliği en yakın komşu yaklaşımla ayarlanır. Veri noktalarının yoğunluğu belirgin şekilde değiştiğinde, oldukça iyi, kesinlikle herhangi bir sabit genişlikli modelden çok daha iyi çalıştığını buldum.

KDE ve çok boyutlu verilerle dikkat edilmesi gereken bir şey boyutsallığın laneti. Diğer şeyler eşit olduğunda, p ~ 10 olduğunda, p ~ 10 zamanına göre ayarlanmış bir yarıçap içinde çok daha az nokta vardır.

— Hong Ooi
kaynak

Loess değişken bir çekirdek REGRESSION yöntemidir. Soru, değişken çekirdek DENSITY tahminini sordu.

— Rob Hyndman

Hata! Haklısın. Soruyu yanlış okuyun.

— Hong Ooi

@Rob, naif sorularımı affedin: eğer değişen çekirdek genişliği (bazen) yerel regresyon / Çekirdek yumuşatma için iyi ise, yoğunluk tahmini için neden kötüdür? Yoğunluk tahmini f () == density () için f () tahmini değil mi?

— denis

@Hong Ooi, hangi Ndim'de kaç puan kullandınız? Teşekkürler

— denis

@Denis. Harika bir soru. Lütfen siteye uygun bir soru olarak ekleyebilir misiniz ve insanların hangi cevapları bulabileceğini göreceğiz.

— Rob Hyndman