Asimetrik dağılımlarda çekirdek yoğunluğu tahmini


10

İzin Vermek {x1,...,xN-} bilinmeyen (ama kesinlikle asimetrik) bir olasılık dağılımından alınan gözlemler olabilir.

KDE yaklaşımını kullanarak olasılık dağılımını bulmak istiyorum:

f^(x)=1N-hΣben=1N-K(x-xbenh)
Ancak, bir Gauss çekirdeği kullanmaya çalıştım, ancak simetrik olduğu için kötü performans gösterdi. Böylece, Gamma ve Beta çekirdekleri ile ilgili bazı çalışmaların yayınlandığını gördüm, ancak onlarla nasıl çalışacağımı anlamadım.

Benim sorum: bu asimetrik durumun nasıl ele alınacağı, altta yatan dağıtımın desteğinin aralıkta olmadığını varsayalım [0,1]?


4
Lognormal yakınlığı (bazı belirli uygulamalarda çok karşılaştığım) yoğunluklarda, sadece (günlükleri alarak) dönüştürürüm ve sonra KDE yaparım ve sonra KDE'yi geri dönüştürürüm (dönüştürürken Jacobian'ı hatırlamanız gerekir) tahmini geri). Bu durumda oldukça iyi çalışıyor.
Glen_b

@Glen_b bu yöntemin açıklandığı herhangi bir referansınız veya malzemeniz var mı? (KDE'yi orijinal değişkenin dönüşümünde hesaplamak ve sonra KDE'yi geri dönüştürmek)
boscovich

Bildiğimden değil - eminim varlar, çünkü bu oldukça önemsiz bir fikir ve kolayca uygulanabiliyor. Bir istatistik lisansının türetebilmesini beklediğim bir şey. Uygulamada çok iyi çalışıyor.
Glen_b

@glen_b teşekkürler. Teknik bir raporda / yayında kullanacak olsaydım, referans vermemenin iyi olacağını düşünüyor musunuz?
boscovich

1
@guy Özellikle bazı dönüşümler ve bazı verilerle ilgili sorunlarınız olması kesinlikle mümkündür. Kullandığım durumlar lognormallere oldukça yakın olma eğilimindedir ve orada sorun olarak gördüğünüz bant genişliğindeki değişiklik tam olarak ihtiyaç duyulan şeydir; ham veriler üzerinde KDE'den çok daha iyi sonuç verir. OP'nin açıklamasından oldukça benzer geliyordu, ama her derde deva olduğunu öne sürdüğüm gibi değil .
Glen_b

Yanıtlar:


5

Her şeyden önce, verilerin asimetrik olması durumunda simetrik çekirdekli KDE de çok iyi çalışabilir. Aksi takdirde, aslında pratikte tamamen işe yaramaz olurdu.

İkinci olarak, bunun soruna neden olduğuna inanıyorsanız, asimetriyi düzeltmek için verilerinizi yeniden ölçeklendirmeyi düşündünüz mü? Örneğin, aşağıdakileri yapmaya çalışmak iyi bir fikir olabilir:günlük(x), bunun birçok soruna yardımcı olduğu bilinmektedir.


Eğer yeniden satış log(x)yaparsanız, bir jacobian'ı da hesaba katmanız gerekir mi?
DilithiumMatrix

0

Hmm. Konumun bir fonksiyonu olarak değişen bir çekirdek genişliği isteyebilirsiniz.

ECDF'deki soruna baksaydım, Çekirdek boyutu ile ilgili CDF'nin sayısal bir eğimini deneyebilirim.

Bir koordinat dönüşümü yapacaksanız, başlangıç ​​ve bitiş noktaları hakkında oldukça iyi bir fikre sahip olmanız gerektiğini düşünüyorum. Hedef dağılımı bu kadar iyi biliyorsanız, Çekirdek yaklaşımına ihtiyacınız yoktur.


1
Çok kolay benim RVs negatif olmayan ama yine de bir KDE istiyorum biliyordu.
adam
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.