İki dağılım arasındaki Hellinger mesafesinin tarafsız bir tahmincisi var mı?


20

Bir kişinin yoğunluğu olan bir dağılımdan dağıtıldığı bir , Hellinger mesafesinin yoğunluğu olan başka bir dağılıma yani tarafsız bir tahmincisi ( ' dayalı) olup olmadığını merak ediyorum. f X i f 0 H ( f , f 0 ) = { 1 - X X1,,XnfXif0

H(f,f0)={1Xf(x)f0(x)dx}1/2.

4
Böylece f0 bilinir ve sabitlenir. Ancak f biliniyor mu veya parametrik bir aileden mi, yoksa bunu f örneğinizden gelen f hakkında bildiğiniz her şeyle parametrik olmayan bir çerçevede mi yapıyor? Bence cevap vermeye çalışırken bir fark yaratıyor.
Michael R.Chickick

3
@MichaelChernick: hakkında bildiğiniz her şeyin X 1 , , X n örneği olduğunu varsayalım . fX1,,Xn
Xi'an

2
Hesaplandığını sanmıyorum (eğer varsa). Varsa, AIC'nin kayıp bir kardeşi vardır.

4
f ve f0 ayrık olduğunu varsayarsanız, bu soruna yönelik bir saldırı mümkün görünmektedir. Bu belirgin bir tahminciye yol açar (EDF ve arasındaki Hellinger mesafesini hesaplayın f0). Bootstrapping (teorik olarak, simülasyon yoluyla değil!) Bize olası önyargıların yanı sıra önyargıyı azaltmanın (hatta ortadan kaldırmanın) bir yolunu verecektir. Matematiksel olarak daha izlenebilir olduğundan, mesafenin kendisinden ziyade kare mesafeyle başarılı olma umudunu bekliyorum . Uygulamalarda ayrık bir varsayımı fsorun yaratmaz; ayrık boşluğu fyine de yoğun bir altkümedir.
whuber

2
Rosenblatt'ın "iyi niyetli" tarafsız bir tahmincisi olmadığının kanıtı akla geliyor . Bunun üstesinden gelebilir ve H ( f , f 0 ) ' nın temelsiz bir tahmincisini alabilir miyiz ? Bilmiyorum. fH(f,f0)
Zen

Yanıtlar:


5

Her iki Hiçbir tarafsız tahmincisi veya H 2 için var f dağılımları herhangi bir makul geniş parametrik olmayan sınıfından.HH2f

Bunu güzel basit argümanı ile gösterebiliriz.

Bickel ve Lehmann (1969). Dışbükey ailelerde tarafsız tahmin . Annals Matematik İstatistikleri, 40 (5) 1523-1535. ( proje öklid )

Bazı dağılımlar , F ve G , karşılık gelen yoğunluklar f 0 , f ve g ile sabitlenir . Let , H ( F ) göstermektedirler H ( f , f 0 ) ve izin H ( x ) , bazı tahmin edilmesi H ( F ) göre , n IID örnekler X ı ~ F .F0FGf0fgH(F)H(f,f0)H^(X)H(F)nXiF

Varsayalım ki H formu, herhangi bir dağıtım örnekler için tarafsız bir M a : = α K + ( 1 - α ) G . Ama sonra Q ( α )H^

Mα:=αF+(1α)G.
bu yüzdenQ,(α)içinde olmalıdır polinomaait en derecesin.
Q(α)=H(Mα)=x1xnH^(X)dMα(x1)dMα(xn)=x1xnH^(X)[αdF(x1)+(1α)dG(x1)][αdF(xn)+(1α)dG(xn)]=αnEXFn[H^(X)]++(1α)nEXGn[H^(X)],
Q(α)αn

Şimdi, makul bir durum üzerinde uzmanlaşalım ve karşılık gelen polinom olmadığını gösterelim .Q

, [ - 1 , 1 ] üzerinde sabit yoğunluğa sahip bir dağılım olsun : f 0 ( x ) = c herkes için | x | 1 . (Bu aralığın dışındaki davranışı önemli değildir.) F, yalnızca [ - 1 , 0 ] üzerinde desteklenen bazı dağıtım ve G yalnızca [ 0 , 1 ] üzerinde desteklenen bazı dağıtım olsun .F0[1,1]f0(x)=c|x|1F[1,0]G[0,1]

Şimdi

Q(α)=H(mα,f0)=1Rmα(x)f0(x)dx=110cαf(x)dx01c(1α)g(x)dx=1αBF1αBG,
where BF:=Rf(x)f0(x)dx and likewise for BG. Note that BF>0, BG>0 for any distributions F, G which have a density.

1αBF1αBG is not a polynomial of any finite degree. Thus, no estimator H^ can be unbiased for H on all of the distributions Mα with finitely many samples.

Likewise, because 1αBF1αBG is also not a polynomial, there is no estimator for H2 which is unbiased on all of the distributions Mα with finitely many samples.

This excludes pretty much all reasonable nonparametric classes of distributions, except for those with densities bounded below (an assumption nonparametric analyses sometimes make). You could probably kill those classes too with a similar argument by just making the densities constant or something.


13

I don't know how to construct (if it exists) an unbiased estimator of the Hellinger distance. It seems possible to construct a consistent estimator. We have some fixed known density f0, and a random sample X1,,Xn from a density f>0. We want to estimate

H(f,f0)=1Xf(x)f0(x)dx=1Xf0(x)f(x)f(x)dx
=1E[f0(X)f(X)],
where Xf. By the SLLN, we know that
11ni=1nf0(Xi)f(Xi)H(f,f0),
almost surely, as n. Hence, a resonable way to estimate H(f,f0) would be to take some density estimator fn^ (such as a traditional kernel density estimator) of f, and compute
H^=11ni=1nf0(Xi)fn^(Xi).

3
@Zen: Good point! I consider this answer as the answer because it made me realise H sounds very much like a standard deviation, for which there exists no unbiased estimator. As for the variance of H^n2, no worries: E[(f0(X)/f(X))2]=1 implies that this estimator has a finite variance.
Xi'an

1
Thanks for the clarification about the variance of the estimator, Xi'an!
Zen

2
Some work on other consistent estimators: (a) arxiv.org/abs/1707.03083 and related work based on k-NN density estimators; (b) arxiv.org/abs/1402.2966 based on correcting kernel density estimates; (c) ieeexplore.ieee.org/document/5605355 based on a connection to classification. (Many of these are based on samples from both f and f0, because that's the work I knew about offhand, but I think there are variants for known f0.)
Dougal
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.