İlk k (ampirik) anları kullanarak yaklaşık bir PDF (yani yoğunluk tahmini) nasıl takılır?


11

Bir veri kümesinin (ilk) momentini tahmin edebildiğim ve yoğunluk fonksiyonunun bir tahminini üretmek için kullanmak istediğim bir durum var.k

Zaten Pearson dağılımına rastladım , ancak sadece ilk 4 anına dayandığını fark ettim (olası an kombinasyonlarına bazı kısıtlamalar ile).

Ayrıca, herhangi bir sonlu an setinin, daha fazla varsayım kullanmadığınızda belirli bir dağılımı "sabitlemek" için yeterli olmadığını anlıyorum. Ancak yine de daha genel bir dağıtım sınıfı istiyorum (Pearson dağıtım ailesi dışında). Diğer sorulara baktığımda, böyle bir dağılım bulamadım (bakınız: burada , burada , burada , burada , burada ve burada ).

Herhangi bir anı kümesi için tanımlanabilecek bazı ("basit") genelleştirilmiş dağıtım ailesi var mı? (standart bir normal dağılım alabilen ve tüm k anlarıyla teyit edilene kadar dönüştüren bir dizi dönüşüm olabilir )kk

(Diğer anlarının 0 olup olmadığını varsayarsak pek umurumda değil)k+1

Teşekkürler.

ps: Uzun bir örnek için mutlu olurum. Tercihen bir R kodu örneği ile.


2
kkE[Xk]=(i)kϕX(k)(0)k

Teşekkürler @StephanKolassa - genişletilmiş cevap / R kodu örneği için herhangi bir şans?
Tal Galili


Sevgili @whuber, bir R kodu örneği önerebilir misiniz? (ayrıca, bu wolfies cevabı ile gider?)
Tal Galili

Bu, bu cevaptan tamamen farklı bir yaklaşımdır.
whuber

Yanıtlar:


11

Yöntem 1: Yüksek mertebeli Pearson sistemleri

p(x)

dp(x)dx=(a+x)c0+c1x+c2x2p(x)

(a,c0,c1,c2)

c0+c1x+c2x2p(x)

dp(x)dx=(a+x)c0+c1x+c2x2+c3x3p(x)

çözelti veren:

resim açıklamasını buraya girin

Bunu bir süre önce eğlence için çözdüm (OP ile aynı düşünce trenine sahip): türetme ve çözüm kitabımızın 5. Bölümünde verilmiştir; ilgilenirseniz, buradan ücretsiz olarak indirebilirsiniz:

http://www.mathstatica.com/book/bookcontents.html

İkinci derece (kuadratik) Pearson ailesi ilk 4 an cinsinden ifade edilebilirken, üçüncü derece (kübik) Pearson tarzı aile ilk 6 anı gerektirir.

Yöntem 2: Gram-Charlier genişletmeleri

kth

Nüfus anları veya örnek anlar ??

Pearson tarzı sistem için: Nüfusun anları biliniyorsa, daha yüksek anlar kullanmak açıkça daha iyi bir uyum sağlamalıdır. Bununla birlikte, gözlemlenen veriler popülasyondan alınan rastgele bir örnekse, bir değiş tokuş vardır: daha yüksek dereceli bir polinom, daha yüksek dereceli anların gerekli olduğunu ve ikincisinin tahminlerinin güvenilir olmayabileceğini (yüksek varyansa sahip olduğunu), örnek boyutu 'büyük' ​​olmadığı sürece. Başka bir deyişle, örnek veriler verildiğinde, daha yüksek momentler kullanmak, 'kararsız' hale gelebilir ve daha düşük sonuçlar üretebilir. Aynı şey Gram-Charlier genişletmeleri için de geçerlidir: fazladan bir terim eklemek aslında daha kötü bir uyum sağlayabilir, bu yüzden biraz dikkat gerekir.


Sevgili @wolfies - Cevabınız için teşekkür ederim! Seni doğru anlarsam, Gram-Charlier genişletmeleri aradığım şeyle daha uyumludur (daha genel bir Pearson dağılımı hakkında bilmek ilginç olsa da). Kitabınıza baktım (bölüm 5, sayfa 175'ten başlayarak) ve gerçekten orada ayrıntılı bir açıklama verdiğinizi görüyorum (ayrıca tahmini anlarla nasıl başa çıkacağımdan bahsediyor, ki bu benim durumum). Tek şey (ben bir R kullanıcısı olduğum için) kodunuzu kullanamazsınız. Cevabınız için teşekkürler (ve ayrıca genel olarak etkileyici ve ilginç görünen kitabınız için)
Tal Galili

2
Çeşitli yöntemlerle başa çıkmak için bir R paketi buldum: cran.us.r-project.org/web/packages/PDQutils/vignettes/…
Tal Galili
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.