MLE, iid verisi gerektirir mi? Yoksa sadece bağımsız parametreler mi?


16

Parametreleri maksimum olabilirlik tahmini (MLE) kullanarak tahmin etmek, bir dağılım ailesi (P (X = x | θ) üzerinde parametre uzayında (θ) değerler (x) ile meydana gelen örneğin (X) olasılığını haritalayan olabilirlik fonksiyonunun değerlendirilmesini içerir. ) values ​​(not: bu konuda doğru muyum?) üzerinde θ ve X için değer örnektir (bir vektör).

Sadece verileri çoğalttığımız için, verilerin bağımsız olması takip ediyor mu? Örneğin, MLE'yi zaman serisi verilerine sığdırmak için kullanamadık mı? Yoksa parametrelerin bağımsız olması mı gerekiyor?

Yanıtlar:


14

Olabilirlik fonksiyonu, model parametrelerinin bir fonksiyonu olarak bir E olayının (veri kümesi x ) olasılığı olarak tanımlanır θExθ

L(θ;x)P(Event E;θ)=P(observing x;θ).

Bu nedenle, gözlemlerin bağımsızlığı varsayımı yoktur. Klasik yaklaşımda parametrelerin bağımsızlığı için tanım yoktur , çünkü bunlar rastgele değişken değildir; ilgili bazı kavramlar tanımlanabilirlik , parametre dikliği ve Maksimum Olabilirlik Tahmincilerinin (rasgele değişkenler) bağımsızlığı olabilir.

Bazı örnekler,

(1). Ayrık durum . ile (bağımsız) münferit gözlemler bir örnek P ( gözlemlemek  x j ; θ ) > 0 , daha sonrax=(x1,...,xn)P(observing xj;θ)>0

L(θ;x)j=1nP(observing xj;θ).

Özellikle, eğer , N ile biliniyorsa,xjBinomial(N,θ)N

L(θ;x)j=1nθxj(1θ)Nxj.

(2). Sürekli yaklaşım . Let bir sürekli rastgele değişken bir numune olduğu X dağılımı ile, F ve yoğunluk f ölçüm hatası ile, £ değerinin , bu, takımları da dikkate ( x j - ε , X j + ϵ ) . Sonrax=(x1,...,xn)XFfϵ(xjϵ,xj+ϵ)

L(θ;x)j=1nP[observing (xjϵ,xj+ϵ);θ]=j=1n[F(xj+ϵ;θ)F(xjϵ;θ)]

Ne zaman küçük, bundan (ortalama değer Teoremi kullanılarak) yakınsanabilirϵ

L(θ;x)j=1nf(xj;θ)

Normal durumda olan bir örnek için bir göz atın bu .

(3). Bağımlı ve Markov modeli . Varsayalım ki muhtemelen bağımlı ve izin gözlemler bir dizi ön olması ortak yoğunluğu x , daha sonrax=(x1,...,xn)fx

L(θ;x)f(x;θ).

Ek olarak Markov özelliği tatmin edildiyse ,

L(θ;x)f(x;θ)=f(x1;θ)j=1n1f(xj+1|xj;θ).

Ayrıca bir göz atın bu .


3
Olabilirlik fonksiyonunu bir ürün olarak yazdığınızdan , gözlemler arasında dolaylı olarak bir bağımlılık yapısı olduğunu varsayıyorsunuz . Dolayısıyla, MLE için kişinin (a) her bir bireysel sonucun dağılımı ve (b) sonuçların bağımlılığı konusunda iki varsayımı olması gerekir.

10

(+1) Çok iyi bir soru.

Küçük bir şey, MLE maksimum olabilirlik tahminini (çoklu değil) ifade eder, bu da olasılığı en üst düzeye çıkarmanız anlamına gelir. Bu, olasılığın IID örneklemesi tarafından üretilmesi gerektiğini belirtmez.

Örneklemenin bağımlılığı istatistiksel modelde yazılabilirse, olasılığı buna göre yazar ve her zamanki gibi en üst düzeye çıkarırsınız.

Eğer ne zaman söz bir vaka değer değil bağımlılığı varsayalım değişkenli Gauss örnekleme ki (örneğin zamanında serileri analizi) 'dir. İki Gauss değişkeni arasındaki bağımlılık, büyük olasılıkla desteklemediğiniz kovaryans terimleriyle modellenebilir.

Basit bir örnek vermek gerekirse, aynı ortalama ve varyansla ilişkili Gauss değişkenlerinden boyutlu bir örnek çizdiğinizi varsayalım . Olasılığı şöyle yazarsınız:2

12πσ21ρ2exp(z2σ2(1ρ2)),

burada birz

z=(x1μ)22ρ(x1μ)(x2μ)+(x2μ)2.

Bu, bireysel olasılıkların ürünü değildir. Yine de, MLE'lerini almak için bunu parametrelerle maksimize edersiniz.(μ,σ,ρ)


2
Bunlar iyi cevaplar ve örnekler. Bunu basit terimlerle görmek için ekleyeceğim tek şey, olasılık tahmininin sadece verilerin üretilmesi için bir modelin bilinmeyen bazı parametreler açısından belirtilmesini gerektirdiğidir.
Michael R.Chernick

(+1) Kesinlikle doğru! Bu terimlerde belirtilemeyen bir model örneğiniz var mı?
gui11aume

@ gu11aume Sanırım sözlerime atıfta bulunuyorsun. Bu soruya doğrudan cevap vermediğimi söyleyebilirim. Sorunun cevabı evettir, çünkü veriler bağımlı rastgele değişkenler tarafından üretildiğinde olasılık fonksiyonunun nerede ifade edilebileceğini gösteren örnekler vardır.
Michael R.Chernick

2
Bunun yapılamayacağı örnekler, veri oluşturma mekanizmasının herhangi bir açıklaması olmadan verilerin verildiği veya modelin, iki iid veri kümesi verildiğinde ve bunların gelip gelmediğini test etmeleri istendiğinde parametrik bir formda sunulmadığı örnekler olabilir. aynı dağılım, yalnızca dağıtımların kesinlikle sürekli olduğunu belirtirseniz.
Michael R.Chernick

4

Elbette, Gauss ARMA modelleri, kovaryans fonksiyonları açıkça türetilebildiğinden, bir olasılığa sahiptir. Bu temel olarak gui11ame'in 2'den fazla gözleme cevabının bir uzantısıdır. Minimal googling gibi kağıtları üreten bu bir olasılık genel formda verilir.

Bir başka, bir ölçüde, daha ilgi çekici bir örnek sınıfı, çok seviyeli rastgele etki modelleri tarafından verilmektedir . Form verilerini varsa endeksler j iç içe ı (öğrenciler düşünüyorum j sınıflarında ı , diyelim ki, düzeyli modellerin klasik uygulama için) , o zaman, ϵ i ju i varsayarsak , olasılık ln L i

yij=xijβ+ui+ϵij,
jijiϵijui ve bireysel gözlemler değil, kümeler düzeyinde tanımlanan olabilirlik katkılarının toplamıdır. (Tabii ki, Gauss davasında, analitik ANOVA benzeri bir çözüm üretmek için integralleri itebilirsiniz. Ancak, y i j yanıtınız için bir logit modeli söylediyseniz, sayısal entegrasyondan çıkmanın bir yolu yoktur. )
lnLilnjf(yij|β,ui)dF(ui)
yij

2
Stask ve @ gui11aume, bu üç cevap güzel ama bir noktayı kaçırdıklarını düşünüyorum: MLE'nin bağımlı veriler için tutarlılığı ne olacak ?
Stéphane Laurent
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.