MLE her zaman verilerimizin altında yatan PDF'yi bildiğimiz anlamına mı gelir ve EM bilmediğimiz anlamına mı gelir?


12

MLE (Maksimum Olabilirlik Tahmini) ve varsa EM'ye (Beklenti Maksimizasyonu) hangi bağlantıya ilişkin açıklığa kavuşturmak istediğim bazı basit kavramsal sorularım var.

Anladığım kadarıyla, birisi "MLE'yi kullandık" derse, bu otomatik olarak verilerinin PDF'sinin açık bir modeline sahip oldukları anlamına mı gelir? Bana öyle geliyor ki cevabı evet. Başka bir deyişle, herhangi bir zamanda "MLE" diyorsa, onlara hangi PDF'yi üstlendiklerini sormak adil olur. Bu doğru olur mu?

Son olarak, EM'de, benim anlayışım EM'de, verilerimizin altında yatan PDF'yi aslında bilmiyor veya bilmemiz gerekmesidir. Bu benim anlayışım.

Teşekkür ederim.


1
EM'deki "M", olasılıkın Maksimizasyonu anlamına gelir. Bir olasılık yazmak için bir pdf'ye ihtiyacımız var. EM, bir anlamda 'gözlemlenemeyen' varlığında (E-adımında doldurulan) MLE'leri bulmanın bir yoludur. Yani, EM'yi kullanmak için açık bir modele ihtiyacınız var.
Glen_b - Monica'yı

@Glen_b Teşekkürler Gleb_b. Yani, 1) EM'de MLE'de olduğu gibi her zaman verinin PDF'sinin bazı modellerini varsaydığımızı söylemek doğru olur mu? Birisi "MLE / EM kullandık" derse, PDF'leri "kabul ettiniz mi? Bu doğru bir değerlendirme olur mu? 2) Son olarak, EM ile ilgili olarak, bahsettiğiniz gözlemlenemeyen şeylerin karışımı oluşturan belirli PDF'lerin olasılıkları olduğuna inanıyorum. Şimdiden teşekkürler
Creatron

Parametrik olmayan maksimum olabilirlik yöntemleri olduğunu unutmayın. Kaplan-Meier'i ara.
soakley

Kreatron açık (1) EM'nin aksi takdirde başa çıkılması zor olan MLE'lerin hesaplanması için bir algoritma olduğunu unutmayın . Her iki durumda da, modelin bazı pdf'lerden daha karmaşık olması mümkün olduğundan, biraz daha genel bir soru olan 'modeliniz neydi?' Açık (2) EM algoritması yalnızca karışımlar için geçerli değildir; bundan daha genel.
Glen_b

Yanıtlar:


13

MLE yöntemi, birisinin pdf'nin temel fonksiyonel formunu (ör. Gaussian veya log-normal veya üstel veya her neyse) bildiği , ancak alttaki parametreleri bilmediği durumlarda uygulanabilir; örneğin, ve σ değerlerini bilmiyorlar : f ( x | μ , σ ) = 1μσ veya başka tür pdf'leri varsayarlar. MLE yönteminin görevi, belirli veri ölçümlerix1,x2,x3 olduğunda,bilinmeyen parametreler için en iyi (yani en makul) değerleri seçmektir. . . gerçekte gözlendi. Yani ilk sorunuzu cevaplamak için, evet, birisinemaksimum olasılık tahmini içinhangipdfbiçiminialdıklarınısormak her zaman haklarınız dahilindedir; aslında, size söyledikleri tahmini parametre değerleri, ilk önce bu bağlamı iletmedikleri sürece anlamlı bile değildir.

f(x|μ,σ)=12πσ2exp[(xμ)22σ2]
x1,x2,x3,...

EM algoritması, geçmişte uygulandığını gördüğüm gibi, bazı meta verilerin eksik olduğu bir tür meta algoritmadır ve bunu da tahmin etmeniz gerekir. Bu nedenle, örneğin, belki de bir çok Gauss karışımıdır pdf, örneğin sahiptir: Yüzeysel olarak, genlik parametresiAk'nıneklenmesi dışında, bu önceki soruna çok benziyor, ama sizeN'nindeğerini bile bilmediğimizi söylersem(yani, sayı Gauss karışım içinde modları) ve veri ölçümlerinden tahmin etmek istiyorumx1,x2,x3,. . . çok?

f(x|A1,...,AN,μ1,...,μN,σ1,...σN)=k=1NAk2πσk2exp[(xμk)22σk2]
AkNx1,x2,x3,...

NN=1A1μ1σ1N=2A1A2μ1μ2σ1σ2A1μ1σ1N=1N=2

NN

N=1N=2N=3


Ak=1N

N

Ak=1NNN=4N=5

Teşekkür ederim stachyra. Son soru, veri karışımı PDF'sinin (PDF'lerin ağırlıklı toplamından oluşan ikinci denkleminizde verilen), PDF'lerinin bir ürünü olan verilerimizin tüm örneklerinin ortak PDF'si ile aynı DEĞİLDİR , doğru ? (Veri örneklerinin IID olduğunu varsayın).
Creatron

Hayır, hiç de değil - tamamen farklı iki şey. Tanımladığınız ortak pdf, MLE'de kullanılan olabilirlik fonksiyonunun biçimine çok daha benziyor. Burada bir ders kitabı size yardımcı olabilir. MLE için Philip R. Bevington ve D. Keith Robinson'ın "Fiziksel Bilimler için Veri Azaltma ve Hata Analizi" bölüm 10'unu veya Glen Cowan'ın "İstatistiksel Veri Analizi" bölüm 6.1'ini beğendim. Belirli bir EM uygulaması türünün nasıl yapılacağına dair özel bir örnek için, bu açıklamayı, 2'den 5'e kadar olan bölümleri
beğendim

2

MLE, en azından marjinal dağılımlar hakkında bilgi gerektirir. MLE kullanırken, genellikle ortak bir varsayım yaparak bir eklem dağılımının parametrelerini tahmin ederiz, ardından eklem dağılımını bildiğimiz marjinallerin bir ürünü olarak çarpanlarına ayırırız. Varyasyonlar var, ancak çoğu durumda fikir bu. Dolayısıyla MLE parametrik bir yöntemdir.

EM algoritması, bir MLE algoritmasının bir parçası olarak ortaya çıkan olasılık işlevlerini en üst düzeye çıkarmak için bir yöntemdir. Genellikle (genellikle?) Sayısal çözümler için kullanılır.

MLE'yi her kullandığımızda, en azından marjinal dağılımlara ve eklemin marjinallerle nasıl ilişkili olduğuna dair bazı varsayımlara ihtiyacımız var (bağımsızlık, vb.). Bu nedenle her iki yöntem de dağılım bilgisine dayanır.


Mantıklı olan @Charles teşekkürler. O zaman insanlar "parametrik olmayan MLE" hakkında konuşurken ne anlama gelir. Bu ifade ilk bakışta mantıklı değil. MLE her zaman dağılımın bir parametresini tahmin eder , değil mi?
Creatron

ELE (Ampirik Olasılık Tahmini) hakkında konuşuyor olabilirler. Hiç kullanmadım; Gerekirse açıklamaya çalışacağım. Aksi halde emin değilim.
Charles Pehlivanian
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.