Maksimum olasılık tahmini kullandık mı?


14

İstatistikte şimdiye kadar maksimum olabilirlik tahmininin kullanılıp kullanılmadığını merak ediyorum. Biz kavramını öğreniyoruz ama ne zaman kullanıldığını merak ediyorum. Verilerin dağılımını varsayarsak, biri ortalama diğeri varyans için olmak üzere iki parametre buluruz, ancak gerçekte gerçek durumlarda kullanıyor musunuz?

Birisi bana bunun için kullanıldığı basit bir durumu söyleyebilir mi?


33
Öyle en yaygın tahmin yöntemi. the
JohnK

3
Ne zaman MLE kullanmadığımızı sormaya çalışıyordum
Haitao Du

4
lojistik regresyon. Poisson regresyonu. Hatalar normal kabul edildiğinde OLS MLE'dir. Gama gerilemesi. Gerçekten herhangi bir klasik GLM. Normal bir popülasyondan ortalamanın tahmin edilmesi. Bir dizi binom denemesinden başarı olasılığını tahmin etmek. Poisson olay oranını tahmin etme. Devam edebilirim ...
GoF_Logistic

4
Sitemizin Bu çok dar arama üreten yüzlerce gerçek kullanımların örneklerinden.
whuber

6
@ hxd1011 Sen edilir değil kullandığınız tahmincisi MLE tahmincisi ile anlaşmak neler olabileceğini bile, tahminlerinin veya örneğin hesaplamak güven, tahmin veya tolerans aralıkları, varyansı elde etmek yöntemlerini kullanmadığınızda MLE kullanarak. Örneğin, herhangi bir t-testi çalıştırdığınızda MLE kullanmıyorsunuz. Genellikle tarafsız tahmin ediciler uygularken kullanmıyorsunuzdur. Felsefi olarak, bir kayıp fonksiyonunu önemsediğinizde veya daha önce bir dağıtımınız olduğunda MLE kullanmazsınız.
whuber

Yanıtlar:


25

İstatistikte şimdiye kadar maksimum olabilirlik tahmininin kullanılıp kullanılmadığını merak ediyorum.

Kesinlikle! Aslında çok fazla - ama her zaman değil.

Biz kavramını öğreniyoruz ama ne zaman kullanıldığını merak ediyorum.

İnsanlar parametrik bir dağılım modeline sahip olduklarında, genellikle maksimum olabilirlik tahminini kullanmayı seçerler. Model doğru olduğunda, maksimum olabilirlik tahmin edicilerinin bir dizi kullanışlı özelliği vardır.

Bir örnek için - genelleştirilmiş doğrusal modellerin kullanımı oldukça yaygındır ve bu durumda ortalamayı tanımlayan parametreler maksimum olasılıkla tahmin edilir.

Bazı parametrelerin maksimum olasılıkla tahmin edildiği ve diğerlerinin olmadığı tahmin edilebilir. Örneğin, aşırı dağılmış bir Poisson GLM'yi düşünün - dispersiyon parametresi maksimum olasılıkla tahmin edilmeyecektir, çünkü MLE bu durumda yararlı değildir.

Verilerin dağılımını varsayarsak, iki parametre buluruz

Bazen iki tane olabilir, ancak bazen bir parametreniz, bazen üç veya dört veya daha fazla parametreniz olabilir.

biri ortalama, diğeri varyans için,

Belki belirli bir model mi düşünüyorsunuz? Bu her zaman böyle değildir. Üstel dağılım veya Poisson dağılımı veya binom dağılımı parametresini tahmin etmeyi düşünün. Bu vakaların her birinde bir parametre vardır ve varyans, parametrenin ortalamayı tanımlayan bir fonksiyonudur.

Veya üç parametreye sahip genelleştirilmiş bir gama dağılımını düşünün . Veya dört parametreye sahip (belki de şaşırtıcı olmayan) dört parametreli bir beta dağılımı . Ayrıca (belirli parametreleştirmeye bağlı olarak) ortalama veya varyansın veya her ikisinin de tek bir parametre tarafından değil, birkaçının işlevleri ile temsil edilebileceğini unutmayın.

Örneğin, oldukça yaygın kullanımı gören üç parametrelendirme olan gama dağılımı - en yaygın ikisi hem ortalamanın hem de varyansın iki parametrenin işlevleri olduğu.

Tipik olarak bir regresyon modelinde veya bir GLM'de veya bir hayatta kalma modelinde (diğer birçok model tipinde), model birden fazla kestiriciye bağlı olabilir, bu durumda model altındaki her gözlemle ilişkili dağılımın kendi parametresinden biri olabilir (veya hatta birçok belirteç değişkeni ("bağımsız değişkenler") ile ilişkili birkaç parametre).


5
"İnsanların parametrik dağılım modeli olduğunda." Ampirik olabilirliği dahil etmek için parametrik olmayan maksimum olabilirlik tahminini unutmayın.
Mark L. Stone

3
@ Mark Yine de nispeten daha nadir. Cevabıma bir kelime ekleyeceğim.
Glen_b

Dağılımın normal olduğunu varsaysak da maksimum olabilirlik tahminini kullanabilir miyiz? Sanırım ihtiyacımız yok ama yine de kullanabiliriz, değil mi?
user122358 14:17

@ user122358 Glen ve Mark sizi zaten yanıtladı. Bir dağıtım varsayabilirsin ya da olmayabilirsin. Çoğu zaman bir dağıtım ve dolayısıyla olasılık işlevi üstlenirsiniz.
HelloWorld

3
"İnsanların parametrik dağılım modeli olduğunda." Kısmi olabilirliği dahil etmek için yarı parametrik maksimum olabilirlik tahminini unutmayın. ;)
Scortchi - Monica'yı eski durumuna döndürün

8

Veri dağıtımına ilişkin varsayımlar göz önüne alındığında, olabilirlik tahmincilerini en üst düzeye çıkarırken şüpheli görünebilirken, Yarı Maksimum Olabilirlik Tahmin Edicileri sıklıkla kullanılır. Fikir, MLE için bir dağıtım kabul edip çözerek başlamak, daha sonra açık dağıtım varsayımını kaldırmak ve bunun yerine tahmincinizin daha genel koşullar altında nasıl performans gösterdiğine bakmaktır. Yani Quasi MLE, bir tahminci elde etmenin akıllı bir yolu haline gelir ve işin büyük kısmı tahmin edicinin özelliklerini türetir. Dağılımsal varsayımlar düştüğünden, yarı MLE genellikle hoş verimlilik özelliklerine sahip değildir.

x1,x2,...,xnXXN(μ,σ2)σ^2=n1(xix¯)2σ^2


1
Ayrıca, bu iş parçacığı Quasi MLE arkasındaki sezgide kontrol edebilirsiniz.
Richard Hardy

5

Maksimum olabilirlik tahmini genellikle makine öğrenmede eğitim için kullanılır:

Bazı durumlarda, bazen maksimum posteriori kestirime eşdeğer olan bir düzenlileştirme eklemeyi tercih ettiğine dikkat edin , örn. Kement cezası neden daha önce çift üslü (Laplace) ile eşdeğerdir? .


3

Birisi bana bunun için kullanıldığı basit bir durumu söyleyebilir mi?

Çok tipik bir durum lojistik gerilemedir. Lojistik regresyon, veri noktalarını sınıflandırmak için makine öğrenmesinde sıklıkla kullanılan bir tekniktir. Örneğin, lojistik regresyon, bir e-postanın spam olup olmadığını veya spam olup olmadığını veya bir kişinin hastalığı olup olmadığını sınıflandırmak için kullanılabilir.

xihθ(xi)=P[yi=1]=11+eθTxi

θ

θ^i=1nyilog(hθ^(xi))+(1yi)log(1hθ^(xi))


1

MLE'yi her zaman kullanıyoruz, ama hissetmeyebiliriz. Göstermek için iki basit örnek vereceğim.

örnek 1

810θθ=0.8

Saymayı neden kullanmalıyım? bu aslında örtülü olarak MLE kullanıyor! Sorun nerede

Maximizeθ   θ8(1θ)2

Denklemi çözmek için biraz analize ihtiyacımız olacak, ancak sonuç önemlidir.

ÖRNEK 2

Verilerden Gauss dağıtım parametrelerini nasıl tahmin ederiz? Ampirik ortalamaları tahmini ortalama olarak ve ampirik varyansı da tahmini varyans olarak kullanıyoruz, bu da MLE'den geliyor !.


6
Örnek 1 ayrıca bir Bayes çözeltisi ve bir momentler (MM) çözeltisi yöntemidir (ve muhtemelen diğer prosedürleri kullanan çözümdür). Örnek 2, MM çözeltisidir. Çok daha vardır sergi prosedürlerine ikna olacağını münhasıran aksi kimse MLE gerek olmazdı için - MLE.
whuber

Örnek 1 neden Bayes çözümü ve Örnek 2 MM çözümü haline geliyor? Bu arada MM nedir?
user122358

@ user122358 MM anların yöntemidir. Buraya bakınız, örneğin: en.wikipedia.org/wiki/Method_of_moments_(statistics)
jld 14:17

0

Kablosuz iletişimde bazı maksimum olasılık kullanımları:

  • Yedek kodlu veya yedeksiz gürültülü sinyallerden dijital verilerin kodunun çözülmesi.
  • Alıcılarda zaman, faz ve frekans kaymalarının tahmini.
  • Yayılma kanalının (parametrelerinin) tahmini.
  • Gecikme, varış açısı ve Doppler kaymasının tahmini (örneğin, radar).
  • Bir mobil konumun tahmini (örn. GPS).
  • Her türlü dağıtılmış ayarın senkronizasyonu için saat ofseti tahmini.
  • Çok sayıda kalibrasyon prosedürü.
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.