GLM'deki log olasılığı küresel maksimumlara yakınsamayı garantiledi mi?


16

Sorularım:

  1. Genelleştirilmiş doğrusal modellerin (GLM'ler) küresel bir maksimuma yaklaşması garanti ediliyor mu? Öyleyse neden?
  2. Ayrıca, konveksliği sağlamak için link fonksiyonunda ne gibi kısıtlamalar vardır?

GLM'leri anladığım, oldukça doğrusal olmayan bir olasılık fonksiyonunu en üst düzeye çıkarmalarıdır. Böylece, birkaç yerel maxima olduğunu ve yakınsama parametre kümesi optimizasyon algoritması için başlangıç ​​koşullarına bağlı olduğunu hayal ediyorum. Bununla birlikte, bazı araştırmalar yaptıktan sonra, birden fazla yerel maksimumun olduğunu gösteren tek bir kaynak bulamadım. Dahası, optimizasyon tekniklerine pek aşina değilim, ancak Newton-Raphson yöntemi ve IRLS algoritmasının yerel maksimuma oldukça eğilimli olduğunu biliyorum.

Mümkünse hem sezgisel hem de matematiksel olarak açıklayınız!

EDIT: dksahuji orijinal soruma cevap verdi, ancak yukarıdaki takip sorusunu [ 2 ] eklemek istiyorum . ("Dışbükeyliği sağlamak için link fonksiyonunda ne gibi kısıtlamalar var?")


Bunun olabilmesi için bazı kısıtlamaların gerekli olduğunu düşünüyorum. İfadenin kaynağı nedir?
Glen_b

Ancak ben de onun geçirmez karşılama açık bir şey bulamadım ancak birkaç site ima gibi görünüyordu!
DankMasterDan

olasılık alanın her yerinde iyi tanımlanmış olduğu sürece (ve bazı teğetsel sayısal konuları göz ardı ederek) evet diye düşünüyorum. Bu koşullar altında, kendir alanın her yerinde <0'dır, bu nedenle benzerlik küresel içbükeydir. Btw, fonksiyon 'yüksek derecede lineer değil' parametrelerde ve önemli olan da budur.
user603

@ user603 Kendirin her yerde <0 olduğuna dair kaynağınız / kanıtınız nedir?
DankMasterDan

Lojistik, Poisson ve Gauss regresyonları genellikle "iyi" bir bağlantı fonksiyonu verildiğinde dışbükeydir. Ancak, keyfi bağlantı işlevi ile bunlar dışbükey değildir.
Memming

Yanıtlar:


11

Üstel ailenin tanımı:

p(x|θ)=h(x)exp(θTϕ(x)A(θ)),

burada günlük bölümleme fonksiyonudur. Şimdi, aşağıdaki üç şeyin 1D durumu için geçerli olduğu kanıtlanabilir (ve daha yüksek boyutlara genelleme yapar - üstel ailelerin veya günlük bölümünün özelliklerine bakabilirsiniz):A(θ)

  1. dAdθ=E[ϕ(x)]

  2. d2Adθ2=E[ϕ2(x)]E[ϕ(x)]2=var(ϕ(x))

  3. 2Aθiθj=E[ϕi(x)ϕj(x)]E[ϕi(x)]E[ϕj(x)]=cov(ϕ(x))Δ2A(θ)=cov(ϕ(x))

Yukarıdaki sonuç nın dışbükey olduğunu kanıtlamaktadır ( c o v ( ϕ ( x ) ) pozitif semidefinit olduğu için). Şimdi MLE için olasılık fonksiyonuna bakalım: A(θ)cov(ϕ(x))

p(D|θ)=[i=1Nh(xi)] exp(θT[i=1Nϕ(xi)]NA(θ))log(p(D|θ))=θT[i=1Nϕ(xi)]NA(θ)=θT[ϕ(D)]NA(θ)

Şimdi tetada doğrusaldır ve - A ( θ ) içbükeydir. Bu nedenle, benzersiz bir küresel maksimum vardır.θT[ϕ(D)]A(θ)

Benzer olan kavisli üstel aile adı verilen genelleştirilmiş bir versiyon var. Ancak kanıtların çoğu kanonik formda.


yani bu, GLM'nin hangi bağlantı fonksiyonunun seçildiği (kanonik olmayanlar dahil) benzersiz bir küresel minima nomatterine sahip olduğu anlamına mı geliyor?
DankMasterDan

1
Ben algıladığım kadar cevap vermeye çalışacağım. bahsettiğiniz durumdur. Bu hala içbükey r | ama olmayabilir İçeride ISTV melerin RWMAIWi'nin böylece η bütün günlük olabilirlik içbükey olacak şekilde olmalıdır İçeride ISTV melerin RWMAIWi'nin . p(x|θ)=h(x)exp(η(θ)Tϕ(x)A(η(θ)))ηθηθ
dksahuji

Sorunun, sadece varoluştan ziyade yakınsama hakkında sorduğunu, ancak birkaç kısıtlamayla, bunun da mümkün olabileceğini unutmayın.
Glen_b

@Glen_b Ayrıntılı olabilir misiniz? Böyle bir kısıtlama bilmiyorum. Belki de içbükey işlev durumunda yakınsama garanti etmek için gradyan tabanlı bir iyileştirici adım adım kısıtlamalar gibi bir şey.
dksahuji

1
@Glen_b Genel olarak doğru olabilir ama içbükey fonksiyonun küçük tolere edilebilir değer içinde optima'ya yakınsamaması için herhangi bir neden göremiyorum. Ama bunlarla ilgili pratik bir deneyimim olmadığını ve yeni başladım diyebilirim. :)
dksahuji
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.