Lojistik regresyon ne zaman kapalı halde çözülür?


31

Al ve ve lojistik regresyon kullanılarak belirli bir x y tahmin görevini modeli varsayalım. Lojistik regresyon katsayıları ne zaman kapalı olarak yazılabilir?x{0,1}dy{0,1}

Bir örnek, doymuş bir model kullanmamızdır.

Yani, , burada setleri güç kümesinde indeksler ve eğer 1 tüm değişkenler 'inci set aksi 1 ve 0 dır. Daha sonra bu lojistik regresyon modelindeki her bir , verinin istatistiklerinin rasyonel bir fonksiyonunun logaritması olarak ifade edebilirsiniz .P(y|x)exp(iwifi(xi))i{x1,,xd}fiiwi

Kapalı form olduğunda başka ilginç örnekler var mı?


4
Sanıyorum ki "parametrelerin MLE'leri kapalı formda mı?"
Glen_b -Reinstate Monica

Ne yaptığını daha fazla ayrıntı verir misin? Sorunuz, bir lojistik regresyon sorunu için sıradan en küçük kareler tahmin edicisini türetmeye çalıştığınız gibi mi okuyor?
Momo

1
İlginç yazı / soru için teşekkürler, Yaroslav. Gösterdiğiniz örnek için bir referansınız var mı?
Bitwise

1
Uzun zaman oldu ama muhtemelen Lauritzen'in "Grafik Modelleri" kitabındaydı. Bu soruya verilen cevabın daha geniş temelleri var - yeterli istatistiklerin oluşturduğu (hiper) grafiğin akoru olduğunda kapalı form çözümünü alıyorsunuz
Yaroslav Bulatov

Bu ilginç olabilir tandfonline.com/doi/abs/10.1080/… Sadece 2x2'lik bir tablonuz olduğunda bunun analitik bir çözüm olabileceğine inanıyorum
Austin,

Yanıtlar:


33

Kjetil b halvorsen'ın işaret ettiği gibi, kendi başına, doğrusal regresyonun analitik bir çözüm getirdiği bir mucizedir. Ve bu sadece problemin doğrusallığı sayesinde (parametrelere göre). , ilk sipariş koşullarına sahip olan ile ilgili bir sorun için (sabit dahil gerekli-orada kökenli sorunlar üzerinden bazı regresyon, çok iseniz) değişkenleri, bu bir sistemdir denklemler ve bilinmeyenli. En önemlisi, doğrusal bir sistemdir, bu nedenle standart doğrusal cebir teorisi ve pratiğini kullanarak bir çözüm bulabilirsiniz.

i(yixiβ)2minβ,
2i(yixiβ)xi=0
ppp. Tamamen collinear değişkenleriniz olmadıkça, bu olasılık 1 ile bir çözüme sahip olacaktır.

Şimdi, lojistik regresyon ile, işler artık o kadar kolay değil. Günlük olabilirlik işlevini not etmek, ve bulmak için türevini alarak, parametreleri bunu çok doğrusal olmayan bir şekilde girer: her , doğrusal olmayan bir işlev vardır ve bunlar birlikte eklenir. Analitik bir çözüm yoktur (muhtemelen iki gözlemle önemsiz bir durum dışında veya bunun gibi bir şey hariç) ve kullanmak zorundasınız.

l(y;x,β)=iyilnpi+(1yi)ln(1pi),pi=(1+exp(θi))1,θi=xiβ,
lβ=idpidθ(yipi1yi1pi)xi=i[yi11+exp(xiβ)]xi
βi tahminlerini bulmak için doğrusal olmayan optimizasyon yöntemleri .β^

Soruna biraz daha derinlemesine bakıldığında (ikinci türevi alarak), bunun bir içbükey işlev (maksimum yüceltilmiş bir çok değişkenli parabol) bulma konusunda dışbükey bir optimizasyon problemi olduğunu, bu nedenle birinin var olduğunu ve herhangi bir makul algoritmanın bunun yerine bulması gerektiğini ortaya koymaktadır. Çabuk, ya da şeyler sonsuzluğa patlar. İkincisi, bazı için olduğunda lojistik regresyonda olur , yani mükemmel bir tahmininiz vardır. Bu oldukça nahoş bir eserdir: Mükemmel bir tahminde bulunduğunuzda, modelin mükemmel çalıştığını, ama merakla yeterince, tam tersi olduğunu düşünürsünüz.Prob[Yi=1|xiβ>c]=1c


soru, son denkleminizin neden çözülemediğidir. lojistik fonksiyonunun 0 ve 1'deki ters ayrılması nedeniyle mi, yoksa genel olarak doğrusal olmayanlık yüzünden mi?
eyaler 20:12

5
(1) son paragrafta ilgili olarak: o Matematiksel açıdan yaptığı bir MLE mükemmel ayırma altdüzlem verecektir anlamda "mükemmel" iş. Senin olsun sayısal algoritma o durumda sağ duyulu davranır ayrı bir konudur. Laplace yumuşatma bu gibi durumlarda sıklıkla kullanılır.
kardinal

@eyaler, bunun genel olarak doğrusal olmama nedeniyle olduğunu söyleyebilirim. Anladığım kadarıyla, bu koşulların ne olduğunu bilmeme rağmen, bunun çözülebileceği sınırlı bir koşul kümesi olduğu.
StasK

1
Anlamıyorum, sistemi kapalı formda bir çözüme sahip olmayan hangi matematiksel durum var? Genelde işlerin kapalı form çözümlerinin olmadığı genel bir durum var mı?
Charlie Parker

lojistik regresyonun, bunun için degrade iniş yinelemesine bakarak kanıtlayabileceği bir şey olmadığı gerçeği var mı?
Charlie Parker

8

Bu gönderi aslında eldeki soruya tam bir cevaptan ziyade uzun bir yorum olarak düşünülmüştü.

Söz konusu soruya ilgi sadece ikili davada mı yoksa belki de sürekli olabileceği veya başka ayrık değerler alabilecekleri daha genel durumlarda mı olduğu belli değil.

Soruyu tam olarak cevaplamayan, ancak ilişkili olan ve sevdiğim bir örnek, eşleştirilmiş karşılaştırmalar yoluyla elde edilen öğe tercih sıralamasıyla ilgileniyor. Bradley – Terry modeli, ve bir "yakınlık", "popülerlik" olduğu lojistik bir regresyon olarak ifade edilebilir. veya öğesinin "strength" parametresi ile , maddesini eşleştirilmiş bir karşılaştırmada maddesine tercih ettiğini gösterir .

logit(Pr(Yij=1))=αiαj,
αiiYij=1ij

Eğer tam bir yuvarlak karşılaştırma dizisi gerçekleştirilirse (yani, sıralanmamış her çifti için çift yönlü bir tercih kaydedilir ), o zaman MLEs rütbe sırasına karşılık gelir. sıralaması , her nesnenin bir başkası üzerinde tercih toplamı.(i,j)α^iSi=jiYij

Bunu yorumlamak için, en sevdiğiniz rekabetçi sporda tam bir tur turnuvası hayal edin. Ardından, bu sonuç Bradley-Terry modelinin oyuncuları / takımları kazanma yüzdelerine göre sıraladığını söylüyor. Bunun cesaret verici veya hayal kırıklığı yaratan bir sonuç olup olmadığı, bakış açınıza bağlı olduğunu düşünüyorum.

Not: Bu sıralama sırası sonucu, genel olarak tam bir tur oyununun oynanmaması durumunda geçerli olmaz.


2
İkilikle ilgilenmiştim, çünkü analiz edilmesi en kolay olanıydı. Lauritzen'in çalışmalarında yeterince geniş bir durum buldum - karşılık gelen bir log-lineer model parçalanabilirse kapanıyorsunuz
Yaroslav Bulatov
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.