Kjetil b halvorsen'ın işaret ettiği gibi, kendi başına, doğrusal regresyonun analitik bir çözüm getirdiği bir mucizedir. Ve bu sadece problemin doğrusallığı sayesinde (parametrelere göre).
, ilk sipariş koşullarına
sahip olan
ile ilgili bir sorun için (sabit dahil gerekli-orada kökenli sorunlar üzerinden bazı regresyon, çok iseniz) değişkenleri, bu bir sistemdir denklemler ve bilinmeyenli. En önemlisi, doğrusal bir sistemdir, bu nedenle standart doğrusal cebir teorisi ve pratiğini kullanarak bir çözüm bulabilirsiniz.
∑i(yi−x′iβ)2→minβ,
−2∑i(yi−x′iβ)xi=0
ppp. Tamamen collinear değişkenleriniz olmadıkça, bu olasılık 1 ile bir çözüme sahip olacaktır.
Şimdi, lojistik regresyon ile, işler artık o kadar kolay değil. Günlük olabilirlik işlevini not etmek,
ve bulmak için türevini alarak,
parametreleri bunu çok doğrusal olmayan bir şekilde girer: her , doğrusal olmayan bir işlev vardır ve bunlar birlikte eklenir. Analitik bir çözüm yoktur (muhtemelen iki gözlemle önemsiz bir durum dışında veya bunun gibi bir şey hariç) ve kullanmak zorundasınız.
l(y;x,β)=∑iyilnpi+(1−yi)ln(1−pi),pi=(1+exp(−θi))−1,θi=x′iβ,
∂l∂β′=∑idpidθ(yipi−1−yi1−pi)xi=∑i[yi−11+exp(x′iβ)]xi
βi tahminlerini bulmak için
doğrusal olmayan optimizasyon yöntemleri .
β^
Soruna biraz daha derinlemesine bakıldığında (ikinci türevi alarak), bunun bir içbükey işlev (maksimum yüceltilmiş bir çok değişkenli parabol) bulma konusunda dışbükey bir optimizasyon problemi olduğunu, bu nedenle birinin var olduğunu ve herhangi bir makul algoritmanın bunun yerine bulması gerektiğini ortaya koymaktadır. Çabuk, ya da şeyler sonsuzluğa patlar. İkincisi, bazı için olduğunda lojistik regresyonda olur , yani mükemmel bir tahmininiz vardır. Bu oldukça nahoş bir eserdir: Mükemmel bir tahminde bulunduğunuzda, modelin mükemmel çalıştığını, ama merakla yeterince, tam tersi olduğunu düşünürsünüz.Prob[Yi=1|x′iβ>c]=1c