Çok sınıf için lojistik regresyon


10

Tarafından verilen çoklu sınıf için lojistik regresyon modelini aldım

P(Y=j|X(i))=exp(θjTX(i))1+m=1kexp(θmTX(i))

burada k sınıf sayısı theta'nın tahmin edilecek parametredir j jth sınıfıdır Xi eğitim verileri

Alamadım bir şey, payda kısmı modelin nasıl normalleştirildiğidir. Yani olasılığı 0 ile 1 arasında tutuyor.

1+m=1kexp(θmTX(i))

Yani lojistik regresyon varlığına alışkınım

P(Y=1|X(i))=1/(1+exp(θTX(i)))

Aslında, nomalizasyon olayıyla kafam karıştı. Bu durumda, sigmoid bir işlev olduğu için, değerin asla 0'dan küçük veya 1'den büyük olmasına izin vermez. Ancak çok sınıflı durumda kafam karıştı. Neden böyle?

Bu benim referansım https://list.scms.waikato.ac.nz/pipermail/wekalist/2005-Şubat/029738.html . Bence normalleştirme olmalı

P(Y=j|X(i))=exp(θjTX(i))m=1kexp(θmTX(i))

2
İpucu: Lojistik regresyonda kapalı olarak ele alınması gereken iki olasılık vardır: olasılığı ve olasılığı . Bu olasılıklar olmalıdır . Y=1Y=01
whuber

1
Diğer yayınlarınızdan bazılarına göre, denklemleri nasıl işaretleyeceğinizi biliyorsunuz. Buradaki metin denklemlerinin okunması zordur ve (abonelikler?) Kafa karıştırıcıdır - bunları ile işaretleyebilir misiniz ? LATEX
Makro

2
Burada çok fazla soru yayınladığınızdan, lütfen iyi soruları nasıl soracağınızla ilgili SSS bölümümüzü duraklatın ve okuyun. Denklemlerinizi okunabilir hale getirmek için işaretleme yardımını okuyun . TEX
whuber

Denklemi düzenledim. @ Whuber Aslında, ikili değil çoklu sınıf lojistik regresyonu ile ilgili kafam karıştı. Donominator'daki tüm elemanları eklediğimde olasılığı normalleştirdiğimde
endişeliyim

@ user34790, her terimi toplamla böldüğünüzde, bireysel sınıf olasılıkları 1'e eşit olur. Bu arada nedir? X(i)
Makro

Yanıtlar:


13

Formülünüz yanlış (toplamın üst sınırı). sınıfları ile lojistik regresyonda ( ) temel olarak referans veya pivot olarak bir sınıf seçtiğiniz ikili lojistik regresyon modelleri yaratırsınız. Genellikle, son sınıf referans olarak seçilir. Böylece, referans sınıfın olasılığıOlasılığın genel şekliOlarak -inci sınıfı, referans ve bu nedenleKK>2K1K

P(yi=K|xi)=1k=1K1P(yi=k|xi).
P(yi=k|xi)=exp(θiTxi)i=1Kexp(θiTxi).
KθK=(0,,0)T
i=1Kexp(θiTxi)=exp(0)+i=1K1exp(θiTxi)=1+i=1K1exp(θiTxi).
Sonunda tüm için aşağıdaki formülü elde edersiniz : k<K
P(yi=k|xi)=exp(θiTxi)1+i=1K1exp(θiTxi)

4
Maksimum olasılık yapıyorsanız, referans sınıfı seçiminin önemli olmadığını unutmayın. Ancak cezalandırılmış maksimum olasılık veya bayes çıkarsama yapıyorsanız, olasılıkları aşırı parametreli bırakmak ve cezanın aşırı parametrelendirmeyi ele almanın bir yolunu seçmesine izin vermek genellikle daha yararlı olabilir. Bunun nedeni, çoğu ceza işlevinin / önceliğinin referans sınıfının seçimine göre değişmez olmaması
olasılık

@sebp, öyle görünüyor biraz kafa karıştırıcı; gözlem için ve kategori yinelemesi için başka bir harf kullanmak daha iyi olur . iik
garej

4

Sana bir yazım hatası karıştı ediliyor düşünüyorum: Sizin olmalıdır birinci denklemde. Eğer lojistik durumda bakınız 1'ler aslında örneğin, s, bir olduğunda inci . k - 1 exp ( 0 ) k θ = 0kk1exp(0)kθ=0

Diyelim ki . Şimdi son formülasyondan gibi lojistik regresyon sürümüne ulaşabileceğinizi unutmayın. Birden fazla sınıf için, ilk iki miktardaki paydayı üstel lineer öngörücülerin toplamıyla değiştirin. exp ( b )θ1X=b

exp(b)exp(0)+exp(b)=exp(0)exp(0)+exp(b)=11+exp(b)
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.