GLM için “link fonksiyonu” ile “canonical link fonksiyonu” arasındaki fark nedir?


65

'Link function' ve 'canonical link function' terimleri arasındaki fark nedir? Ayrıca, birini üst üste kullanmanın (teorik) avantajları var mı?

Örneğin, bir ikili tepki değişkeni gibi birçok bağlantı işlevleri kullanarak modellenebilir logit , probit , vb Ama, logit burada "canonical" bağlantısı fonksiyonu olarak kabul edilir.


10
Bağlantı fonksiyonlarını burada yoğun bir şekilde tartışıyorum: İkili yanıt değişkeni için regresyona odaklanan logit ve probit modeller arasındaki fark . Her ne kadar bu tartışmadan sadece bir kısmı bir link fonksiyonunun 'kanonik' olmasının anlamına odaklansa da, yine de okumak faydalı olabilir. Bir kanonik-kanonik olmayan link fonksiyonunun b / t ayrımının ve avantajlarının anlaşılması için GLiM'in altında yatan matematiğe oldukça derinlemesine gitmek gerektiğini unutmayın.
gung - Reinstate Monica

Yanıtlar:


68

Yukarıdaki cevaplar daha sezgiseldir, bu yüzden daha sert çalışıyorum.

GLM nedir?

Let bir yanıt, bir dizi ifade ve boyutlu eş değişken vektör beklenen değeri ile . İçin bağımsız gözlemler, her bir dağıtım yoğunluğu ile, üstel aile burada, ilgi (doğal veya kurallı parametresi) parametresidir , bir ölçü parametredir (bilinen veya bir sıkıntı olarak görülen) ve bir ve olan bilinen fonksiyonlar. y p x = ( x 1 , , x p ) E ( y ) = μ i = 1 , , n y i f ( y i ; θ i , ϕ ) = exp { [ y i θ i - γ ( θ i ) ] /Y=(y,x)ypx=(x1,,xp)E(y)=μi=1,,nyiθ i ϕ γ τ n p x 1 , , x p η i = β 0 + β 1 x i 1 + + β p x i p θ i θ = ( γ ) - 1 ( μ ) η θ μ g (

f(yi;θi,ϕ)=exp{[yiθiγ(θi)]/ϕ+τ(yi,ϕ)}
θiϕγτniçin sabit giriş değerleri boyutlu vektörler , açıklayıcı değişkenler ile gösterilir . Bu giriş, sadece doğrusal fonksiyonu, doğrusal belirteci ile etki (1) vektörleri varsayalım bunun üzerine bağlıdır. Bu gösterilebilir olarak , bu bağımlılık doğrusal tahmin bağlayarak oluşturulur ve ortalama ile. Daha spesifik olarak, ortalama , doğrusal kestiricinin tersinir ve pürüzsüz bir işlevi olarak görülür, yani px1,,xp
ηi=β0+β1xi1++βpxip
θiθ=(γ)1(μ)ηθμ
g(μ)=η or μ=g1(η)
Şimdi sorunuzu cevaplamak için:

Fonksiyonu bağlantı fonksiyonu olarak adlandırılır. İşlev bağlanıyorsa , ve böyle , bu bağlantı kanonik denilen ve formu vardır .g()μηθηθg=(γ)1

Bu kadar. Daha sonra, örneğin standart bir bağlantı kullanılarak, arzu edilen istatistiksel özelliklerinin bir dizi vardır, yeterli istatistiği olan bileşenleri ile için , Newton yöntemi ve Fisher için puanlama ML tahmin çakışması bulma, bu bağlantıları MLE türetilmesini kolaylaştırmak, bu doğrusal regresyon bazı özellikleri (örneğin, artıkların toplamı 0) tutmak sağlamak ya da sağlamak sonuç değişkeni aralıkta kalmasını .Xyixijyij=1,,pμ

Dolayısıyla, varsayılan olarak kullanılmaya meyillidirler. Bununla birlikte, modeldeki etkilerin, bu veya başka bir bağlantı tarafından verilen ölçekte katkı sağlaması için önceden bir sebep bulunmadığına dikkat edin.


5
+1, bu gerçekten çok güzel bir cevap, @Momo. Onların paragraflarda gömüldüğü zaman okumak için zor denklem bazı buldunuz, bu yüzden çifte dolar işaretleri kullanarak onları dışarı 'bloke' (yani $ $). Umarım tamamdır (eğer olmazsa özür dilerim, geri alabilirsiniz).
gung - Reinstate Monica

1
Ancak buradaki orijinal soru, Wei'nin sorduğu şeyi içeriyor, bu nedenle henüz net bir şekilde yanıtlanmadığını belirtmeye değer.
Glen_b

1
Umarım şaşkınlığınızı doğru anlıyorum: Bahsettiğiniz üstel ailede, kanonik parametre ve kanonik bağlantı ise iken . Ayrıca, (birinci türevin beklenen olabilirlik fonksiyonunun değerine göre beklenen değerini hesaplarsanız ) olduğunda görünür . θη=θg(μ)=θθ=(γ)1(μ)θθμg(.)=(γ)1(.)
Momo

1
Çok teşekkür ederim. Önceki örneği kullanarak, biz . Dolayısıyla . Dediğiniz gibi (sadece yeniden ifade ettim), sadece eğer Logon olan kanonik link ise. Daha sonra . Dolayısıyla, ve yordayıcı arasındaki eşitlik , yalnızca kanonik bağlantı işlevini kullanırsak var olur. (γ')-1(.)=(.) Logitη=θg(.)Θ=lOgıt(π)=ηθηγ(θ)=π=exp(θ)1+exp(θ)(γ)1(.)=logit(.)η=θg(.)θ=logit(π)=ηθη
Druss2k

2
Cevabın anahtar cümlesinde bir yazım hatası var gibi görünüyor: "işlev ve st " okunmamalı mı? θ η θμθηθ
Leo Alekseyev

16

gung iyi bir açıklamadan alıntı yaptı: kanonik bağlantı asgari yeterliliğe sahip özel teorik özelliklere sahip. Bu, sonuç sayısını şartlandırarak koşullu bir logit modelini (ekonomistlerin sabit etki modeli olarak adlandırır) tanımlayabileceğiniz anlamına gelir, ancak koşullu bir probit modelini tanımlayamazsınız, çünkü probit bağlantısı ile kullanmak için yeterli istatistik yoktur.


Minimal yeterliliğe biraz odaklanabilir misiniz? Yukarıdaki açıklama ile hala bir probit model tanımlayabiliriz, değil mi? Kanonik link işlevi kesinlikle olmayacak, ancak kanonik olmayan link işlevini kullanmanın zararı ne olacaktır.
pikachuchameleon

9

İşte bu fonksiyonlar arasındaki ilişkilerin görselleştirilmesine yardımcı olduğu için MIT'nin 18.650 sınıfından ilham alan küçük bir şema . @ Momo'nun yayınındakiyle aynı notasyonu kullandım:

görüntü tanımını buraya girin

  • γ(θ) kümülatif moment üreten fonksiyondur
  • g(μ) link işlevidir

Bu nedenle, link fonksiyonu lineer prediktörü ortalamayla ilişkilendirir ve monoton arttırıcı, sürekli farklılaşabilir ve ters çevrilebilir olması gerekir.g

Diyagram, bir yönden diğerine kolayca gitmeyi sağlar, örneğin:

θ = γ - 1 ( g - 1 ( η ) )

η=g(γ(θ))
θ=γ1(g1(η))

Kanonik bağlantı işlevi

Momo’nun titizlikle açıkladığı şeyi görmenin bir başka yolu, kanonik bağlantı işlevi olduğu zaman, o zaman işlev bileşimi kimliğim ve bu yüzden γ - 1g - 1 = ( g γ ) - 1 = I θ = ηg

γ1g1=(gγ)1=I
θ=η

1

Yukarıdaki cevaplar söylemek istediklerimi zaten kapsıyor. Makine öğrenmesi araştırmacısı olarak birkaç noktayı netleştirmek için:

  1. link işlevi aktivasyon işlevinin tersinden başka bir şey değildir. Örneğin, logit, sigmoidin tersidir, probit Gaussian'ın kümülatif dağılım fonksiyonunun tersidir.

  2. Biz genel lineer model parametresini alır, yalnızca bağlıdır ile, ağırlık vektörü ve olmak girdi olarak, daha sonra bağlantı fonksiyonu standart olarak adlandırılır.w xwTxwx

Yukarıdaki tartışmanın üstel aileyle hiçbir ilgisi yoktur, ancak Christopher Bishop'ın PRML kitabı Bölüm 4.3.6'da güzel bir tartışma bulunabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.