GLM neden dönüştürülmüş değişkenli LM'den farklı?


16

Bu ders notunda açıklandığı gibi (sayfa 1) , lineer bir model şu şekilde yazılabilir:

y=β1x1++βpxp+εi,

burada cevap değişkendir ve bir x_ {i} olan i ^ {inci} açıklayıcı değişken.yxiith

Genellikle test varsayımlarını karşılamak amacıyla, yanıt değişkeni dönüştürülebilir. Örneğin, günlük işlevini her yi . Bir yanıt değişkeninin dönüştürülmesi bir GLM yapmaya eşdeğer DEĞİLDİR.

Bir GLM aşağıdaki biçimde yazılabilir ( ders broşüründen tekrar (sayfa 3) )

g(u)=β1x1++βpxp+εi,

Burada ders notundaki 2. sayfada anladığım gibi sadece için başka bir semboldür . g () bağlantı işlevi olarak adlandırılır.uyg()

Kurstaki slaytlardan dönüştürülmüş değişkenli bir GLM ve LM arasındaki farkı gerçekten anlamıyorum. Bana bununla yardım edebilir misin?


2
İkili bir sonucun tüm dönüşümlerinin afin olduğunu, böylece sizi normal en küçük kareler regresyonuyla sınırlandıracağını düşünmek için aydınlatıcı bulabilirsiniz . Bu açık bir şekilde lojistik regresyonun (ikili yanıtlar için standart bir GLM) gerçekleştirdiği şey değildir. (Test: sonuç değerleri olarak kodlanmış izin ve ve izin . Herhangi bir dönüştürme olmak yazma ve buluruz üzerinde kabul ile (bir benzeşik transformasyon olduğu ), burada vey 1 ϕ z 0 = ϕ ( y 0 ) z 1 = ϕ ( y 1 ) ϕ { y 0 , y 1 } y λ y + μ y λ = ( z 1 - z 0 ) / ( y 1 - y 0 ) μ = z 0 - λ y 0y0y1ϕz0=ϕ(y0)z1=ϕ(y1)ϕ{y0,y1}yλy+μyλ=(z1z0)/(y1y0)μ=z0λy0 .)
whuber

Yanıtlar:


15

Doğrusal bir regresyon yapmadan önce yanıtı dönüştürmek bunu yapıyor:

E(g(Y))β0+β1x1++βpxp

burada belirli bir işlevdir ve nin belirli bir dağılımı (genellikle normal) olduğunu varsayarız .gg(Y)

Genelleştirilmiş doğrusal bir model bunu yapıyor:

g(E(Y))β0+β1x1++βpxp

burada , öncekiyle aynıdır ve belirli bir dağılımına sahip olduğunu varsayarız (genellikle normal değildir).gY


denkleminde E nedir?
user1406647

1
E(X) beklenen değeri, standart gösterim olup . X
Marcus PS


22

Bunun sizin için tam bir cevap olup olmayacağından emin değilim, ancak kavramsal logjamın serbest kalmasına yardımcı olabilir.

Hesabınızda iki yanlış anlama var gibi görünüyor:

  1. Ayı akılda sıradan en küçük kareler (EKK - 'lineer') regresyon olduğu genelleştirilmiş doğrusal modelin özel bir durumudur. Bu nedenle, "[t] bir yanıt değişkeninin yeniden biçimlendirilmesi bir GLM yapmaya eşdeğer DEĞİLDİR" derseniz, bu yanlıştır. Doğrusal bir modelin takılması veya yanıt değişkeninin dönüştürülmesi ve daha sonra doğrusal bir modelin takılması 'bir GLM yapmak' anlamına gelir.

  2. GLM'lerin standart formülasyonunda, " " olarak adlandırdığınız (genellikle temsil edilir , ancak bu sadece bir tercih meselesidir), ortak alandaki belirli bir konumda koşullu yanıt dağılımının ortalamasıdır (yani, ). Bu nedenle, " sadece başka bir sembolüdür " derseniz , bu da yanlıştır. OLS formülasyonunda, rastgele bir değişkendir ve / veya gözlem / çalışma ünitesi için gerçek bir değeridir . Yani, (daha genel olarak) bir parametreyi değil verileri temsil eder . uμXuyYyiYiy

    (Hatalara zarar vermek istemiyorum, sadece bunların kafa karışıklığına neden olabileceğinden şüpheleniyorum.)

  3. Genelleştirilmiş doğrusal modelin bahsettiğinizi görmediğim başka bir yönü daha var. Bu, bir yanıt dağılımı belirtmemizdir. OLS regresyonu durumunda, yanıt dağılımı Gauss (normal) ve link fonksiyonu kimlik fonksiyonudur. Örneğin, lojistik regresyon durumunda (insanların GLM'leri düşündüklerinde ilk düşündükleri olabilir), yanıt dağılımı Bernoulli'dir (/ binom) ve bağlantı fonksiyonu logittir. OLS için varsayımların karşılandığından emin olmak için dönüşümleri kullanırken, koşullu yanıt dağılımını kabul edilebilir şekilde normal yapmaya çalışıyoruz. Bununla birlikte, böyle bir dönüşüm Bernoulli dağılımını kabul edilebilir şekilde normal yapmaz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.