Kategorik ve sürekli değişken arasındaki etkileşimin katsayılarını yorumlayabilme


10

Sürekli ve kategorik değişken arasındaki etkileşimin katsayılarının yorumlanması hakkında bir sorum var. İşte benim modelim:

model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), 
               data=base_708)

Coefficients:
                         Estimate Std. Error t value Pr(>|t|)    
(Intercept)               21.4836     2.0698  10.380  < 2e-16 ***
lg_hag                     8.5691     3.7688   2.274  0.02334 *  
raceblack                 -8.4715     1.7482  -4.846 1.61e-06 ***
racemexican               -3.0483     1.7073  -1.785  0.07469 .  
racemulti/other           -4.6002     2.3098  -1.992  0.04687 *  
pdg                        2.8038     0.4268   6.570 1.10e-10 ***
sexfemale                  4.5691     1.1203   4.078 5.15e-05 ***
as.factor(educa)2         13.8266     2.6362   5.245 2.17e-07 ***
as.factor(educa)3         21.7913     2.4424   8.922  < 2e-16 ***
as.factor(educa)4         19.0179     2.5219   7.541 1.74e-13 ***
as.factor(educa)5         23.7470     2.7406   8.665  < 2e-16 ***
lg_hag:as.factor(educa)2 -21.2224     6.5904  -3.220  0.00135 ** 
lg_hag:as.factor(educa)3 -19.8083     6.1255  -3.234  0.00129 ** 
lg_hag:as.factor(educa)4  -8.5502     6.6018  -1.295  0.19577    
lg_hag:as.factor(educa)5 -17.2230     6.3711  -2.703  0.00706 ***

diyelim ki modelin denklemi:

E [dişli] = a + b1 (lg_hag) + b2 (educa2 * lg_hag) + b3 (educa3 * lg_hag) + b4 (educa4 * lg_hag) + b5 (pdg, ortalanmış) + diğer kovarlar,

b1 = difference in cog  with higher lg_hag among lowest education (coded as 1)
b1 + b2 = difference in cog with higher lg_hag among middle education (coded as 2)
b1 + b3 = difference in cog with higher lg_hag among high education (coded as 3)
b1 + b3 = difference in cog with higher lg_hag among very high education (coded as 4)
b5 = difference in cog with each unit increase in pdg

Benim sorum: Yorumum doğruysa, b1 ve b2 güven aralıklarından etkileşimlerin (örneğin: b1 + b2) tahmini her etki için güven aralıkları nasıl oluşturulur.


Yanıtlar:


8

Modelin katsayılarını yorumlamanız tam olarak doğru değildir. Önce modelin şartlarını özetleyeyim.

Kategorik değişkenler (faktörler): , verbircesexeducbir

Faktörün racedört seviyesi vardır: .rbirce={whbente,blbirck,mexbencbirn,multben/Öther}

Faktörün sexiki seviyesi vardır: .sex={male,female}

Faktörün educabeş seviyesi vardır: .educa={1,2,3,4,5}

Varsayılan olarak R, kategorik değişkenler için tedavi kontrastlarını kullanır. Bu tezatlarda, faktörün ilk değeri bir referans seviyesi kullanılır ve kalan değerler referansa göre test edilir. Kategorik bir değişken için maksimum kontrast sayısı, eksi bir düzey sayısına eşittir.

raceAşağıdaki farklılıkların test edilmesine izin veren kontrastlar : , ve .race=black vs.race=whiterace=mexican vs.race=whiterbirce=multben/Öther vs.rbirce=whbente

Faktör için referans seviyesi , zıtlık örüntüsü benzerdir. Bu etkiler bağımlı değişkendeki fark olarak yorumlanabilir. Örnekte, ortalama değeri olan için birim daha yüksektir ile karşılaştırıldığında ( ).educbir1cog13,8266educbir=2educbir=1as.factor(educa)2

Önemli bir not: Bir kategorik değişken için tedavi kontrastları bir modelde mevcutsa, daha fazla etki tahmini, başka etkiler ve kategorik değişken arasındaki etkileşimler de dahil edilirse kategorik değişkenin referans seviyesine dayanır. Değişken bir etkileşimin parçası değilse, katsayısı, geri kalan tüm kategorik değişkenler boyunca bu değişkenin alt kümelerinin tek tek eğimlerinin ortalamasına karşılık gelir. Etkileri ve diğer değişkenlerin faktör seviyelerine göre ortalama etkilere karşılık gelir. Genel etkilerini test etmek için , ayrılmak gerekir ve modelinin dışına.rbirceeducbirrbirceeducbirsex

Sayısal değişkenler: velg_hbirgpdg

Hem lg_hagve hem pdgde sayısal değişkenlerdir, bu nedenle katsayılar , öngörücüde bir artışla ilişkili bağımlı değişkenteki değişikliği temsil eder .1

Prensip olarak, bu etkilerin yorumlanması basittir. Ancak, eğer bütünleşmeler mevcutsa, katsayıların kestiriminin faktörlerin referans kategorilerine dayandığını unutmayın (tedavi zıtlıkları kullanılıyorsa). Yana bir etkileşimin bir parçası, ilgili değişkenin ortalama eğim katsayısı corrsespods değildir. Değişken ile karşılıklı etkileşimin isimli da parçası . Bu nedenle, etkisi temel seviye olan için geçerlidir ; faktörlerin seviyesine bakılmaksızın sayısal değişkeninin genel etkisinin bir testi değildir .pdglg_hbirgeducbireducbir=1lg_hbirg

Kategorik ve sayısal değişkenler arasındaki etkileşimler: lg_hbirgxeducbir

Model sayısal bir değişken arasındaki ana etkileri değil, aynı zamanda etkileşimleri içermez ile bağlantılı dört tezat . Bu etkiler eteklerinde fark olarak yorumlanabilir belirli bir seviye arasında ve referans düzeyi ( ).lg_hbirgeducbirlg_hbirgeducbireducbir=1

Örneğin, katsayısı lg_hag:as.factor(educa)2( -21.2224gelir) eğimi olduğu olan birimlerinin alt ile karşılaştırıldığında .lg_hbirg21,2224educbir=2educbir=1


"Bu etkileşim katsayıları sadece race=whiteve sex=malesadece için geçerlidir." Bundan emin misin? Soruyorum çünkü ne terim ile racene sexetkileşimde bulunuyor lg_hag×educa... Bunun açıkça belirtildiğini göremediğim birkaç metne bakıyorum.
landroni

2
@landroni Eğimler, kalan tüm tahminlerin 0'a eşit olduğu nokta için tahmin edilir.
Sven Hohenstein

Evet, bu benim anlayışım da. Diğer tüm yordayıcılar sabit tutulur, yani faktörler temel seviyelerine sabitlenir. Ama işte benim bilmem yatıyor: Bu ince ama geniş kapsamlı nüans üzerinde çoğunlukla parlak görünen birkaç kitaba baktım. Dahası, kağıtlar genellikle "endüstri tarafından kontrol edilir", ancak katsayıların tam örnek üzerinde koşulsuz olduğu sonucuna varır
landroni

1
"Bir kategorik değişken için tedavi kontrastları bir modelde mevcutsa, diğer etkilerin tahmini kategorik değişkenin referans seviyesine dayanır." Daha fazla düşündükten sonra ikna olmadım (ya da argümanınızı tamamen takip etmiyorum). Örneğin, beta tahmininin pdgreferans seviyesine bağlı olduğu ima edilmektedir , ki durum böyle değildir. Faktörlerden herhangi birinin referans seviyesini değiştirirsem (örn. sex), Tahmin pdgdeğişmeyecektir ...
landroni

1
@landroni İşaret ettiğiniz için teşekkürler. Haklısın, bu ifade yanıltıcı. Aslında, sadece kategorik değişkenlerle etkileşim terimlerinin bir parçası olan öngörücüler için geçerlidir. Bu nedenle, tahmini pdgaslında kontrastların spesifikasyonuna bağlı değildir . Cevabı buna göre değiştireceğim.
Sven Hohenstein
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.