Bir GLM'de kesişme terimi nasıl yorumlanır?


20

R kullanıyorum ve verilerimi Binomial linkli GLM ile analiz ediyorum.

Çıktı tablosundaki kesişimin ne anlama geldiğini bilmek istiyorum. Modellerimden birinin kesişmesi önemli ölçüde farklıdır, ancak değişken değildir. Ne anlama geliyor?

Kesişme nedir. Sadece kendimi karıştırıyor muyum bilmiyorum ama internette arama yaptıktan sonra, sadece söyleyecek bir şey yok, bu, dikkat edin ... ya da yapma.

Lütfen yardım edin, çok sinirli bir öğrenci


glm(formula = attacked_excluding_app ~ treatment, family = binomial, 
    data = data)
Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.3548   0.3593   0.3593   0.3593   0.3593  
Coefficients:
                         Estimate Std. Error z value Pr(>|z|)   
(Intercept)                 2.708      1.033   2.622  0.00874 **
treatmentshiny_non-shiny    0.000      1.461   0.000  1.00000

(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963  on 31  degrees of freedom
Residual deviance: 14.963  on 30  degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5

1
Glm'de belirttiğiniz bağlantı işlevi nedir?
Tomas

5
Tüm bağımsız değişkenler 0 olduğunda kesişme bağımlı değişkenin öngörülen değeridir. Modeliniz hakkında daha fazla bilgi olmadan, durumunuzda bunun anlamlı olup olmadığını söyleyemem.
Peter Flom - Monica'yı eski durumuna döndürün

Yanıtlar:


21

Kesme noktası terimi, GLM denkleminin doğrusal kısmındaki kesme noktasıdır, bu nedenle ortalama için modeliniz dır ; burada , bağlantı fonksiyonunuzdur ve sizin doğrusal modelinizdir. Bu doğrusal model bir "kesişim terimi" içerir, yani:g X βE[Y]=g-1(Xβ)gXβ

Xβ=c+X1β1+X2β2+

Sizin durumunuzda kesişme noktası önemli ölçüde sıfır değildir, ancak değişken değildir, bu yüzden

Xβ=c0

Bağlantı işleviniz binom olduğundan,

g(μ)=ln(μ1-μ)

Ve böylece sadece kesme terimi ile, ortalama için uygun modeliniz:

E[Y]=11+e-c

Eğer ise, bunun 50 = 50 Y = 1 veya 0 elde etme şansına karşılık geldiğini görebilirsiniz, yaniE [ Y ] = 1c=0E[Y]=11+1=0.5

Sonuçlarınız sonucu tahmin edemeyeceğinizi söylüyor, ancak bir sınıf (1 veya 0) diğerinden daha olası.


2
Beni E [Y] = .... :) 'de korkuttun. Cevabınız için teşekkür ederim, ne söylediğinizi anlıyorum (nazikçe). Kesişimin sig olduğunu söyledin. sıfır olmayan, ancak var. değil, p = 1.00 !? P-değeri değişkenlerinin sonuç hakkında söyleyebileceğim üzerinde ne gibi bir etkisi var?
Samuel Waldron

2
Değişkenler p değeri küçük değilse, tipik olarak bu değişkeni modelde içermez. Sizin durumunuzda, değişkenin sıfır olmayan bir değere sahip olduğu tahmin edilmemektedir, bu nedenle p değeri 1.00'dir. Temel olarak "tedavi" ve "saldırıya uğrayan_exclude_app" arasında bir ilişki yoktur. İlişki yokluğu o kadar mükemmel ki, küçük bir veri kümeniz olmasına rağmen neredeyse şüphelidir. Verilerinizi görselleştirmeye ve makul olup olmadığını görmeye değer olabilir.
Corone

2
Cevabınız için +1, (ve veri kümesinde garip bir şey olduğuna dair yorumda öneri), yorumunuzun açılışına katılmama rağmen "Bir değişken p değeri küçük değilse, genellikle bu değişkeni modellemek." Bu mutlaka böyle değildir - çoğu zaman bir ilişkinin büyüklüğünü, "anlamlı" olmasa bile (ve daha da önemlisi, bir ilişkiyi başlamak için modellemekle ilgileniyorsanız, o zaman boş bir sonuç) bildirmek ister. rapor etmek hala önemlidir.)
James Stanley

1
@James - çok iyi bir nokta, her zaman hangi değişkenleri test ettiğinizi rapor etmeliydim - Daha net olmalıydım, sadece bir tahmin yapmak için modeli kullanmaya çalışırken tipik olarak bu değişkeni içermeyeceği anlamına geliyordu (çünkü genellikle aşırı sığdırma anlamına gelirdi) ).
Corone

@Corone - Özellikle burada değişken / hariç tutma ve istatistiklerle
rolando2 2:13

5

Bana öyle geliyor ki verilerle ilgili bir sorun olabilir. Katsayı için parametre tahmininin 0.000 olması tuhaftır. Hem DV'niz hem de IV'niz ikiye bölünmüş gibi görünüyor ve DV'nizin oranları IV'ünüzle hiç değişmiyor. Bu doğru mu?

Yorumumda belirttiğim gibi (@corone cevabının ima ettiği gibi) kesişim IV 0 olduğunda DV'nin değeridir. IV kodunuz nasıl kodlandı? Ancak olduğu gibi, katsayı için tahminin 0.000 olması, IV'ün hiçbir fark yaratmadığı anlamına gelir.

günlük(p1-p)


Merhaba arkadaşlar, yorumlar için tekrar teşekkür ederim. Veri noktaları hemen hemen aynıdır. Bir raporda rapor ediyorum ve yine de vurgulamak zorundayım. Bu yüzden sonuçlar tuhaf görünüyor. Bu veriler (GLM) ve raporlarımdaki (GLMM) diğer veri kümeleri ile yürümeden önce deffinately (# TEAM2x2x2x2) çalışıyorum. Sanırım asıl sorunum, neyi rapor etmem gerektiğini bilmek, kesişme veya IV istatistiklerini sunmak mı? Aşağıda yine binom linkli (umarım daha standart) GLMM'm.
Samuel Waldron

Laplace yaklaşım Formülüne uyan genelleştirilmiş doğrusal karışık model Formül: Saldırı ~ Tedavi + Deneme + Tedavi * Deneme + (1 | Kuş) Veri: veri AIC BIC logLik sapması 139.6 153.8 -64.78 129.6 Rastgele etkiler: Gruplar Ad Varyans Std.Dev. Bird (Intercept) 0.87795 0.93699 Gözlem sayısı: 128, gruplar: Kuş, 32
Samuel Waldron

Sabit etkiler: Tahmini Std. Hata z değeri Pr (> | z |) (Kesme noktası) 3.19504 0.90446 3.533 .000412 *** Tedavilerhiny_non-parlak 0.02617 1.26964 0.021 .983558 Deneme -1.53880 0.36705 -4.192 2.76e-05 *** Tedavi: Deneme 0.16909 0.49501 0.342 .732655 --- Anlamlı. kodlar: 0 ' ' 0.001 ' ' 0.01 ' ' 0.05 '.' 0.1 '' 1 Sabit Etkilerin Korelasyonu: (Intr) Trtm_- Deneme Trtmntshn_- -0.712 Deneme -0.895 0.638 Trtmnts _-: T 0.664 -0.896 -0.742
Samuel Waldron

3

Sizin durumunuzda, kesinti attacked_excluding_appne olursa olsun tüm veriler için hesaplanan büyük ortalamadır treatment. Katsayılar tablosundaki önem testi, sıfırdan önemli ölçüde farklı olup olmadığını test etmektir. Bunun ilgili olup olmadığı, sıfır olmasını beklemek için a priori nedeniniz olup olmadığına bağlıdır.

Örneğin, bir ilaç ve bir plaseboyu kan basıncı üzerindeki etkileri açısından test ettiğinizi düşünün. Her denek için, kan basıncındaki değişikliği hesaplayarak (tedaviden sonraki basınç - tedaviden önceki basınç) kaydedersiniz ve bunu analizinizde bağımlı değişken olarak ele alırsınız. Daha sonra tedavinin etkisinin (ilaca karşı plasebo) önemli olmadığını, ancak kesmenin önemli ölçüde> 0 olduğunu fark edersiniz - bu, ortalama olarak, deneklerinizin kan basıncının iki ölçüm süresi arasında arttığını gösterir. Bu ilginç olabilir ve daha fazla araştırılması gerekebilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.