Genel Doğrusal Model - Genelleştirilmiş Doğrusal Model (bir kimlik link fonksiyonu ile?)


25

Bu benim ilk gönderim, bu yüzden bazı standartlara uymuyorsam, lütfen beni rahatlat! Sorumu araştırdım ve hiçbir şey çıkmadı.

Benim sorum çoğunlukla genel doğrusal modelleme (GLM) ve genelleştirilmiş doğrusal modelleme (GZLM) arasındaki pratik farklar ile ilgilidir. Benim durumumda değişkenler olarak birkaç sürekli değişken ve GZLM'ye karşı ANCOVA'da birkaç faktör olacaktır. Her değişkenin ana etkilerini ve ayrıca modelde özetleyeceğim üç yönlü etkileşimi incelemek istiyorum. Bu hipotezin bir ANCOVA'da test edildiğini veya GZLM kullanılarak yapıldığını görebiliyorum. Bir dereceye kadar, ANCOVA gibi genel bir doğrusal model çalıştırmanın arkasındaki matematik işlemlerini ve gerekçelerini anlıyorum ve GZLM'lerin doğrusal modeli ve bağımlı değişkeni birbirine bağlayan bir bağlantı işlevine izin verdiğini biraz anlıyorum (tamam, yalan söyledim, belki yapmıyorum) gerçekten matematiği anlamak). Gerçekten ne yapıyorum? GZLM'de kullanılan olasılık dağılımı normal olduğunda (yani kimlik bağlantı fonksiyonu?) bir analiz yapmanın pratik farkları veya sebepleri değil, diğeri değil. Birini diğerine çalıştırdığımda çok farklı sonuçlar alıyorum. Ben de koşabilir miyim? Verilerim biraz normal değil ancak ANCOVA ve GZLM’de bir ölçüde çalışıyor. Her iki durumda da hipotezim destekleniyor, ancak GZLM'de p değeri "daha iyi".

Benim düşüncem, bir ANCOVA'nın, bir GZLM'de tam olarak girebileceğim şey olan bir kimlik bağlantı işlevi kullanarak normal dağılıma bağlı değişkenli doğrusal bir model olduğudur, ancak bunlar yine de farklıdır.

Lütfen yapabilirseniz bu sorulara biraz ışık tutunuz!


İlk cevaba göre ek bir sorum var:

Kullandıkları önemlilik testi dışında aynı ise (örneğin, F testi ve Wald Chi Meydanı gibi), hangisini kullanmak daha uygun olurdu? ANCOVA "go to to" yöntemidir, ancak F testinin neden tercih edileceğinden emin değilim. Birisi bu soruya benim için biraz ışık tutabilir mi? Teşekkürler!


@ onestop'un cevabı iyi; Çok uzun zaman önce oy kullandım. Genel doğrusal model ile genelleştirilmiş doğrusal model arasındaki bağlantıyı daha net anlamak için, cevabımı burada okumanıza yardımcı olabilir: logit ve probit modelleri arasındaki fark (farklı bir bağlamda yazılmış olmasına rağmen) . Daki hataları varsayarak, normal olarak dağıtılır, ancak hata varyans bilinmemektedir önsel, ve yazılımı ANCOVA doğru olacaktır w / dönecektir testler; Wald testindeki p değeri, N'niz çok büyük değilse, çok düşük olacaktır. tF
gung - Reinstate Monica

Yanıtlar:


23

Bir kimlik bağlantısı işlevini ve normal bir aile dağılımını belirten genelleştirilmiş bir doğrusal model, (genel) doğrusal bir modele tam olarak eşdeğerdir. Her birinden gözle görülür derecede farklı sonuçlar alıyorsanız, yanlış bir şey yapıyorsunuzdur.

Kimlik bağlantısı belirtmenin normal bir dağıtım belirtmekle aynı şey olmadığını unutmayın . Dağıtım ve bağlantı işlevi genelleştirilmiş doğrusal modelin iki farklı bileşenidir ve her biri diğerinden bağımsız olarak seçilebilir (bazı bağlantılar belirli dağıtımlarda daha iyi çalışsa da, çoğu yazılım paketi her dağıtım için izin verilen bağlantıların seçimini belirtir).

Bazı yazılım paketleri, tüm genelleştirilmiş doğrusal modeller için asimptotik normal ve ki-kare dağılımlarını kullanarak hesaplarsa, artık serbestlik dereceleri küçük olduğunda, belirgin farklı değerleri rapor edebilir . Tüm yazılımlar, genel doğrusal modeller için Öğrenci - ve Fisher'ın dağılımlarına dayanan -değerlerini rapor edeceklerdir ; Student - ve Fisher'in dağıtımı: Bazı rağmen, sadece normal bir aile için kesinlikle geçerlidir diğerpptFtF Genelleştirilmiş doğrusal modeller için bir yazılım, diğer ailelere verilerden tahmin edilen bir ölçek parametresiyle uydururken yaklaşımlar olarak da kullanabilir.


Cevabın için teşekkürler! Cevabınızı duyduğuma sevindim, asıl varsayım buydu. Aksi takdirde kurumumdaki bir profesör tarafından söylendi, bu yüzden gerçekten kazmaya gitmek zorunda kaldım. SPSS kullanıyorum ve şimdi parametre tahminlerinin gerçekten aynı olduğunu görüyorum (örneğin, B değerleri). Şimdi beni şaşırtan şeyin aslında farklı p değerleri olduğunu görüyorum. ANCOVA istatistiği standart bir F testine dayanırken, GZLM Wald Chi Meydanı'na dayanıyor, değil mi? Numunenin parametrelerini (GZLM'de olduğu gibi) kullandığınızda Wald Chi-Square'in kullanıldığını okudum.
Behacad

Bu cevaba göre, orijinal yazıya bir soru ekledim!
Behacad

Tamam, cevabımı cevabımı karşılık gelen bir para ekledik.
58'de

5

Bu tartışmaya deneyimlerimi dahil etmek istiyorum. Genelleştirilmiş bir doğrusal modelin (bir kimlik bağlantı işlevi ve normal bir aile dağılımını belirten), yalnızca ölçek parametresi yöntemi olarak maksimum olasılık tahminini kullandığınızda genel doğrusal modelle aynı olduğunu gördüm. Aksi takdirde "sabit değer = 1" ölçek parametresi yöntemi olarak seçilirse, çok farklı p değerleri elde edersiniz. Tecrübelerime göre, genellikle "sabit değer = 1" den kaçınılması gerektiğini öne sürdüm. Birinin ölçek parametresi yöntemi olarak sabit değer = 1'i seçmenin uygun olup olmadığını bilip bilmediğini merak ediyorum. Şimdiden teşekkürler. işaret


3
Tipik olarak, yalnızca yanıtın bir sayı veya gösterge / frekans değişkeni olduğu lojistik regresyon veya Poisson regresyonu gibi modellerde sabit bir ölçek kullanılır. Bu durumda normal regresyonda scale parametresine analog yoktur.
Hong Ooi
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.