Lojistik regresyon analizinde sürekli bağımsız değişkenler için logit için doğrusallık varsayımını nasıl kontrol etmeliyim?


13

Lojistik regresyon analizinde sürekli öngörücü değişkenler için logit için doğrusallık varsayımı ile karıştırıyorum. Tek değişkenli lojistik regresyon analizi kullanarak potansiyel prediktörleri tararken doğrusal ilişkiyi kontrol etmemiz gerekir mi?

Benim durumumda, katılımcılar arasında beslenme durumu (ikilik sonuç) ile ilişkili faktörleri tanımlamak için çoklu lojistik regresyon analizini kullanıyorum. Yaş, Charlson komorbidite skoru, Barthel Index skoru, el kavrama gücü, GDS skoru, BMI vb. Dahil sürekli değişkenler. İlk adımım basit lojistik regresyon kullanarak anlamlı değişkenleri taramaktır. Her sürekli değişken için basit lojistik regresyon analizleri sırasında doğrusallık varsayımını kontrol etmem gerekir mi? Yoksa sadece son çoklu lojistik regresyon modelinde kontrol etmeli miyim?

Ayrıca, benim anlayışım için, doğrusal olmayan sürekli değişkeni modele girmeden önce dönüştürmemiz gerekiyor. Dönüşüm yerine doğrusal olmayan sürekli değişkeni sınıflandırabilir miyim?


1
Sen gerektiğini değil spline'lara denemek için daha iyi kategorize!
kjetil b halvorsen

Yanıtlar:


11

Regresyon Modelleme Stratejileri kitabımda ayrıntılı olarak açıkladığım gibi (2. baskı 2015-09-04, şimdi e-kitap mevcut), modellemeden önce değişkenleri dönüştürmeye çalışma süreci problemlerle doludur, en önemlilerinden biri deformasyon tip I hata ve güven aralıkları. Sınıflandırma, özellikle uyum ve keyfilik eksikliği gibi daha ciddi sorunlara neden olmaktadır.

Bu konuyu "uyumsuzluğu kontrol edin" problemi olarak düşünmek yerine, uyum sağlayabilecek bir model belirlemek olarak düşünmek daha iyidir. Bunu yapmanın bir yolu, modelin güçlü olması muhtemel ve doğrusallığı zaten makul bir varsayım olarak bilinmeyen kısımlarına parametreler atamaktır. Bu süreçte, etkili örneklem büyüklüğü incelenir (sizin durumunuzda minimum olay sayısı ve olay dışı sayı sayısı) ve verilerin bilgi içeriğinin izin verdiği ölçüde karmaşıklığa izin verir (örneğin 15: 1 olaylar: parametre kuralını kullanarak) başparmak). Esnek bir katkı parametrik modelini önceden belirterek, yalnızca önemli etkileşimleri atlayarak önemli olduğu yerde yanlış olur. Etkileşimler, genel olarak, önceden belirtilmelidir.

Modelde resmi olmayan bir testle (R rmspaketi ile kolaylaştı ) doğrusal olmama gerekip gerekmediğini kontrol edebilir, ancak yukarıda özetlediğim çıkarımsal bozulmaları yarattığında bu terimleri ortadan kaldırabilirsiniz .

Daha fazla ayrıntı http://biostat.mc.vanderbilt.edu/rms adresinden bağlantı verilen ders notlarında bulunabilir .


Daha önce bahsetmediğim için üzgünüm ama R'ye aşina değilim ve analizler için SPSS kullanıyordum. Sağlanan çözümden, eğer etkili örnek boyutunu (15: 1) kullanırsam, doğrusallıklarını kontrol etmeden tüm önemli faktörleri (incelemeden) dahil edebileceğim anlamına mı geliyor?
Sze Lin Tan

Benim durumumda yaptığım tek değişkenli lojistik regresyon analizlerinden, VKİ, baldır çevresi, orta-üst kol çevresi, beslenme durumunun basit lojistik regresyon modeline önemli bir katkı sağlıyor (p <0.05). Ancak, Box-Tidwell yaklaşımını (her basit lojistik model için) kullanarak varsayımı kontrol ettiğimde doğrusallık varsayımına uymadıkları ortaya çıktı. Bu yüzden bu öngörücülerle çoklu lojistik regresyon analizine devam edip etmemem gerektiğinden emin değilim.
Sze Lin Tan

5
Tek değişkenli analiz temelinde model oluşturmak geçersizdir. Bir dizi soruna neden olduğu bilinen adım adım regresyonu iletmek için bir varyant kullanıyorsunuz.
Frank Harrell

8

Lojistik regresyon, bağımlı ve bağımsız değişkenler arasında doğrusal bir ilişki YOKTUR. Bağımlı değişkenin log olasılıkları ile bağımsız değişkenler arasında doğrusal bir ilişki olduğunu varsayar (Bu esas olarak sürekli bağımsız değişkenlerle ilgili bir sorundur.) Bunun için kullanabileceğiniz Box-Tidwell adlı bir test vardır. Stata komutu boxtid'dir. SPSS komutunu bilmiyorum, üzgünüm.

Bu yardımcı olabilir - http://www.ats.ucla.edu/stat/stata/webbooks/logistic/chapter3/statalog3.htm


Bağlantı kesildi.
Alexey Çalı

1

Bence bir regresyon modelinde kullanmadan önce sürekli değişkenleri çizmeli ve doğrusallığı kontrol etmeliyiz. Doğrusallık makul bir varsayım gibi görünüyorsa, bunun muhtemelen çoğu durumda çok değişkenli son regresyon modelinde devam edeceğini düşünüyorum ve eğer değilse, bu öncelikle düzeltebileceğiniz etkileşim etkilerinden kaynaklanıyor olabilir.

Evet, doğrusal olmayan sürekli değişkenleri kategorilere ayırmak bir seçenektir. Bununla ilgili sorunlar, kategorilerin çoğu durumda keyfi görünebilmesidir ve kategoriler arasındaki kesme puanlarındaki küçük farklılıklar, kategorilerin sayısına ve verilerinizin boyutuna bağlı olarak farklı sonuçlara (özellikle istatistiksel önem açısından) yol açabilir. , verilerde çok değerli bilgileri kaybedebilirsiniz.

Alternatif bir yaklaşım, lojistik regresyon olarak belirtilebilen, ancak doğrusal olmayan bağımsız değişkenleri "daha düzgün fonksiyonlar" olarak dahil edebileceğiniz bir regresyon modeli olan genelleştirilmiş bir katkı modeli kullanmaktır. Teknik olarak, bu R'de çok karmaşık değil, ancak diğer yazılım paketlerini bilmiyorum. Bu modeller, bağımlı değişkenlerle doğrusal olmayan ilişkileri tanımlayacaktır, ancak bir dezavantajı, çıktınızda sunmak için düzgün ve düzenli sayılar elde etmemeniz, daha ziyade istatistiksel anlamlılık için test edilen görsel bir eğri elde etmeniz olabilir. Dolayısıyla, doğrusal olmayan değişkenin sonuç değişkeni üzerindeki etkisini ölçmekle ne kadar ilgilendiğiniz bağlıdır.

Son olarak, en azından R kullanıyorsanız, lojistik regresyon modelinizdeki doğrusallık varsayımlarını test etmek için yukarıda açıklanan genelleştirilmiş katkı modellerini kullanabilirsiniz.

Bu kitaba bir göz atın (sizinkinden ve benimkinden çok farklı bir alan ama bu hiç önemli değil): http://www.amazon.com/Effects-Extensions-Ecology-Statistics-Biology/dp/0387874577 / ref = sr_1_1? ie = UTF8 & qid = 1440928328 & sr = 8-1 & anahtar kelimeler = zuur + ekoloji


R'ye aşina değilim ve analizler için SPSS kullanıyordum. Daha önce bahsetmediğim için üzgünüm. Doğrusallık varsayımını kontrol etmek için Box-Tidwell yaklaşımını kullanabilir (sürekli değişken ile kendi doğal günlüğü arasında bir etkileşim terimi oluşturarak ve etkileşim terimini modele ekleyerek)?
Sze Lin Tan

1

Verilerinizi bilmediğim için, bu üç değişkeni - temel değişken, doğal günlüğü ve etkileşimli bir terim - birleştirip birleştirmeyeceğinizi bilmiyorum. Bununla birlikte, geçmişte üç terimi birleştirmeyi düşündüğümde, ölçtüğüm şeyin kavramsal izini sık sık kaybettiğimi biliyorum. Neyi ölçtüğünüzü iyi kavramanız gerekir, yoksa bulgularınızı açıklamakta zorlanırsınız. Umarım yardımcı olur!

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.