İkili bağımlı ve bağımsız değişkenlerle lojistik regresyon


15

Hem bağımlı hem de bağımsız değişkenlerin ikili olduğu bir lojistik regresyon yapmak uygun mudur? örneğin, bağımlı değişken 0 ve 1'dir ve öngörücüler kontrast kodlu değişkenler -1 ve 1?

Yanıtlar:


6

Bunu yapmak için hiçbir neden yoktur, ancak iki uyarıcı düşünce vardır:

  1. Hangi analiz sırasında dikkatli olun. Büyük projelerde, kaybolmak ve hatalı sonuçlar üretmek kolay olabilir.

  2. Oran oranları yerine regresyon tahminlerini raporlamayı seçerseniz, kodlama şemanızı raporunuzda netleştirin , böylece okuyucular, her ikisinin de 0,1 kodlandığını varsayarak kendi başına yanlış OR'ler üretmezler.

Temel görünebilir, ancak her iki sorunun da yayınlanan makalelere dönüştüğünü gördüm.


Öyleyse, bir veri dosyasını 6 ayrı duruma ayırmak ve her veri kümesinde kontrast kodlu öngörücülerle bireysel karşılaştırmalar yapmak uygun olur mu?
yukarı

Bu ikinci bit için ne istediğini dürüstçe bilmiyorum. Neyi başarmayı umduğunuzu belirtebilir misiniz?
Fomite

Konu koşulları içinde 3 ile 4 arasında bir veri setim var. Her etkiyi test etmek istiyorum, ancak tüm etkileşimlerle tek bir regresyon ilgilendiğim birçok bilgiyi kaçırıyor. Bunun yerine, verileri koşullara göre ayrı veri setlerine bölerim ve her veri setinde kontrastlı lojistik regresyonlar yürütürüm ilgilendiğim farklılıkları kodlayan kodlar.
upabove

kontrast kodlarını nasıl kodladığım hakkında daha fazla bilgi için buraya bakın: stats.stackexchange.com/questions/14546/…
upabove

11

Açıklık için: "ikili" terimi genellikle sadece 1'e 0 kodlamasına ayrılmıştır. Herhangi bir 2-değer kodlaması için daha genel bir kelime "ikilik" dir. İkili öngörücüler elbette lineer regresyon gibi lojistik regresyona açıktır ve sadece 2 değere sahip oldukları için bunları faktör olarak mı yoksa ortak değişken olarak mı girmeniz fark etmez.


5

Tahmincilerinizi 0-1 kodlarsanız yorumlamaya yardımcı olur, ancak bunun dışında (ve gerekli olmadığını belirterek), bununla ilgili yanlış bir şey yoktur. Başka (acil durum tablosu tabanlı) yaklaşımlar da vardır, ancak doğru hatırlarsam, bunlar lojistik regresyona (bir tür) eşdeğer olur.

Kısacası: Bunu yapmamak için hiçbir neden göremiyorum.


Teşekkürler! Ve eğer 3 kontrast kodlu tahmin edicim varsa ve hepsini 0-1 olarak kodlarsam, o zaman dik olamazlar. Örneğin 4 kategorim var ve üç kodum L1: 1, -1,0,0 L2: 0,1, -1,0, L3: 0,0,1, -1. bu bir sorun mu?
yukarı

Örnek L matrisiniz (L1, L2, L3), her kategorinin aşağıdaki kategoriyle karşılaştırıldığı tekrarlanan kontrastlardır . Ne bu kontrast belirleyiciler dikey, ne de ikili (0-1 olarak kodlanmış). Aslında, değerleri .75 vs -.25 (1. değişken), .5 vs -.5 (2. değişken), .25 vs -.75 (3. değişken)
ttnphns

3

Ek olarak, ikiden fazla yordayıcıya sahipseniz, lojistik veya çoklu regresyon için bile çoklu-eşzamanlılık problemi olması daha olasıdır. Bununla birlikte, tüm ikili değişkenlerle (yani kodlanmış (0,1)) lojistik regresyonu kullanmanın bir zararı yoktur.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.