Bir etkinlikte bağımsız değişken olarak harcanan zaman


14

Doğrusal bir modelde bağımsız değişken olarak bir şey (örneğin, emzirme haftaları) yapmak için harcanan zamanı dahil etmek istiyorum. Bununla birlikte, bazı gözlemler davranışla hiç ilgilenmez. Onları 0 olarak kodlamak gerçekten doğru değildir, çünkü 0 niteliksel olarak> 0'dan herhangi bir değerden farklıdır (yani emzirmeyen kadınlar, çok uzun süre yapmayanlar bile, kadınlardan çok farklı olabilir). Gelebileceğim en iyi şey, harcanan zamanı kategorize eden bir dizi aptallıktır, ancak bu değerli bilgi kaybıdır. Sıfır şişirilmiş Poisson gibi bir şey de bir olasılık gibi görünüyor, ancak bu bağlamda bunun nasıl görüneceğini tam olarak anlayamıyorum. Kimsenin önerisi var mı?

Yanıtlar:


16

@ Ken-butler cevabını biraz genişletmek için. Özel bir değer için hem sürekli değişken (saat) hem de gösterge değişkeni ekleyerek (saat = 0 veya emzirmeyen), "özel olmayan" değer için doğrusal bir etki ve özel değerde öngörülen sonuç. (En azından benim için) bir grafiğe bakmak yardımcı olur. Aşağıdaki örnekte, saatlik ücreti haftada saatlerin bir fonksiyonu olarak modelliyoruz (tüm kadınlar) haftada 40 saat "standart" hakkında özel bir şey olduğunu düşünüyoruz:

resim açıklamasını buraya girin

Bu grafiği üreten kodu (Stata'da) şu adreste bulabilirsiniz: http://www.stata.com/statalist/archive/2013-03/msg00088.html

Bu durumda, diğer değişkenlerden farklı bir şekilde ele alınmasını istesek de, sürekli değişkene 40 değeri verdik. Benzer şekilde, diğer değerlerden niteliksel olarak farklı olduğunu düşünseniz bile, haftalarınıza 0 değerini emzirirsiniz. Aşağıda yorumunuzu, bunun bir sorun olduğunu düşündüğünüzü yorumluyorum. Bu geçerli değildir ve bir etkileşim terimi eklemenize gerek yoktur. Aslında, denediyseniz, mükemmel uyumluluk nedeniyle bu etkileşim terimi kaldırılacaktır. Bu bir sınırlama değildir, yalnızca etkileşim koşullarının yeni bilgi eklemediğini söyler.

Diyelim ki regresyon denkleminiz şöyle:

y^=β1weeks_breastfeeding+β2non_breastfeeding+

Eğer , emziren hafta sayısı (emzirmeyenler için 0 değeri dahil) ve biri, emzirmediğinde 1, aksi takdirde 0 olan bir gösterge değişkenidir.weeks_breastfeedingnon_breastfeeding

Birisi emzirirken ne olacağını düşünün. Regresyon denklemi aşağıdakileri basitleştirir:

y^=β1weeks_breastfeeding+β20+=β1weeks_breastfeeding+

Bu nedenle , için emzirme haftalarının sadece doğrusal bir etkisidir.β1

Birisi emzirmediğinde ne olduğunu düşünün:

y^=β10+β21+=β2+

Yani size etkisini ve emzirmenin kaç hafta denklemden düştüğünü gösterir.β2

Bir etkileşim terimi eklemenin bir faydası olmadığını görebilirsiniz, çünkü o etkileşim terimi zaten (dolaylı olarak) oradadır.

Bununla birlikte , hakkında garip bir şey var, çünkü emzirmeyenlerin emziren ancak sadece 0 hafta olanların beklenen sonuçlarını karşılaştırarak emzirmenin etkisini ölçüyor ... gibi "yol" gibi, ama pratik kullanışlılık hemen belli değil. "Emzirmeyenleri" 12 hafta (yaklaşık 3 ay) emziren kadınlarla karşılaştırmak daha anlamlı olabilir. Bu durumda "emzirmeyenlere" için 12 değerini . Dolayısıyla, "emzirmeyenler" için değer regresyon katsayısını etkiler w e e k s _ b r e a s t f e e d i n g w e e k s _ b r e a s t f e e d i n g β 2β2weeks_breastfeedingweeks_breastfeedingβ2"emzirmeyenlerin" kiminle karşılaştırıldığını belirlemesi anlamındadır. Bir sorun yerine, bu aslında oldukça yararlı olabilecek bir şeydir.


1
Cevabı (ve diğerlerini) takdir ediyorum, ama kabul etmekte zorlanıyorum. 1: 0 ve sürekli zaman değişkenini dahil edersem, hala emzirmeyenlere zaman için bir değer atamam gerekir (veya eksik bir ortak değişken için düşerler). 1: 0 değişkeni için koşullu olsa bile, time = 0 olarak emzirmeyen besleyicilerin dahil edilmesinin regresyon katsayısını nasıl etkilemediğini görmüyorum. Belki de ikisi arasında ürün etkileşimi terimini eklemek daha anlamlı olur?
DL Dahly

@DLDahly Bu şüphelerle başa çıkmak için cevabımı düzenledim
Maarten Buis

Tamam, bu çok yardımcı oldu. Bir hızlı takip daha sormama izin verin ... eğer sizi doğru anlıyorsam, o zaman B2 = 1 kişiye ne zaman değeri verdiğimden bağımsız olarak B1 için tahmin edilen değer aynı olmalıdır. Bu doğru mu?
DL Dahly

1
Çok güzel cevap Maarten. Burada, yalnızca belirli bir alt grupla ilgili olan bağımsız bir değişkenin dahil edilmesinde benzer bir durumu gösteren benzer bir soru / cevap bulunmaktadır .
Andy W

1
@ GavinM.Jones Asla adlandırma ya da bunu belirtme ihtiyacını hiç düşünmedim: bu sadece sürekli ve gösterge değişkenlerinin basit bir uygulamasıdır. Sonuç olarak sizin için iyi bir referansım yok. Hızlı bir şekilde kazabileceğim en yakın şey Treiman, DJ (2009): Nicel Veri Analizi. Fikirleri Test Etmek İçin Sosyal Araştırmalar Yapmak. San Francisco: Jossey-Bass. , bölüm 7'de benzer bir şey tartışıldı. Model bir sabit içerir.
Maarten Buis

6

Basit bir şey: değişkeninizi herhangi bir / hiçbiri için 1/0 göstergesiyle ve gerçek değerle temsil edin. Her ikisini de regresyona sokun.


4

Herhangi bir zaman harcanan (= 1) ve harcanan zaman yok (= 0) için bir ikili gösterge koyarsanız ve sürekli bir değişken olarak harcanan zaman miktarınız varsa, "0" süresinin farklı etkisi " 0-1 göstergesi tarafından alındı ​​"


2

Sıfır zamana karşı 0 zamana dayalı bir gruplama ile karma efektli modelleri kullanabilir ve bağımsız değişkeninizi koruyabilirsiniz


Bunu biraz genişletebilir misiniz? Çok teşekkürler.
DL Dahly

karışık efektler modeli, verileri açıklayıcı ve bağımlı değişkenler arasında (kesişim veya kesişim ve eğim / katsayı açısından) farklı bir ilişkiye sahip olabileceğimiz farklı (heterojen) kovalara ayıran bir faktör olduğunu varsayar. en.wikipedia.org/wiki/Mixed_model
rezakhorshidi

Peki, emzirme durumunda yuvalanmış bireyler kullanın ve daha sonra haftalar emzirirken rastgele bir eğim mi? Bunu yeterince kolay bir SEM olarak yapabilirim ve bazı kısıtlamaları test edebilirim. Teşekkürler +1
DL Dahly

1

Rastgele Orman veya Sinir Ağı kullanıyorsanız, bu sayıyı 0 olarak koymak tamamdır, çünkü 0'ın diğer değerlerden (aslında farklıysa) belirgin bir şekilde farklı olduğunu anlayabileceklerdir. Diğer bir yol ise zaman değişkenine ek olarak evet / hayır kategorik bir değişkenin eklenmesidir.

Ama sonuçta, bu özel durumda gerçek bir sorun görmüyorum - 0.1 haftalık emzirme 0'a yakın ve etki çok benzer olacak, bu yüzden 0, bir şey olarak göze çarpmayan 0 ile oldukça sürekli bir değişken gibi görünüyor tat.


3
İlk paragraf için +1 ancak sosyal bilim veya tıbbi verilerle uğraşan, 0 ile 0.1 haftalık bir şeyin etkisi ana endişe değildir. Mesele şu ki, emzirmeyi denemeyen veya rapor etmeyen kadınlar, başka birçok açıdan (sağlık sorunları, gelir, aile durumu, işten uzak kalma yeteneği, sağlık hizmetlerine erişim, hakkında bilgi edindikleri) sistematik olarak farklı olabilirler. Bu kadınların emzirmeyi deneyen ve çabucak durduran annelere çok benzediğine inanmak için gerçekten hiçbir neden yoktur.
Gala

1
İstatistiksel bir bakış açısından, bu diğer değişkenleri modelinize açıkça koymak daha iyi olacaktır, ancak 0'da özel bir şey olmadığını varsayarak dikkatli olmak mantıklıdır.
Gala

0

Tobit modeli istediğin şey, sanırım.


5
Tobits, sonuç bir eşiğin üstünde veya altında sansürlendiğinde kullanılır. Örneğin, asgari ücretin altında herhangi bir ücret veya üst kodlanmış bir değerin üzerinde gelir gözlemlemiyoruz. Bu uygulama bağımsız bir değişken içindir.
Dimitriy V. Masterov
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.