Koğuşta olan hasta sayısıyla şiddet testi ilişkisinin oluşumunu açıklayan iki yıllık veri

Temelde şöyle görünen iki yıllık verilerim var:

Tarih _ __ Şiddet E / H? _ Hasta sayısı

1/1/2008 _ ___ 0 __ _ __ _ ____ 11

01.02.2008 _ __ _ 0 _ __ _ __ _ __ 11

1/1/2008 _ ____ 1 __ _ __ _ ____ 12

01.04.2008 _ ____ 0 __ _ __ _ ____ 12

...

31/12 / 2009_ _ __ 0_ _ __ _ __ _ __ 14

yani o gün şiddet olayı olup olmadığını (1 evet, 0 hayır) ve aynı zamanda koğuştaki hasta sayısını gösteren bir psikiyatri koğuşuna günde bir kez olmak üzere iki yıllık gözlem. Test etmek istediğimiz hipotez, koğuştaki daha fazla hastanın koğuşta artan şiddet olasılığı ile ilişkili olduğudur.

Tabii ki, koğuşta daha fazla hasta olduğunda şiddetin daha olası olduğu için ayarlamamız gerekeceğinin farkındayız çünkü bunlardan sadece daha fazlası var - her bireyin şiddet olasılığının yükselip yükselmediği ile ilgileniyoruz koğuşta daha fazla hasta var.

Sadece lojistik regresyon kullanan birkaç makale gördüm, ancak bunun yanlış olduğunu düşünüyorum çünkü otoregresif bir yapı var (otokorelasyon fonksiyonuna bakarken, herhangi bir gecikmede .1'in üzerine çıkmıyor, ancak bu, R'nin benim için çizdiği “önemli” mavi kesikli çizgi).

Sadece işleri daha karmaşık hale getirmek için, sonuçları bireysel hastalara bölmek istersem, bu yüzden veriler tıpkı yukarıdaki gibi görünecektir, ancak her hasta için veriye sahip olacağım, 1/1/2008, 2 / 1/2008 vb. Ve bir kimlik kodu tarafa iner, böylece veriler her hasta için tüm olay geçmişini ayrı ayrı gösterir (tüm hastalar tüm gün boyunca mevcut olmasa da, bunun önemli olup olmadığından emin değildir).

Her hastadaki otoregresif yapıyı modellemek için R'de lme4 kullanmak istiyorum, ancak bazı Google'lar “lme4 otoregresif yapılarla başa çıkmak için ayarlanmamış” teklifiyle geliyor. Olsa bile, nasıl zaten kod yazmak kavramak emin değilim.

Herkesin fark etmesi durumunda, bir süre önce böyle bir soru sordum, farklı problemlere sahip farklı veri kümeleridir, ancak aslında bu sorunu çözmek bu konuda yardımcı olacaktır (biri daha önce karışık yöntemler kullanmamı önerdi, ancak bu otoregresyon şey beni nasıl yapılacağından emin değilseniz).

Dürüst olmak için biraz takılıp kayboldum. Herhangi bir yardım minnetle aldı!

r mixed-model autocorrelation panel-data

— Chris Beeley
kaynak

Benzer bir sorunla uğraşıyorum, sanırım plm paketinden kullanabilirsiniz pgmm, ancak yanıt değişkeniniz ikili olduğu için tam olarak nasıl yapılacağını bilmiyorum. Belki başkaları detaylandırabilir ... (Ve evet haklısın: Anladığım şey, içsel bir değişkeniniz olduğunda, bu durumda gecikmiş değer, tahmin etmek için REML'yi kullanamazsınız, bu yüzden GMM'yi kullanmanız gerekir .)

— teucer

İşte ikili bağımlı değişkeninizi sürekli, gözlemlenmeyen bir değişkene bağlayan bir fikir; sürekli değişkenler için zaman serisi modellerinin gücünden yararlanmanızı sağlayacak bir bağlantı.

Tanımlamak:

$V_{w,t} = 1$ $w$ $t$

$P_{w,t}$ $w$ $t$

$P_{w,t}$

$V_{w,t} = \begin{cases} 1 & \mbox{if } P_{w,t} \ge \tau \\ 0 & \mbox{otherwise} \end{cases}$

nerede,

$\tau$

$P_{w,t}$ $P_{w,t}$

$P_{w,t} = \alpha_0 + \alpha_1 P_{w,t-1} + ... + \alpha_p P_{w,t-p}+ \beta n_{w,t} + \epsilon_t$

nerede,

$n_{w,t}$ $w$ $t$

$\beta$

$P_{w,t}$