Zaman etkisinin bireyler arasında fonksiyonel biçimde değiştiği boyuna verilerin modellenmesi


32

Bağlam :

200 katılımcıda 20 hafta boyunca haftada bir bağımlı değişken (DV) ölçen uzunlamasına bir çalışma yaptığınızı hayal edin. Genel olarak ilgilenmeme rağmen, düşünmeyi düşündüğüm tipik DV'ler işe alım sonrası iş performansını veya klinik psikoloji müdahalesini takiben çeşitli sağlık önlemlerini içeriyor.

Zaman ve DV arasındaki ilişkiyi modellemek için çok seviyeli modellemenin kullanılabileceğini biliyorum. Ayrıca katsayıların (örneğin, kesişme noktaları, eğimler vb.) Bireyler arasında değişmesine ve katılımcılar için belirli değerleri tahmin etmesine izin verebilirsiniz. Ancak, verileri görsel olarak incelerken zaman ile DV arasındaki ilişkinin aşağıdakilerden biri olduğunu görürseniz:

  • işlevsel biçimde farklı (belki bazıları doğrusal, bazıları üssel veya bazıları devamsızlık gösteriyor)
  • hata varyansında farklı (bazı bireyler bir zaman noktasından diğerine daha değişkendir)

Sorular :

  • Bu şekilde veri modelleme yaklaşımına iyi bir yol olabilir mi?
  • Özellikle, farklı ilişki türlerini tanımlamada ve bireyleri türlerine göre kategorize etmede hangi yaklaşımlar iyidir?
  • Bu tür analizler için R'de hangi uygulamalar var?
  • Bunun nasıl yapılacağına dair herhangi bir referans var mı: ders kitabı veya gerçek uygulama?

Yanıtlar:


20

Aşağıdaki üç yöne bakmanızı öneririm:

  • boyuna kümeleme : bu denetimsiz, ancak bölümlemenin kalitesini değerlendirmek için Calinsky kriterine dayanan k-aracı yaklaşımı kullanıyorsunuz (paket kml ve çevrimiçi yardımda yer alan referanslar); Bu nedenle, temel olarak, bireysel zaman süreci için özel bir şekil tanımlamaya yardımcı olmaz, ancak sadece homojen evrim profilini ayırın
  • Bir tür gizli büyüme eğrisi , heteroseksensellikten sorumludur: en iyi tahminim, MPlus yazılımı ile ilgili özellikle SSS ve postalama konusundaki kapsamlı referanslara bakmak olacaktır . Ben de rastgele etki çoklayıcı heteroscedastik model duydum (bu anahtar kelimeler etrafında googling deneyin). Bu makaleleri ( 1 , 2 ) ilginç buluyorum , ancak ayrıntılara bakmadım. Nöropsikolojik değerlendirme referansları ile ofisime geri döneceğim.
  • fonksiyonel PCA ( fpca paketi) ancak fonksiyonel veri analizine bakmaya değer olabilir

Diğer referanslar (sadece anında göz attı):


1
Teşekkürler. Bir kümeleme prosedürü kullanma fikri bana gelmişti. Zorluğun, bireysel düzeydeki olası eğri özelliklerini, teorik olarak anlamlı bir şekilde yeterince yakalamak ve ağırlıklandırmak olacağını düşünüyorum. Kml'de nasıl çalıştığını göreceğim.
Jeromy Anglim

1
Arayüz korkunç olmasına rağmen oldukça iyi çalışıyor (ve onu yapan adamı tanıyorum :) - İki ay önce klinik ölçümleri gelişimsel ölçümlere göre bireysel profillere göre ayırmak için kullandım (Brunet-Lézine).
chl

1
İşte FDA için başka bir birincil referans: psych.mcgill.ca/misc/fda
Mike Lawrence

1
Bu girişi Ramsay (2008) tarafından FDA bağlantısına, özellikle erişilebilir gbi.agrsci.dk/~shd/public/FDA2008/FDA_Sage.pdf
Jeromy Anglim


6

Bana öyle geliyor ki, Büyüme Karışımı Modelleri hata farkınızı incelemenize izin verme potansiyeline sahip olabilir. ( Burada PDF ). (Çarpımsal heteroscedastik modellerin ne olduğundan emin değilim, ama kesinlikle onları kontrol etmek zorunda kalacağım).

Gizli grup tabanlı yörünge modelleri son zamanlarda kriminolojide oldukça popüler hale geldi. Ancak birçok kişi, grupların gerçekten var olduğunu kabul ediyor ve bazı akıllı araştırmalar , grupları rastgele verilerde bile bulacağınıza işaret ediyor. Ayrıca Nagin’in grup temelli modelleme yaklaşımının hatalarınızı değerlendirmenize izin vermediğini de belirtmek gerekir (ve dürüst olmak gerekirse, hiçbir zaman süreksizlik gibi görünecek bir model görmedim).

20 zaman noktasıyla zor olsa da, keşif amaçlı amaçlar için kalıpları tanımlamak için basit buluşsal buluş oluşturmak yararlı olabilir (örneğin her zaman düşük veya her zaman yüksek, varyasyon katsayısı). Bir elektronik çizelgede ya da paralel koordinat parsellerinde kıvılcımlar tasarlıyorum ancak onların yardımcı olacağından şüpheliyim (dürüst olmak gerekirse, hiç aydınlatıcı bir paralel koordinat grafiği görmedim).

İyi şanslar


@ chl, Sorun değil, Burada listelediğiniz tüm kaynaklar için teşekkür ederiz.
Andy W

Gizli gruplar hakkında iyi nokta. Gizli sınıf ve küme analizi uygulamalarının, düşük ve yüksek gibi sadece sürekli değişken int kategorileri oluşturduğu görülüyor ( jeromyanglim.blogspot.com/2009/09/… ). Bununla birlikte, görsel olarak kategorik olarak farklı veri üretme süreçlerinden (örn. Her zaman yüksek, her zaman düşük, kademeli artan, düşük sonra ani artış vb.) Geliyor gibi görünen ve bazı kategorilerde boyuna verilerim var. parametrelerin daha sürekli değişmesi var.
Jeromy Anglim

@Jeromy, bahsettiğim çalışmanın insanları gizli grupları tanımlamak için bu tür yöntemleri kullanma konusunda cesaretlendireceğini sanmıyorum. Çalışmanın amacı, bu tür yöntemleri yalnızca grupların varlığını ortaya çıkarmak için kullanamayacağınızdır, çünkü rasgele verilerde bile her zaman grupları bulacaksınız. Bulduğunuz bu grupların gerçek olup olmadığı ya da sadece yöntemin eseri olup olmadığı daha öznel bir yorumdur. Bu tür süreçleri oluşturan bazı mantıksal teorileri tanımlayabilir ve ardından tanımlanan grupların bu teorilere uygun olup olmadığını görebilirsiniz.
Andy W

5

Bu soruyu sorduktan dört yıl sonra birkaç şey öğrendim, bu yüzden belki birkaç fikir eklemeliyim.

Bayesian hiyerarşik modellemesinin bu soruna esnek bir yaklaşım getirdiğini düşünüyorum.

Yazılım : Jag, stan, WinBugs vb. Gibi araçlar, ilgili R arabirim paketleri (örneğin, rjags, rstan) gibi potansiyel olarak bir araya getirildiğinde, bu tür modellerin belirlenmesini kolaylaştırır.

Kişi hatası içindeki değişkenlik: Bayesian modelleri, kişi içi hata varyansını insanlar arasında değişen rastgele bir faktör olarak tanımlamayı kolaylaştırır.

yben=1,...,nj=1,...J

ybenj~N-(μben,σben2)
μben=γ
γ~N-(μγ,σγ2)
σben~G,birmmbir(α,β)

Dolayısıyla, her bireyin standart sapması bir gama dağılımı olarak modellenebilir. Bunun, insanların zaman içinde ne kadar değiştiğine göre değiştiği birçok psikolojik alanda önemli bir parametre olduğunu buldum.

Gizli eğri sınıfları: Bu fikri henüz henüz araştırmamıştım, ancak her birey için iki veya daha fazla olası veri üretme işlevi belirtmek ve sonra Bayesian modelinin belirli bir birey için en olası modeli seçmesine izin vermek oldukça kolay. Böylece, her birey için tipik olarak hangi fonksiyonel formun birey verilerini tanımladığına dair arka olasılıklar elde edilir.

Bir model için bir fikir taslağı olarak, aşağıdaki gibi bir şeye sahip olabilirsiniz:

ybenj~N-(μbenj,σ2)
μbenj=γbenλbenj(1)+(1-γben)λbenj(2)
λbenj(1)=θ1ben(1)+θ2ben(1)exp(-θ3ben(1))
λbenj(2)=θ1ben(2)+θ2ben(2)xbenj+θ3ben(2)xbenj2
γben=BernOullben(πben)

xbenjλbenj(1)λbenj(2)πbenλbenj(1)


Ayrıca Bayesian çerçevesine geçiyorum ve belirsiz fonksiyon formlarının zaman serisi analizi için Gauss İşlemlerini kullanmayı okudum. Hiyerarşik veri vakasına nasıl uygulanabileceği hala belirsiz (bkz: cevapsız sorgum burada: groups.google.com/d/msg/stan-users/yjDWtMhxQQE/2TiYevy0ZwUJ )
Mike Lawrence

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.