Gecikme efekti eklemek neden Bayes hiyerarşik modelinde ortalama sapmayı artırır?


14

Arka plan: Şu anda çeşitli Bayes hiyerarşik modellerini karşılaştırarak bazı çalışmalar yapıyorum. verileri , katılımcı ve zaman için sayısal refah ölçüleridir . Katılımcı başına yaklaşık 1000 katılımcım ve 5 ila 10 gözlemim var. i jyijij

Çoğu boyuna veri kümesinde olduğu gibi, zamana daha yakın olan gözlemlerin birbirinden ayrı olanlardan daha büyük bir korelasyona sahip olduğu bir tür otomatik korelasyon görmeyi bekliyorum. Birkaç şeyi basitleştiren temel model aşağıdaki gibidir:

yijN(μij,σ2)

nerede bir gecikme modeli karşılaştırıyorum:

μij=β0i

bir gecikme modeli ile:

μij=β0i+β1(yi(j1)β0i)

burada kişi düzeyinde bir ortalama ve gecikme parametresidir (yani gecikme etkisi, gözlemin bir önceki zaman noktasından o zaman noktasının tahmin edilen değerinden sapmasının ). Ayrıca ı tahmin etmek için birkaç şey yapmak zorunda kaldım (yani, ilk gözlemden önce gözlem). β 1 y i 0β0iβ1yi0

Aldığım sonuçlar şunu gösteriyor:

  • Gecikme parametresi .18,% 95 CI [.14, .21] civarındadır. Yani, sıfır değil
  • Gecikme modele dahil edildiğinde ortalama sapma ve DIC birkaç yüz artar
  • Posterior öngörü kontrolleri, gecikme etkisi dahil edilerek modelin verilerdeki otomatik korelasyonu daha iyi kurtarabildiğini göstermektedir.

Özetle, sıfır olmayan gecikme parametresi ve arka kestirimsel kontroller gecikme modelinin daha iyi olduğunu göstermektedir; ancak ortalama sapma ve DIC, gecikme olmayan modelin daha iyi olduğunu göstermektedir. Bu beni şaşırtıyor.

Genel deneyimim, yararlı bir parametre eklerseniz, en azından ortalama sapmayı azaltması gerektiğidir (bir karmaşıklık cezasından sonra DIC iyileştirilmemiş olsa bile). Ayrıca, gecikme parametresi için sıfır değeri, gecikme olmayan modelle aynı sapmayı elde edecektir.

Soru

Gecikme efekti eklemek, gecikme parametresi sıfır olmasa ve posterior kestirimsel kontrolleri iyileştirdiğinde bile Bayes hiyerarşik modelinde ortalama sapmayı artırabilir mi?

İlk düşünceler

  • Ben bir çok yakınsama kontrolleri yaptım (örneğin, traceplots bakarak; zincirler ve koşular arasında sapma sonuçlarındaki değişimi incelemek) ve her iki model de posteriorda yakınsak gibi görünüyor.
  • Ben lag etkisi sıfır olmaya zorladı nerede bir kod kontrolü yaptım, ve bu hiçbir gecikme modeli sapmalar kurtardı.
  • Ayrıca, ortalama sapma eksi beklenen değerlerde sapma vermesi gereken cezaya baktım ve bunlar da gecikme modelinin daha kötü görünmesine neden oldu.
  • Belki de gecikme etkisi, kişi başına etkili gözlem sayısını azaltır, bu da sapmayı artıran kişi düzeyi araçlarını ( ) tahmin etme kesinliğini azaltır .β0i
  • Belki de ilk gözlemden önce ima edilen zaman noktasını nasıl tahmin ettiğimle ilgili bir sorun var.
  • Belki de gecikme etkisi bu verilerde zayıftır
  • Ben kullanarak maksimum liklihood kullanarak modeli tahmin çalıştı lmeile correlation=corAR1(). Gecikme parametresinin tahmini çok benzerdi. Bu durumda, gecikme modeli, gecikme olmadan birinden daha büyük bir log olasılığına ve daha küçük bir AIC'ye (yaklaşık 100 kadar) sahipti (yani, gecikme modelinin daha iyi olduğunu öne sürdü). Böylece bu, gecikmeyi eklemenin Bayesci modeldeki sapmayı da azaltması gerektiği fikrini güçlendirdi.
  • Belki Bayes kalıntıları hakkında özel bir şey vardır. Gecikme modeli, önceki zaman noktasında öngörülen ve gerçek y arasındaki farkı kullanırsa, bu miktar belirsiz olacaktır. Böylece, gecikme etkisi bu tür artık değerlerin güvenilir bir aralığı boyunca çalışacaktır.

Lag parametresinin .18 civarında olduğunu söylüyorsunuz. Lag parametresini öğrendin mi? Cevabınız evet ise, daha önce ne kullandınız?
Zirve

Lag parametresinde -.6 ila .6 arasında eşit bir ünite kullandım. y0 [i] çizildiN(β0i,σ2)

Yanıtlar:


1

İşte düşüncelerim:

  • DIC, BIC, AIC yerine, eğer karşılayabiliyorsanız , marjinal olasılıkla ( kanıt olarak da bilinir ) doğrudan çalışmanızı öneririm . Kanıt ne kadar büyük olursa , model sınıfınız o kadar olasıdır. Büyük bir fark yaratmayabilir, ancak DIC, BIC, AIC sonuçta sadece yaklaşık değerlerdir.
  • 0.18
  • Bir adım daha ileri gidelim: Gecikme etkisini (c) dikkate almayan modeli alın ve marjinal olasılığını hesaplayın . Ardından, lag efektini içeren ve lag parametresinde bir önceliği olan model sınıfınızı (d) alın; (d) ' nin marjinal olasılığını hesaplar . (D) 'nin daha büyük bir marjinal olasılığa sahip olmasını beklersiniz . Ne yani, eğer yapmazsan ?:

    (1) Marjinal olasılık model sınıfını bir bütün olarak değerlendirir. Bu, gecikme etkisini, parametre sayısını, olasılığını, önceliği içerir.

    (2) Ek parametrelerin öncesinde önemli bir belirsizlik varsa, farklı sayıda parametreye sahip modellerin karşılaştırılması her zaman hassastır.

    (3) Gecikme parametrenizden önceki belirsizliği makul derecede büyük olarak belirtirseniz, tüm model sınıfını cezalandırırsınız.

    (4) Negatif gecikmeler ve pozitif gecikme için eşit olasılıkları destekleyen bilgiler nedir? Olumsuz bir gecikmeyi gözlemlemenin pek olası olmadığına inanıyorum ve bu daha önce dahil edilmelidir.

    (5) Gecikme parametrenizi seçmenizden önce eşittir. Bu genellikle asla iyi bir seçim değildir: Parametrelerinizin belirtilen sınırların içinde olması gerektiğinden kesinlikle emin misiniz? Sınırlar içindeki her bir gecikme değeri gerçekten eşit olasılığa sahip mi? Benim önerim: bir beta dağıtımı ile (gecikmenin sınırlı olduğundan eminseniz veya sıfırdan küçük değerleri hariç tutabiliyorsanız log-normal ile gidin .

    (6) Bu, bilgilendirici olmayan önceliklerin kullanımının iyi olmadığı özel bir örnektir ( marjinal olasılığa bakarak ): Her zaman daha az sayıda belirsiz parametreye sahip olan modeli tercih edersiniz; daha fazla parametreye sahip modelin ne kadar iyi veya kötü yapabileceği önemli değildir.

Umarım düşüncelerim sana yeni fikirler verir, ipuçları ?!


İpuçları için teşekkürler. Sadece şeyleri yuvarlamak için, lag parametresini posterior (yani 0.18) ortalamasına sahip olmak için kısıtlamaya çalıştım. Gecikmesiz model hala daha küçük ortalama sapmaya sahipti.
Jeromy Anglim
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.