Tıbbi bir kitle için güvenilir aralıklar nasıl özetlenir


21

Stan ve frontend paketleriyle rstanarmveya brmsBayesian yolunu daha önce yaptığım gibi kolayca analiz edebilirim lme. Masamda Kruschke-Gelman-Wagenmakers-vb. Tarafından yazılan kitapların ve makalelerin çoğuna sahip olmama rağmen, bunlar bana Bayesian'ın Skylla'sı ile tıbbi gözden geçirenlerin Charybdisleri arasında parçalanmış bir tıbbi izleyici için sonuçları nasıl özetleyeceğimi söylemiyor. "Biz o dağınık şeyleri değil anlamlar istiyoruz").

Bir örnek: Gastrik frekans (1 / dak) üç grupta ölçülür; sağlıklı kontroller referanstır. Her katılımcı için birkaç ölçüm vardır, bu yüzden sık sık aşağıdaki karışık modeli kullandım lme:

summary(lme(freq_min~ group, random = ~1|study_id, data = mo))

Biraz düzenlenmiş sonuçlar:

Fixed effects: freq_min ~ group 
                   Value Std.Error DF t-value p-value
(Intercept)        2.712    0.0804 70    33.7  0.0000
groupno_symptoms   0.353    0.1180 27     3.0  0.0058
groupwith_symptoms 0.195    0.1174 27     1.7  0.1086

Basitlik için, 2 * std hatasını% 95 CI olarak kullanacağım.

Sıkça yapılan bağlamda, bunu şöyle özetledim:

  • Kontrol grubunda tahmini frekans 2.7 / dak idi (belki buraya CI ekleyin, ancak mutlak ve fark CI tarafından yaratılan karışıklık nedeniyle bazen bundan kaçınırım).
  • No_semptomlar grubunda, frekans 0.4 / dakika, CI (0.11 ila 0.59) / dakika, p = 0.006, kontrolden daha yüksekti.
  • With_symptoms grubunda, frekans 0.2 / dakika, CI (-0.04 ila 0.4) / dakika, p = 0.11 kontrolden daha yüksekti.

Bu, bir tıbbi yayın için kabul edilebilir maksimum karmaşıklık ile ilgilidir, inceleme yapan kişi muhtemelen ikinci durumda "anlamlı değil" eklememi isteyecektir.

İşte aynı stan_lmerve varsayılan öncelikler.

freq_stan = stan_lmer(freq_min~ group + (1|study_id), data = mo)


           contrast lower_CredI frequency upper_CredI
        (Intercept)     2.58322     2.714       2.846
   groupno_symptoms     0.15579     0.346       0.535
 groupwith_symptoms    -0.00382     0.188       0.384

CredI% 90 güvenilir aralıklardır (% 90'ın neden varsayılan olarak kullanıldığını belirten skeç çubuğuna bakın).

Sorular:

  • Yukarıdaki özeti Bayes dünyasına nasıl çevirebilirim?
  • Ön tartışma ne ölçüde gereklidir? Önceden bahsettiğimde, kağıdın olağan "öznel varsayım" ile geri geleceğinden eminim; ya da en azından "teknik tartışma yok, lütfen". Ancak tüm Bayes makamları, yorumun yalnızca öncelikler bağlamında geçerli olmasını talep etmektedir.
  • Bayes kavramlarına ihanet etmeden formülasyonda nasıl bir "önem" vekili sunabilirim? "Güvenilir bir şekilde farklı" (uuuh ...) ya da neredeyse güvenilir bir şekilde farklı (buoha ... gibi, "ağzına kadar").

Jonah Gabry ve Ben Goodrich (2016). rstanarm: Stan ile Bayes Uygulamalı Regresyon Modellemesi. R paket sürümü 2.9.0-3. https://CRAN.R-project.org/package=rstanarm

Stan Geliştirme Ekibi (2015). Stan: Olasılık ve Örnekleme için bir C ++ Kütüphanesi, Sürüm 2.8.0. URL http://mc-stan.org/ .

Paul-Christian Buerkner (2016). brms: Stan kullanan Bayes Regresyon Modelleri. R paket sürümü 0.8.0. https://CRAN.R-project.org/package=brms

Pinheiro J, Bates D, DebRoy S, Sarkar D ve R Core Team (2016). nlme: Doğrusal ve Doğrusal Olmayan Karışık Efekt Modelleri . R paket sürümü 3.1-124, http://CRAN.R-project.org/package=nlme>.


1
Tıbbi dergilerin yorumcuları / editörleri ile ilgili hiçbir deneyimim yok, ama belki de kesişmenin negatif olma olasılığı, "belirtisiz" kukla değişken katsayısının negatif olma olasılığı ve yaklaşık% 5 olasılık olduğunu söyleyebilirsiniz. "semptomlu" kukla değişken üzerindeki katsayı negatiftir. Yaparak yaklaşık% 5 daha hassas bir şekilde ölçebilirsiniz mean(as.matrix(freq_stan)[,"groupwith_symptoms"] < 0).
Ben Goodrich

Bunu düşündük ve% 5'i Tamam gibiydi; araştırmacılar bunu "anlamlılığa" çevirecekler, ancak normalde önemi yanlış anladıkları için, çift olumsuzlama ile haklı olacaklar. "Sıfır olasılık" ise bir katildir: bunu kabul eder misiniz? Belki <1 / Reff (p <0.001) bir yaklaşım olabilir? Ama yine: p <xxx yazdığımda dünya için önem kazanıyorum.
Dieter Menne

Yukarıdaki n_eff değerine düzelt.
Dieter Menne

1
Ben şahsen bir kuyruk olasılığını "n_eff şansında 1'den az" olarak nitelendirmiyorum çünkü n_eff, ortalamanın tahmin edildiği hassasiyetle ilgilidir. Belki de zincirlerinizi, katsayı için 1 negatif çekiş elde edecek kadar uzun süre çalıştırabilir group_nosymptomsve sonra negatif olma olasılığının olduğunu söyleyebilirsiniz 1 / draws. Ancak kesişme için, zincir bu veriler için asla negatif bölgeye gitmeyecek, bu yüzden olasılıkın daha az olduğunu söyleyebilirsiniz 1 / draws.
Ben Goodrich

Bir alan adı uzmanı için p-değerlerinin dahil edilmesiyle ilgili bazı iyi tavsiyeler aldım, ancak burada istatistiksel uzman inceleyici değil: stats.stackexchange.com/questions/148649/… . P = 0 olduğunda muhafazakar bir üst sınır olarak p <minimum (tüm parametrelerin n_eff) değerini kullandık.
stijn

Yanıtlar:


16

Hızlı düşünceler:

1) Kilit konu, kitleniz için uyguladığınız uygulamalı sorudur, çünkü bu istatistiksel analizinizden hangi bilgileri istediğinizi belirler. Bu durumda, bana göre, gruplar arasındaki farklılıkların büyüklüğünü (ya da belki de kitlenize daha tanıdık olan ölçüt ise grupların oranlarının büyüklüğünü) tahmin etmek istiyorsunuz. Farklılıkların büyüklüğü doğrudan soruda sunduğunuz analizlerle sağlanmaz. Ancak Bayesian analizinden istediğinizi elde etmek kolaydır: farklılıkların (veya oranların) posterior dağılımını istiyorsunuz. Ardından, farklılıkların (veya oranların) posterior dağılımından, aşağıdaki gibi doğrudan bir olasılık ifadesi yapabilirsiniz:

"% 95 en güvenilir farklar [düşük% 95 HDI limiti] ve [yüksek% 95 HDI limiti] arasındadır" (burada% 95 en yüksek yoğunluk aralığı [HDI] güvenilir aralık olarak kullanıyorum ve bunlar 'en güvenilir' olarak verilen en yüksek yoğunluk parametre değerlerini tanımlayın)

Bir tıp dergisi kitlesi bu ifadeyi sezgisel ve doğru bir şekilde anlayacaktır, çünkü izleyicinin tipik olarak düşündüğü şey, sık sık güven aralığının anlamıdır (bu sık sık güven aralığı anlamına gelmese de).

Stan veya JAGS arasındaki farkları (veya oranları) nasıl elde edersiniz? Sadece tamamlanmış MCMC zincirinin sonradan işlenmesi ile. Zincirdeki her adımda, ilgili farkları (veya oranları) hesaplayın, sonra farkların (veya oranların) posterior dağılımını inceleyin. Örnekler, MCMC için DBDA2E https://sites.google.com/site/doingbayesiandataanalysis/ genel olarak Şekil 7.9 (s. 177), Şekil 8.6'daki JAGS (s. 211) ve Bölüm 16.3 (p. 468), vb!

2) Geleneğe göre, sıfır farkının reddedilip reddedilmediği hakkında bir açıklama yapmaya mecbur kalırsanız, iki Bayesian seçeneğiniz vardır.

2A) Seçeneklerden biri, sıfıra yakın aralıklarla ve bunların İGE ile ilişkilerine dair olasılık ifadeleri yapmaktır. Bunun için, sıfır civarında pratik bir denklik bölgesi (ROPE) kurdunuz. Bu sınırların belirlenmesi, örneğin klinik yetersizlik testinde rutin olarak yapılır. Alanınızda bir 'efekt boyutu' ölçüsü varsa, 'küçük' efekt boyutu için kurallar olabilir ve HALAT sınırları küçük bir etkinin yarısı olabilir. Ardından, aşağıdakiler gibi doğrudan olasılık ifadeleri yapabilirsiniz:

"Farklılıkların posterior dağılımının sadece% 1.2'si pratik olarak sıfıra eşittir"

ve

"% 95 en güvenilir farklılıkların hepsi pratikte sıfıra eşdeğer değildir (yani,% 95 HDI ve ROPE çakışmaz) ve bu nedenle sıfırı reddediyoruz." (olasılık dağılımını posterior dağılımdan, bu ifadeye dayanan müteakip karara karşı farkına dikkat edin)

Ayrıca,% 95'lik en güvenilir değerlerin hepsi pratikte eşdeğerse sıfır olmak üzere, pratik amaçlar için sıfır farkını da kabul edebilirsiniz.

2B) İkinci bir Bayes seçeneği, Bayes null hipotez testidir. (Not Yukarıdaki yöntem olduğu değil"hipotez testi" olarak adlandırılır!) Bayesci null hipotez testi, farkın bazı yaygın olasılıklar olabileceğini varsayan bir önceki dağılımın sadece sıfır olabileceğini varsayan bir önceki dağılımın Bayes modeli karşılaştırmasını yapar. Böyle bir model karşılaştırmasının sonucu (genellikle) özellikle alternatif dağıtım seçimine çok bağlıdır ve bu nedenle daha önce alternatif seçim için dikkatli bir gerekçe yapılmalıdır. Model karşılaştırmasının gerçekten anlamlı olması için hem sıfır hem de alternatif için en azından en az düzeyde bilgilendirilmiş öncelikler kullanmak en iyisidir. Model karşılaştırmasının farklı bir soruyu ele aldığı için model karşılaştırmasının gruplar arasındaki farklılıkların tahmininden farklı bilgiler sağladığına dikkat edin. Böylece, bir model karşılaştırmasında bile,

Stan / JAGS / MCMC çıkışından Bayesal null hipotez testi yapmanın yolları olabilir, ancak bu durumda bilmiyorum. Örneğin, Bayes faktörüne bir Savage-Dickey yaklaşımı denenebilir, ancak bu, bazı matematiksel analiz veya öncekinden bazı ek MCMC yaklaşımı gerektirecek olan farklar üzerindeki önceki yoğunluğu bilmeye dayanacaktır.

Boş değerlere karar vermenin iki yöntemi, Ch. 12 DBDA2E https://sites.google.com/site/doingbayesiandataanalysis/ . Ancak bu tartışmanın, null değerleri değerlendirmenin "uygun" yolu hakkındaki bir tartışma tarafından takip edilmesini istemiyorum; sadece farklılar ve farklı bilgiler veriyorlar. Cevabımın ana noktası yukarıdaki nokta 1'dir: Gruplar arasındaki farklılıkların posterior dağılımına bakın.


3
Sitemize hoşgeldiniz! Topluluğumuzun bir parçası olmanız harika!
Tim

Hesabınızı bu bir stats.stackexchange.com/users/16592 (sizinki gibi görünüyor) ile birleştirmek istiyorsanız, bunu stats.stackexchange.com/contact adresinden otomatik olarak yapabilirsiniz .
amip: Reinstate Monica

Burada açıklanan hipotez testini brms kullanarak yapabilirsiniz. Bakınız: github.com/paul-buerkner/brms
bjw

3

SO görgü kurallarını takiben, bunun @ John K. Kruschke'ye bir yorum olarak yazılması gerekirdi, ancak daha uzun yorumların oluşturulması zordur. Üzgünüm.

  • @John K. Kruschke şöyle yazıyor: Yalnızca tamamlanmış MCMC zincirinin sonradan işlenmesiyle ...

lower_CredIve upper_CredIorijinal gönderide tam MCMC zincirlerinden bahsedildiği gibi hesaplandı ve lmeçıktı ile daha iyi karşılaştırma için sadece biraz yeniden biçimlendirildi . İGE'yi tercih ederken, bunlar basit rakamlardır; bu örnekte simetrik posterior ile büyük bir fark yaratmaz.

  • HALAT ve efekt büyüklüğü

Etik kurullara yapılan başvurularda, etki büyüklüğü hakkındaki varsayımı belirtmeden istatistiksel gücün hesaplandığı görülmüştür. "Klinik olarak anlamlı bir etki" tanımlamanın bir yolu olmadığı durumda bile, kavramı tıp araştırmacılarına açıklamak zordur. Kalitesizlik denemeleri için biraz daha kolaydır, ancak bunlar genellikle bir araştırmaya konu değildir.

Bu yüzden, HALAT tanıtmanın kabul edilemeyeceğinden eminim - başka bir varsayım, insanlar birden fazla sayıyı akılda tutamaz. Bayes faktörleri işe yarayabilir, çünkü daha önce p değerleri gibi eve götürmek için sadece bir sayı vardır.

  • Sabıkası

Stan ekibinden @John K. Kruschke veya @ Ben Goodrich'in önceliklerden bahsetmemesine şaşırdım; konuyla ilgili çoğu makale, sonuçları sunarken önceki hassasiyetin ayrıntılı tartışmasını istemektedir.

Kitabınızın bir sonraki baskısında - umarım Stan ile - seçilen örnekler için "Bunu 100 kelimeyle nasıl yayınlayabilirim (istatistiksel olmayan bir gazetede)" kutularını ekleyebilirseniz iyi olur. Bölüm 23.1'inizi kelime ile alacağımda, tipik bir tıbbi araştırma makalesi 100 sayfa ve rakamlar uzunluğunda olurdu ...


Ana nokta, farklılıkların (gruplar arasında, grup kombinasyonları arasında) posterior dağılımına bakmaktı. MCMC zincirinin sonradan işlenmesi gerekir.
John K. Kruschke

* HALAT: "HALATLAR'ın kabul edilemeyeceğinden eminiz" ve "konsepti tıp araştırmacılarına açıklamak zor". Bayes faktörünün karar için belirli bir BF eşiğinin daha ayrıntılı bir şekilde açıklanmasını ve gerekçelendirilmesini gerektirdiğinden, Bayes faktörlerinin açıklanması veya kabul edilmesinin daha kolay olacağını görmüyorum! Bana öyle geliyor ki, kitlenizin sürekli bir çerçeve içinde kemikleşmiş olduğunu varsaydınız; durum buysa, sık sık istatistik kullanın veya çalışmanızı daha aydınlık bir dergiye gönderin.
John K. Kruschke

* Özellikle burada kullandığınız gibi basit modeller için, az miktarda metinle kısaca ele alınabilen Ch 23.1'in önerileri hakkında ciddi bir şekilde abartıyorsunuz. Bir sonraki yorumda devam ediyor ...
John K. Kruschke

1
(i) Bayesian kullanımını motive etmek - size zengin bilgilendirici posterior dağılımlar verir. (ii) Bu durumda kolay olan modeli ve parametrelerini açıklayınız. (iii) Bu durumda önceki - yine önemsiz olanı, yalnızca posterior üzerinde hiçbir etkisi olmayan yaygın öncelikler kullandığınızı söylemek için haklı çıkarınız. (Ama öncekinin çok önemli olduğu Bayes faktörlerini kullanırsanız DEĞİLDİR.) (İv) MCMC zincirinin düzgünlüğünü bildiriniz - ESS'nin tüm parametreler ve farklılıklar için yaklaşık 10.000 olduğunu söylemek önemsizdir. Bir sonraki yorumda devam ediyor ...
John K. Kruschke

1
(v) Posterior'u yorumlayın: Her bir ilgi farkı için posteriorun merkezi eğilimini (örn. mod) ve% 95 HDI'sini belirtin. Bir tweet kadar kısa değil, ama sadece birkaç paragraf.
John K. Kruschke
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.