İki dağılımın boyuna karşılaştırması


10

Altı aylık aralıklarla 2500 kişiye dört kez uygulanan kan testinin test sonuçlarım var. Sonuçlar öncelikle, biri belli tüberküloz antijenlerinin varlığında, biri yokluğunda olmak üzere iki immün yanıt ölçümünden oluşur. Şu anda, her test, antijen yanıtı ve sıfır yanıtı arasındaki farka bağlı olarak pozitif veya negatif olarak değerlendirilir (bağışıklık sisteminiz TB antijenlerine yanıt verirse, muhtemelen bir noktada bakterinin kendisine maruz kaldığınızdır. ). Özünde, test maruz kalmayan bireyin nil ve TB yanıtlarının dağılımlarının temel olarak aynı olması gerektiğini varsayarken, TB maruziyeti olan bir kişinin farklı bir dağılımdan (daha yüksek değerlerden) alınan TB yanıtları olacağını varsayar. Uyarı: tepkiler çok, çok normal değil ve değerler hem doğal zeminde hem de aletle kesilmiş tavanda toplanıyor.

Bununla birlikte, bu uzunlamasına ortamda, antijen ve nil tepkilerinde (tipik olarak küçük) dalgalanmaların neden olduğu "yanlış pozitifler" (gizli tüberküloz için gerçek altın standardı yok, korkarım) aldığımız oldukça açık görünüyor. Bazı durumlarda bunun önlenmesi zor olsa da (birini test etmek için sadece bir şansınız olabilir), insanların her yıl TB için rutin olarak test edildiği birçok durum vardır - ABD'de, bu sağlık çalışanları için yaygındır, barınaklarda kalan askeri, evsiz insanlar vb. Önceki test sonuçlarını göz ardı etmek utanç verici görünüyor çünkü mevcut kriterler kesitsel hale geliyor.

Ben düşünüyorum ne yapmak istiyorum boyuna karışım analizi gibi ben kabaca gebeliğe ne olduğunu. Kesitsel ölçütlere çok benzer şekilde, bir bireyin TB ve nil tepkilerinin aynı dağıtımdan alınma olasılığını tahmin etmek istiyorum - ancak bu tahminin önceki test sonuçlarını ve örnekten gelen bilgileri içermesini sağlayın. bir bütün (örneğin, belirli bir bireyin nil veya TB dağılımına ilişkin tahminlerimi iyileştirmek için bireyler arası değişkenliklerin örnek çapında dağılımını kullanabilir miyim?). Tahmin edilen olasılığın, elbette, yeni enfeksiyon olasılığını hesaba katmak için zaman içinde değişebilmesi gerekir.

Kendimi bu konuda alışılmadık yollarla düşünmeye çalışırken tamamen büktüm, ama bu kavramsallaştırma ortaya çıkacağım kadar iyi gibi hissediyorum. Bir şey mantıklı değilse, lütfen açıklama istemekten çekinmeyin. Durum hakkındaki anlayışım yanlış görünüyorsa, lütfen bana söylemekten çekinmeyin. Yardımın için çok teşekkür ederim.

Srikant'a yanıt olarak: İki sürekli (ancak normal olmayan ve kesilmiş) test sonucunu kullanan gizli bir sınıflandırma (TB ile enfekte veya değil). Şu anda, bu sınıflandırma bir kesme (basitleştirilmiş haliyle TB - nil> .35 -> pozitif) kullanılarak yapılır. Test sonuçları (nil, TB, sonuç) olarak sunulduğunda, temel arketipler * şunlardır:

Olası Negatif: (0.06, 0.15, -) (0.24, 0.23, -) (0.09, 0.11, -) (0.16, 0.15, -)
Olası Pozitif: (0.05, 3.75, +) (0.05, 1.56, +) (0.06 , 5.02, +) (0.08, 4.43, +)
Wobbler: (0.05, 0.29, -) (0.09, 0.68, +) (0.08, 0.31, -) (0.07, 0.28, -)

Wobbler için yapılan ikinci testteki pozitif, açıkça bir sapmadır, ancak bunu nasıl modellersiniz? Düşüncemden biri, her zaman noktasında tekrarlanan ölçümler çok düzeyli bir model kullanarak TB ve sıfır arasındaki "gerçek farkı" tahmin etmek olsa da, gerçekten bilmek istediğim kişinin kişinin nil yanıtı ve TB yanıtı olup olmadığı aynı dağılımdan çekilir veya bağışıklık sistemleri TB antijenlerini tanır ve aktive olursa, artan bir yanıt üretir.

Enfeksiyondan başka pozitif teste neden olabilecek şeylere gelince: Emin değilim. Genellikle sonuçlarda sadece kişi içi varyasyon olduğundan şüpheleniyorum, ancak kesinlikle başka faktörlerin olasılığı var. Her zaman noktasından anketlerimiz var, ama henüz bunlara çok fazla bakmadım.

* Fabrikasyon fakat açıklayıcı veriler


Oh, ve yeniden etiketlemek için çekinmeyin - tarayıcım otomatik öneri ile çalışmıyor, bu yüzden orada ne olduğunu görmekte zorlanıyorum.
Matt Parker

Bağımlı değişkeniniz sürekli mi yoksa ayrık mı? Ya da, belki de, altta yatan test sonucu süreklidir ve bazı kesintilere bağlı olarak ayrı bir cevaba (yani, 'pozitif', 'negatif') dönüştürülür? Bir bireyin tüberküloz hastalığına maruz kalmamasına rağmen neden negatiften pozitife döneceğini de açıklayabilir misiniz? Bu tür bir kapak için belirli bir örnek (bazı numaralar atılır) yardımcı olabilir.

1
Örnekler verileri görselleştirmek için gerçekten yararlıdır. Uyarınızla ilgili başka bir soru: "değerler yerde ve tavanda toplanıyor ve verilerin normal olmadığı." (A) skalanın alt ucundaki verilerin normal görünüp görünmediğini ve (b) skalanın üst ucundaki verilerin normal görünüp görünmediğini söyleyebilir misiniz?

Not: Görünüşe göre ödülü gerçekten vermek için son tarihi kaçırdım, bu yüzden Srikant'ı yardımı için düzgün bir şekilde ödüllendirebilmem için bir tane daha ayarlıyorum. Daha fazla cevap her zaman beklerim, ama ödül onun içindir.
Matt Parker

Yanıtlar:


2

Bu tam bir cevap değil ama umarım size durumun tutarlı bir şekilde nasıl modelleneceği konusunda bazı fikirler verir.

Varsayımlar

  1. Ölçeğin alt ucundaki değerler, aşağıdan kesilmiş normal bir dağılımı takip eder.

  2. Ölçeğin üst ucundaki değerler yukarıdan kesilmiş normal bir dağılımı takip eder.

    (Not: Verilerin normal olmadığını söylediğinizi biliyorum, ancak tüm değerlerin dağılımına atıfta bulunduğunuzu varsayıyorum, yukarıdaki varsayımlar ölçeğin alt ve üst uçlarındaki değerlerle ilgilidir.)

  3. Bir kişinin temel durumu (TB'si olsun olmasın) birinci dereceden bir markov zincirini takip eder.

model

İzin Vermek:

  1. Di(t) o zamanda 1 olduğu , kişi, aksi TB ve 0 vartith

  2. RTBi(t) süresi TB testine deney tepkisi ait kişitith

  3. RNi(t) süresi de NİLL testine deney tepkisi ait kişitith

  4. f(RNi(t)|Di(t)=0)N(μl,σl2)I(RNi(t)>Rl)

  5. f(RNi(t)|Di(t)=1)N(μl,σl2)I(RNi(t)>Rl)

    Madde 4 ve 5, bir kişinin NILL testine verdiği yanıtın hastalık durumuna bağlı olmadığı fikrini yakalar.

  6. f(RTBi(t)|Di(t)=0)N(μl,σl2)I(RTBi(t)>Rl)

  7. f(RTBi(t)|Di(t)=1)N(μu,σu2)I(RTBi(t)<Ru)

  8. μu>μl

    Nokta 6, 7 ve 8, bir kişinin TB testine yanıtının hastalık durumuna bağlı olduğu fikrini yakalar .

  9. p(t) 6 ay içinde bir kişinin mandallar TBC zaman önceki olasılığı olacak önceki test süresi boyunca hastalıksız vardı ki. Dolayısıyla, devlet geçiş matrisi aşağıdakini ister:t

    [1p(t)p(t)01]

    Başka bir deyişle,

    Prob(Di(t)=1|Di(t1)=0)=p(t)

    Prob(Di(t)=0|Di(t1)=0)=1p(t)

    Prob(Di(t)=1|Di(t1)=1)=1

    Prob(Di(t)=0|Di(t1)=1)=0

Test kriterleriniz şunları belirtir:

D^i(t)={1,RTBi(t)RNi(t)0.350,otherwise

Bununla birlikte, modelin yapısından gördüğünüz gibi, cut-off'ları gerçekten parametreleştirebilir ve tüm problemi, hastaları doğru bir şekilde teşhis etmek için cut-off'larınız olması gerekenle değiştirebilirsiniz. Bu nedenle, yalpalayıcı sorunu, herhangi bir şeyden ziyade kesme seçiminizle ilgili bir sorun gibi görünüyor.

'Doğru' cut-off'ları seçmek için kesin olarak TB'ye sahip olduğu tespit edilen hastalar hakkında geçmiş verileri alabilir ve yukarıdaki kurulumun sonuç parametrelerini tahmin edebilirsiniz. 'En iyi' modeli tanımlamak için metrik olarak değil de TB'ye sahip olarak doğru sınıflandırılan hasta sayısı gibi bazı kriterleri kullanabilirsiniz. Basitlik için, nin salgınların yokluğunda makul görünen zamanla değişmeyen bir parametre olduğunu varsayabilirsiniz .p(t)

Umarım faydalıdır.


Teşekkürler Srikant! Üzgünüm, daha önce yorumunu bir şekilde özledim. Üst küme gerçekten tavanda bir sivri uçtur - temelde açıkladığınız gibi alt dağılıma bağlayan uzun tekdüzelik aralığı dışında orada bir değişkenlik yoktur. Cevabınızı ayrıştırmak biraz zaman alacaktır (özellikle IE'de sıkıştığım ve şu anda LaTeX'i düzgün göremediğim için), ancak bu tuhaf küçük soruya olan bağlılığınızı takdir ediyorum.
Matt Parker

3

Tricky Matt, gerçek dünya istatistikleri istatistikleri gibi!

Çalışma amaçlarınızı / hedeflerinizi tanımlamaya başlarım.

Deneklerin gerçek durumlarını bilmeden, TB + ve TB testi için olasılık dağılımlarını tanımlamak zor olacaktır. Önceki TB enfeksiyonu (veya daha iyisi, tıbbi geçmişler) hakkında sorularınız var mı? Ayrıca, TB + 'yı çocukluktaki bir aşılama nedeniyle test ediyorum - birkaç on yıl önce - bu nedenle önceki aşıların dikkate alınması gerekiyor.

Bana öyle geliyor ki asıl sorunuz: Tekrarlanan TB testi test sonucunu etkiler mi?

Peter Diggle'ın Boyuna Veriler Analizinin bir kopyasını almaya değer .

Bazı keşifsel veri analizlerini, özellikle nil-test sonuçlarının her seferinde birbirlerine karşı dağılım grafiği matrislerini ve her seferinde TB test sonuçlarını birbirine göre dağıtın; ve TB'ye karşı sıfır dağılım grafikleri (her seferinde). Ayrıca farklılıkları da (TB testi - Nil testi) alın ve dağılım grafiği matrislerini yapın. Verilerin dönüşümlerini deneyin ve bunları yeniden yapın - TB sonuçları Nil'e göre çok büyükse log (TB) - log (Nil) yardımcı olabilir. Korelasyon yapısında doğrusal ilişkiler olup olmadığına bakın.

Başka bir yaklaşım, tanımlanan test sonucunu (pozitif / negatif) almak ve doğrusal olmayan karışık efektler modeli (logit link) kullanarak bu mantıksal olarak modellemek olacaktır. Bazı kişiler TB + 'dan TB-' yi test etmek arasında mı geçiş yaparlar ve bu Nil testi, TB testi, TB-Nil veya bazı test sonuçlarının dönüşümü ile mi ilgili?


Cevabınız için teşekkürler. Gerçek durumu bilmemeye gelince: kapsamlı anketlerimiz var ve cilt testi ile BCG aşı sorununun farkındayız - aslında, bu kan testlerinin PPD'den farklı bir antijen seti kullandıkları için bu sorunu çözmesi gerekiyor. alışkınım. Bununla birlikte, bu neredeyse ayrı bir soru ve biraz sonra üzerinde çalışacağımız bir soru - şu anda ilgim bu testi 'boylamasına farkında' yapmak.
Matt Parker

... özellikle bazı bireyler olumsuzdan olumluya dönüştüğü için ve bu genellikle tipik sıfır ve TB sonuçlarının küçük dalgalanmalar yaratan bir ürünüdür - biraz aşağı, TB biraz yukarı ve aniden pozitiftir. Sonraki test, negatif olmaya geri döndüler. Bireysel sonuçları incelerken bunu görebiliyorum, ancak sezgilerimi bir modele nasıl dahil edeceğimi bilmiyorum.
Matt Parker

Son olarak, günlük sonuçlarını almayı denemiş olsam da, bunları normalliğe yakınlaştırmak için yeterli görünmüyor. Çok, çok çarpıktırlar ve üst uçtaki kesik, tavana fark edilir bir yoğunluk bloğu ekleyerek bunu daha da karmaşıklaştırır. Bununla birlikte, ilginç bir şekilde, numune çapında sıfır ve TB sonuç dağılımları oldukça benzerdir, tek fark tavandaki bloğun TB sonuçları için çok daha büyük olmasıdır.
Matt Parker

Bir sorunun bu canavarı okumak ve cevaplamak için zaman ayırdığınız için teşekkür ederiz!
Matt Parker
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.