Gruplar arasında ortalama sağkalım nasıl karşılaştırılır?


12

Bir tür kanser için farklı eyaletlerde Kaplan-Meier kullanarak medyan sağkalımı araştırıyorum. Devletler arasında oldukça büyük farklılıklar var. Tüm eyaletler arasındaki ortalama hayatta kalma oranını nasıl karşılaştırabilirim ve hangilerinin ülke genelindeki ortalama ortalama hayatta kalma süresinden önemli ölçüde farklı olduğunu nasıl belirleyebilirim?


Çalışmanızın tasarımı hakkında daha iyi bir fikir edinebilmemiz için lütfen örnek boyutları, zaman çerçevesi, hayatta kalma yüzdesi vb.
chl

verilerde sansürlenmiş değerler var - en büyük değerler dışında?
Aralık'ta ronaf

Verilerde gerçekten sansürlenmiş değerler vardır ve toplam nüfus yaklaşık 1500, medyan genel sağkalım 18 aydır (300-600 gün arasında) ... zaman çerçevesi 2000-2007 dönemidir.
Misha

Yanıtlar:


6

Kaplan-Meier hayatta kalma eğrisini akılda tutmamız gereken bir şey, temelde açıklayıcı ve çıkarımsal olmamasıdır . Bu sadece arkasında yatan inanılmaz derecede esnek bir model ile verilerin bir fonksiyonudur. Bu bir güçtür, çünkü bu kırılabilecek neredeyse hiçbir varsayım olmadığı, ancak onu genelleştirmek zor olduğu için bir zayıflık olduğu ve "sinyal" yanı sıra "gürültü" de uyduğu anlamına gelir. Bir çıkarım yapmak istiyorsanız, temel olarak bilmek istediğiniz bilinmeyen bir şey tanıtmanız gerekir.

Şimdi, ortalama hayatta kalma sürelerini karşılaştırmanın bir yolu, aşağıdaki varsayımları yapmaktır:

  1. Kaplan meier eğrisi tarafından verilen durumlarının her biri için ortalama hayatta kalma süresi . bentii
  2. Gerçek medyan sağkalım süresinin, bu tahmine eşit olmasını bekliyorum. E ( T i | t i ) = t iTiE(Ti|ti)=ti
  3. Gerçek medyan sağkalım süresinin pozitif olduğundan% 100 eminim. Pr(Ti>0)=1

Şimdi bu varsayımları kullanmanın "en muhafazakar" yolu maksimum entropi prensibidir, bu yüzden şunları elde edersiniz:

p(Ti|ti)=Kexp(λTi)

Nerede ve PDF normalize şekilde seçilir ve beklenen değer . Şimdi elimizde:λ t iKλti

= K [ - e x p ( - λ T i )

1=0p(Ti|ti)dTi=K0exp(λTi)dTi
e ( T i ) = 1
=K[exp(λTi)λ]Ti=0Ti==KλK=λ
ve şimdiE(Ti)=1λλ=ti1

Ve böylece her durum için bir dizi olasılık dağılımı var.

p(Ti|ti)=1tiexp(Titi)(i=1,,N)

Aşağıdakilerin ortak olasılık dağılımını veren:

p(T1,T2,,TN|t1,t2,,tN)=i=1N1tiexp(Titi)

Şimdi hipotezini test etmek istediğiniz gibi görünüyor , burada ortalama ortalama hayatta kalma süresidir. Test etmek için ciddi alternatif hipotez "her durum eşsiz ve güzel bir kar tanesi" hipotezi çünkü en olası alternatiftir ve bu nedenle daha basit hipoteze (bir "minimax" testi) geçmede kaybedilen bilgileri temsil eder. Daha basit hipoteze karşı kanıtın ölçülmesi olasılık oranı ile verilir:¯ t = 1H0:T1=T2==TN=t¯HA:T1=t1,...,T, N=tKt¯=1Ni=1NtiHA:T1=t1,,TN=tN

= [ N i = 1 1

O(HA|H0)=p(T1=t1,T2=t2,,TN=tN|t1,t2,,tN)p(T1=t¯,T2=t¯,,TN=t¯|t1,t2,,tN)
=[i=1N1ti]exp(i=1Ntiti)[i=1N1ti]exp(i=1Nt¯ti)=exp(N[t¯tharm1])

Nerede

tharm=[1Ni=1Nti1]1t¯

harmonik ortalamadır. Oranların her zaman mükemmel uyumu tercih edeceğini unutmayın, ancak medyan hayatta kalma süreleri makul derecede yakınsa çok değil. Ayrıca, bu size bu belirli hipotez testinin kanıtını belirtmek için doğrudan bir yol sağlar:

1-3 varsayımları , tüm eyaletlerde eşit ortalama hayatta kalma sürelerine karşı oranlarını verir.O(HA|H0):1

Bunu, daha basit hipotezi kabul etmenin ne kadar avantajlı olduğunu söyleyen bir karar kuralı, kayıp fonksiyonu, fayda fonksiyonu vb.Ile birleştirin ve sonucunuz var!

Test edebileceğiniz ve benzer oranlar verebileceğiniz hipotez miktarının bir sınırı yoktur. Farklı bir "gerçek değerler" kümesi belirtmek için değerini değiştirmeniz . Hipotezi şu şekilde seçerek "anlamlılık testi" yapabilirsiniz:H0

HS,i:Ti=ti,Tj=T=t¯(i)=1N1jitj

Yani bu hipotez sözlü olarak "durum farklı medyan sağkalım oranına sahiptir, ancak diğer tüm durumlar aynıdır". Ve sonra yukarıda yaptığım olasılık oranı hesaplamasını yeniden yapın. Her ne kadar alternatif hipotezin ne olduğuna dikkat etmelisiniz. Aşağıdakilerden herhangi biri için, cevaplamak istediğiniz sorular olabileceği için "makul" dir (ve genellikle farklı cevapları olacaktır)i

  • Benim ne kadar kötü olduğunu - yukarıda tanımlanan Mükemmel uyum kıyasla? H S , iHAHS,i
  • Benim ne kadar iyi olduğunu - yukarıda tanımlanan ortalama oturması ile karşılaştırıldığında? H S , iH0HS,i
  • farklı bir - durum , durum karşılaştırıldığında "daha farklı" ne ? k iHS,kki

Şimdi burada gözden geçirilen bir şey, devletler arasındaki korelasyonlardır - bu yapı, bir eyaletteki ortalama hayatta kalma oranını bilmenin, başka bir eyaletteki ortalama hayatta kalma oranı hakkında hiçbir şey söylemediğini varsayar. Bu "kötü" gibi görünse de, iyileştirilmesi zor değildir ve yukarıdaki hesaplamalar hesaplanması kolay olan iyi başlangıç ​​sonuçlarıdır.

Durumlar arasına bağlantı eklemek olasılık modellerini değiştirecek ve medyan hayatta kalma sürelerinin bir miktar "havuzunu" etkili bir şekilde göreceksiniz. Korelasyonları analize dahil etmenin bir yolu, gerçek hayatta kalma sürelerini "ortak kısım" veya "eğilim" ve "bireysel kısım" olarak iki bileşene ayırmaktır:

Ti=T+Ui

Ve sonra sınırlamak bireysel parçası tüm birimleri üzerinde ortalama sıfır ve bilinmeyen bir varyans , önceki verileri (veya Jeffreys gözlemleyerek için tek tek değişkenlik var önceki açıklayan neyi bilgileri kullanarak dışarı entegre edilmesi öncesinde eğer hiçbir şey bilmiyorum ve jeffreys sorunlara neden olursa yarı cauchy). σUiσ


(+1) Çok ilginç. Yayınınız ayrıca cevabıma bir yorum eklememi sağladı.
GaBorgulya

Belki de kaçırdım, ama nerede tanımlanıyor? M1
kardinal

@cardinal, özür dilerim - bu bir yazım hatası. kaldırılacak
probabilityislogic

özür gerekmez. Sadece ben okurken üzerine atlanmış ya da sadece belirgin bir şey eksik olup olmadığını emin değildi.
kardinal

4

Bu konuya sansürle kantil regresyonla ilgilenebileceğinizi düşündüm. Bottai & Zhang 2010 , sadece bu görevi yerine getirebilecek bir "Laplace Regresyonu" önerdi, burada bir PDF bulabilirsiniz . Bunun için Stata için bir paket var, ancak R'deki kantreg paketi sansürlü kantil regresyon, crq için bir seçenek olabilir, ancak bu bir seçenek olabilir.

Bence yaklaşım çok ilginç ve oranları tehlikeye atan hastalar için çok daha sezgisel olabilir. Örneğin, ilacın% 50'sinin ilacı almayanlardan 2 ay daha hayatta kaldığını bilmek ve yan etkiler sizi hastanede 1-2 ay kalmaya zorlamak, tedavi seçimini daha kolay hale getirebilir.


"Laplace Regresyonu" nu bilmiyorum, ama 2. paragrafınızla ilgili olarak doğru anladığımı merak ediyorum. Genellikle hayatta kalma analizinde (hızlandırılmış başarısızlık süresi açısından düşünerek), 'ilaç grubu için 50. persentil, kontrol grubu için% 50'den 2 ay sonra gelir' gibi bir şey söyleyebiliriz. Demek istediğin bu mu yoksa LR'nin çıktısı farklı bir yorum mu sağlıyor?
gung - Monica'yı eski durumuna döndürün

@gung: Bence yorumunda haklısın - metni değiştirdin, daha iyi mi? Son zamanlarda bir derste karşılaşmış olmama rağmen regresyon modellerini kendim kullanmadım. Çok kullandığım normal Cox modellerine ilginç bir alternatif. Muhtemelen fikri sindirmek için daha fazla zaman harcamam gerekse de, hastalarıma açıklarken sık sık KM eğrileri kullandığım için hastalarıma açıklamamın daha kolay olduğunu hissediyorum. İK, göreceli ve mutlak riskler arasındaki farkı gerçekten anlamanızı istiyor - açıklanması biraz zaman alabilen bir konsept ...
Max Gordon


Bağlantı için teşekkür ederim @Misha. Yazarın bir cevabı var: onlinelibrary.wiley.com/doi/10.1002/bimj.201100103/abstract
Max Gordon

3

İlk olarak verileri görselleştirirdim: her bir eyaletteki medyan sağkalımları için güven aralıklarını ve standart hataları hesaplayın ve bir huni grafiği kullanarak orman arazisinde, medyanlarda ve SE'lerinde CI'leri gösterin.

“Ülke genelinde ortalama ortalama sağkalım” verilerden tahmin edilen ve dolayısıyla belirsizliğe sahip bir miktardır, bu nedenle önem testi sırasında keskin bir referans değeri olarak alamazsınız. All-all yaklaşımı ile ilgili bir diğer zorluk da, bir medyanı onunla karşılaştırdığınızda, medyanı zaten bu miktarı bileşen olarak içeren bir miktarla karşılaştırmanızdır. Bu nedenle, her bir durumu birleştirilmiş diğer tüm durumlarla karşılaştırmak daha kolaydır . Bu, her durum için bir log sıralama testi (veya alternatifleri) yapılarak yapılabilir.
(Olasılıksal cevabı okuduktan sonra düzenleyin: log sıra testi iki (veya daha fazla) grupta hayatta kalmayı karşılaştırır, ancak karşılaştırdığı medyan kesinlikle değildir. Karşılaştırmak istediğiniz medyan olduğundan eminseniz, denklemlerine güvenebilir ya da burada yeniden örneklemeyi kullanabilirsiniz)

Sorunuzu [çoklu karşılaştırmalar] olarak etiketlediniz, bu yüzden p değerlerinizi en az bir ayarlanmış p değerini% 5'in altında gördüğünüzde “eyaletlerde medyan hayatta kalma % 5 anlamlılık düzeyinde. Bonferroni gibi genel ve aşırı muhafazakar yöntemleri kullanabilirsiniz, ancak en uygun düzeltme şeması p değerlerinin korelasyonlarını dikkate alacaktır. Düzeltme şemasına önsel bir bilgi inşa etmek istemediğinizi varsayıyorum, bu yüzden ayarlamanın her p değerini aynı C sabiti ile çarptığı bir şemayı tartışacağım.

En uygun C çarpanını elde etmek için formülü nasıl türeteceğimi bilmediğim için, yeniden örneklemeyi kullanırdım . Null hipotezi altında, hayatta kalma özelliklerinin tüm eyaletlerde aynı olduğu, böylece kanser vakalarının durum etiketlerine izin verebilir ve medyanları yeniden hesaplayabilirsiniz. Yeniden örneklenmiş birçok durum p değeri vektörü elde ettikten sonra, sayısal olarak, vektörlerin% 95'inden daha azının önemli bir p değeri içermediği ve üzerinde% 95'in üzerinde olduğu C çarpanını bulurdum. Aralık geniş görünse de, örnek sayısını bir büyüklük sırasına göre art arda artıracağım.


Verileri görselleştirme hakkında iyi tavsiyeler. (+1)
olasılık

@probabilityislogic Teşekkürler! Ayrıca, özellikle yapıcı ise, eleştirilere de açığım.
GaBorgulya

sahip olduğum tek eleştiri p-değerlerinin kullanılmasıdır, ancak bu, cevabınızdaki herhangi bir şeyden daha çok "omzumdaki bir çiptir" - p-değerlerini kullanacaksanız, o zaman önerdiğiniz şey iyidir. Sadece p değerleri kullanmanın iyi olduğunu düşünmüyorum. p-değerleri hakkındaki yorumlarda @eduardo ile yaptığım değişim için buraya bakın .
olasılık
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.