Layman'ın hayatta kalma analizinde sansür açıklaması


13

Sansürün ne olduğunu ve hayatta kalma analizinde nasıl dikkate alınması gerektiğini okudum, ancak bunun daha az matematiksel bir tanımını ve daha sezgisel bir tanımını duymak istiyorum (resimler harika olurdu!). Herkes bana 1) sansür ve 2) Kaplan-Meier eğrileri ve Cox regresyonu gibi şeyleri nasıl etkilediğini açıklayabilir mi?


Hayatta kalma analizi ile ilgili Linear Digression podcast'ini dinlemenizi ve basitleştirilmiş sol ve sağ sansür tanımını ve cox modeli için motivasyonlarını duymanızı öneririm .
Uri Goren

Yanıtlar:


16

Sansür genellikle kısaltma ile karşılaştırıldığında açıklanmaktadır . İki sürecin güzel açıklaması Gelman ve arkadaşları (2005, s. 235) tarafından sağlanmıştır:

Kesik veriler, kesilme noktasının ötesinde hiçbir gözlemin bulunmadığı sansürlenmiş verilerden farklıdır. Sansürleme ile kesme noktasının ötesindeki gözlemlerin değerleri kaybolur, ancak sayıları gözlenir.

Sansürleme veya kısaltma, bir seviyenin üzerindeki (sağ sansür), bir seviyenin altındaki (sol sansür) veya her ikisi için değerler oluşabilir.

2.02.0

resim açıklamasını buraya girin

Sezgisel sezgisel örnek, katılımcılarınıza yaşları hakkında soru sormanız, ancak bunu yalnızca bir değere kadar kaydetmeniz ve bu değerin üzerindeki 60 yaşın üzerindeki tüm yaşların "60+" olarak kaydedilmesidir. Bu, sansürsüz değerler için kesin bilgi sahibi olur ve sansürlenmiş değerler hakkında bilgi sahibi olmaz.

O kadar tipik değil, sansürlemenin gerçek hayattaki bir örneği , internette oldukça fazla dikkat çeken Polonya matura sınav puanlarında gözlendi . Sınav lisenin sonunda yapılır ve öğrencilerin yükseköğretime başvurabilmeleri için sınavı geçmeleri gerekir. Aşağıdaki tablodan öğrencilerin sınavı geçmek için ihtiyaç duydukları minimum puan miktarını tahmin edebiliyor musunuz? Şaşırtıcı olmayan bir şekilde, sansür sınırının hemen üzerinde aşırı temsil edilen puanların uygun bir kısmını alırsanız, normal dağılımdaki "boşluk" kolayca "doldurulabilir".

resim açıklamasını buraya girin

Hayatta kalma analizi durumunda

sansür, bireysel hayatta kalma süresi hakkında bazı bilgilerimiz olduğunda meydana gelir, ancak hayatta kalma süresini tam olarak bilmiyoruz

(Kleinbaum ve Klein, 2005, s.5). Örneğin, bazı ilaçlarla hastaları tedavi edersiniz ve çalışmanızı bitirene kadar gözlemlersiniz, ancak çalışma bittikten sonra onlara ne olacağına dair hiçbir bilginiz yoktur (nüksetme veya yan etki oldu mu?), Bildiğiniz tek şey, bunların " "hayatta en azından çalışmanın sonuna kadar.

Aşağıda Kaplan – Meier tahmincisi kullanılarak modellenen Weibull dağılımından elde edilen verilerin örneğini bulabilirsiniz . Tam veri kümesinde tahmin edilen mavi eğri işaretleri modeli, orta grafikte sansürlü örnek ve sansürlü verilerde tahmin edilen modeli (kırmızı eğri) görebilirsiniz, sağda bu örnek üzerinde tahmin edilen örnek ve modeli (kırmızı eğri) görebilirsiniz. Gördüğünüz gibi, eksik verilerin (kesilme) tahminler üzerinde önemli bir etkisi vardır, ancak sansürleme standart sağkalım analiz modelleri kullanılarak kolayca yönetilebilir.

resim açıklamasını buraya girin

Bu, kesilmiş örnekleri analiz edemeyeceğiniz anlamına gelmez, ancak bu gibi durumlarda, bilinmeyen bilgileri "tahmin etmeye" çalışan eksik veriler için modeller kullanmanız gerekir.


Kleinbaum, DG ve Klein, M. (2005). Hayatta Kalma Analizi: Kendi Kendini Öğrenen Metin. Springer.

Gelman, A., Carlin, JB, Stern, HS ve Rubin, DB (2005). Bayesci Veri Analizi. Chapman ve Salon / CRC.


Bu Matura planının nereden geldiğini biliyor musunuz? Google'ı denedim ve reddit bağlantısını almaya devam ettim, ancak herhangi bir referans içermiyor. Sadece herhangi bir atıf olmadan imgur.com'a yol açar. GÜNCELLEME: Buldum. cke.edu.pl//images/files/matura/informacje_o_wynikach/2013/… sayfa 18.
amip diyor

1
@amoeba daha detaylı bilgi için benimle temas kurmaktan çekinmeyin. Bu konuyla ilgili bildiğim materyallerin çoğu maalesef Lehçe. Resim bir şey ama bir arkadaşım bu verilerin daha ayrıntılı analizini yaptı (btw, istek üzerine mevcuttur).
Tim

2

Sansür sağkalım analizinin merkezinde yer alır.

Temel fikir, bilgilerin sansürlendiği, sizin için görünmez olmasıdır. Basitçe açıklamak gerekirse, örnekteki herkes ölmeden önce yaşam sürelerini kaydederseniz, yaşam sürelerinin sansürlenmiş bir dağılımı elde edilir. X ekseninde zamanın "sağa doğru" hareket ettiğini düşünüyorsanız, buna sağ sansür denilebilir.

Başka türler de vardır: sol sansür ve pencere sansürü. Örneğin, Allison'ın eğitici bir giriş için Sage tarafından yayınlanan Etkinlik Geçmişi Analizi hakkındaki 1984 metnine bakın.

Örnek: Nüfustaki boşanma oranlarını hesaplıyorsanız, sadece boşanma riski olan kişileri (yani evli olanlar) dahil etmek istersiniz. İnsanlar evliliklerini boşanma (yas, yasaklama) dışındaki nedenlerle bitirirlerse, onları sansürlemek istersiniz. Artık boşanma riski altında değiller. Kaplan-Meier tahminleriniz (ve grafikleri) sansürlendikleri zaman noktasından sonra sansürlenmiş gözlemler içermemeli, ancak bunları o zaman noktasına kadar içermelidir.


Grafikler mi, grafikler mi?
RustyStatistician
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.