Sansür genellikle kısaltma ile karşılaştırıldığında açıklanmaktadır . İki sürecin güzel açıklaması Gelman ve arkadaşları (2005, s. 235) tarafından sağlanmıştır:
Kesik veriler, kesilme noktasının ötesinde hiçbir gözlemin bulunmadığı sansürlenmiş verilerden farklıdır. Sansürleme ile
kesme noktasının ötesindeki gözlemlerin değerleri kaybolur, ancak sayıları gözlenir.
Sansürleme veya kısaltma, bir seviyenin üzerindeki (sağ sansür), bir seviyenin altındaki (sol sansür) veya her ikisi için değerler oluşabilir.
2.02.0
Sezgisel sezgisel örnek, katılımcılarınıza yaşları hakkında soru sormanız, ancak bunu yalnızca bir değere kadar kaydetmeniz ve bu değerin üzerindeki 60 yaşın üzerindeki tüm yaşların "60+" olarak kaydedilmesidir. Bu, sansürsüz değerler için kesin bilgi sahibi olur ve sansürlenmiş değerler hakkında bilgi sahibi olmaz.
O kadar tipik değil, sansürlemenin gerçek hayattaki bir örneği , internette oldukça fazla dikkat çeken Polonya matura sınav puanlarında gözlendi . Sınav lisenin sonunda yapılır ve öğrencilerin yükseköğretime başvurabilmeleri için sınavı geçmeleri gerekir. Aşağıdaki tablodan öğrencilerin sınavı geçmek için ihtiyaç duydukları minimum puan miktarını tahmin edebiliyor musunuz? Şaşırtıcı olmayan bir şekilde, sansür sınırının hemen üzerinde aşırı temsil edilen puanların uygun bir kısmını alırsanız, normal dağılımdaki "boşluk" kolayca "doldurulabilir".
Hayatta kalma analizi durumunda
sansür, bireysel hayatta kalma süresi hakkında bazı bilgilerimiz olduğunda meydana gelir, ancak hayatta kalma süresini tam olarak bilmiyoruz
(Kleinbaum ve Klein, 2005, s.5). Örneğin, bazı ilaçlarla hastaları tedavi edersiniz ve çalışmanızı bitirene kadar gözlemlersiniz, ancak çalışma bittikten sonra onlara ne olacağına dair hiçbir bilginiz yoktur (nüksetme veya yan etki oldu mu?), Bildiğiniz tek şey, bunların " "hayatta en azından çalışmanın sonuna kadar.
Aşağıda Kaplan – Meier tahmincisi kullanılarak modellenen Weibull dağılımından elde edilen verilerin örneğini bulabilirsiniz . Tam veri kümesinde tahmin edilen mavi eğri işaretleri modeli, orta grafikte sansürlü örnek ve sansürlü verilerde tahmin edilen modeli (kırmızı eğri) görebilirsiniz, sağda bu örnek üzerinde tahmin edilen örnek ve modeli (kırmızı eğri) görebilirsiniz. Gördüğünüz gibi, eksik verilerin (kesilme) tahminler üzerinde önemli bir etkisi vardır, ancak sansürleme standart sağkalım analiz modelleri kullanılarak kolayca yönetilebilir.
Bu, kesilmiş örnekleri analiz edemeyeceğiniz anlamına gelmez, ancak bu gibi durumlarda, bilinmeyen bilgileri "tahmin etmeye" çalışan eksik veriler için modeller kullanmanız gerekir.
Kleinbaum, DG ve Klein, M. (2005). Hayatta Kalma Analizi: Kendi Kendini Öğrenen Metin. Springer.
Gelman, A., Carlin, JB, Stern, HS ve Rubin, DB (2005). Bayesci Veri Analizi. Chapman ve Salon / CRC.