Bir veri kümesinde (model oluşturma veri kümesi) belirli bir hastalığın ortaya çıkması için bir tahmin modeli oluşturduğumu ve şimdi modelin yeni bir veri kümesinde (doğrulama veri seti) ne kadar iyi çalıştığını kontrol etmek istediğimizi varsayalım. Lojistik regresyon ile oluşturulan bir model için, model oluşturma veri kümesinden elde edilen model katsayılarına dayalı olarak doğrulama veri kümesindeki her bir kişi için tahmini olasılığı hesaplar ve daha sonra, bu olasılıkları bir kesme değerinde ikiye ayırdıktan sonra, 2x2 tablo oluşturabilirim gerçek pozitif oranı (duyarlılık) ve gerçek negatif oranı (özgüllük) hesaplamama olanak tanır. Ayrıca, kesmeyi değiştirerek tüm ROC eğrisini oluşturabilir ve daha sonra ROC grafiği için AUC elde edebilirim.
Şimdi farz edelim ki hayatta kalma verilerim var. Bu yüzden, model oluşturma veri kümesinde bir Cox orantılı tehlike modeli kullandım ve şimdi modelin doğrulama veri kümesinde ne kadar iyi çalıştığını kontrol etmek istiyorum. Temel risk Cox modellerinde parametrik bir fonksiyon olmadığından, model oluşturma veri kümesinde elde edilen model katsayılarına dayalı olarak doğrulama veri setindeki her bir kişi için tahmini hayatta kalma olasılığını nasıl elde edebileceğimi görmüyorum. Peki, modelin doğrulama veri kümesinde ne kadar iyi çalıştığını nasıl kontrol edebilirim? Bunu yapmak için yerleşik yöntemler var mı? Ve eğer evet ise, herhangi bir yazılıma uygulanıyorlar mı? Önerileriniz için şimdiden teşekkür ederiz!