Diyelim ki bize aşağıdaki problem verildi:
Önümüzdeki 3 ay içinde hangi müşterilerin mağazamızda alışveriş yapmayı bırakma olasılığının yüksek olduğunu tahmin edin.
Her müşteri için mağazamızda satın almaya başladığı ayı biliyoruz ve ayrıca aylık toplamlarda birçok davranışsal özelliğe sahibiz. 'En büyük' müşteri elli aydır satın alıyor; edelim bir istemci tarafından satın başladı yana zamanı belirtmek ( ). Müşteri sayısının çok fazla olduğu varsayılabilir. Bir müşteri üç ay boyunca satın almayı bırakır ve sonra geri gelirse, yeni bir müşteri olarak değerlendirilir, böylece bir etkinlik (satın almayı durdur) yalnızca bir kez gerçekleşebilir.
Aklıma iki çözüm geliyor:
Lojistik regresyon - Her müşteri ve her ay için (belki de en yeni 3 ay hariç), bir müşterinin satın almayı bırakıp bırakmadığını söyleyebiliriz, böylece müşteri ve ay başına bir gözlemle haddeleme örnekleri yapabiliriz. Temel tehlike fonksiyonuna eşdeğer bir değer elde etmek için kategorik bir değişken olarak başladığımızdan beri geçen ay sayısını kullanabiliriz.
Genişletilmiş Cox modeli - Bu sorun ayrıca genişletilmiş Cox modeli kullanılarak da modellenebilir. Bu sorunun hayatta kalma analizine daha uygun olduğu görülüyor.
Soru: Benzer problemlerde sağkalım analizinin avantajları nelerdir? Hayatta kalma analizi bir nedenden dolayı icat edildi, bu yüzden ciddi bir avantaj olmalı.
Hayatta kalma analizindeki bilgim çok derin değil ve Cox modelinin potansiyel avantajlarının çoğunun lojistik regresyon kullanılarak da elde edilebileceğini düşünüyorum.
- Tabakalı Cox modelinin eşdeğeri, ve tabakalaşma değişkeninin bir etkileşimi kullanılarak elde edilebilir .
- Etkileşim Cox modeli, popülasyonu birkaç alt popülasyona daldırarak ve her alt popülasyon için LR'yi tahmin ederek elde edilebilir.
Gördüğüm tek avantaj Cox modelinin daha esnek olması; örneğin, bir müşterinin 6 ay içinde satın almayı durdurma olasılığını kolayca hesaplayabiliriz.