Ben Cox Orantılı Tehlike regresyon & bazı Kaplan-Meier modelleri gibi bu geleneksel istatistiksel modeller bir olay diyelim başarısızlık sonraki geçtiği kadar gün tahmin etmek için kullanılabilir biliyorum vs. yani Survival analizi
Sorular
- GBM, Yapay sinir ağları vb. Makine öğrenimi modellerinin regresyon versiyonu bir olayın gerçekleşmesine kadar geçen günleri tahmin etmek için nasıl kullanılabilir?
- Ben sadece hedef değişken olarak ortaya çıkana kadar gün kullanmanın ve bir regresyon modeli çalıştırmak basitleştirmek işe yaramaz inanıyorum? Neden işe yaramaz ve nasıl düzeltilebilir?
- Hayatta kalma analizi problemini bir sınıflandırmaya dönüştürebilir ve sonra hayatta kalma olasılıkları elde edebilir miyiz? Eğer öyleyse ikili hedef değişkeni nasıl oluşturulur?
- Cox Orantılı Tehlikeler regresyonu ve Kaplan-Meier modelleri vs vs makine öğrenme yaklaşımının artıları ve eksileri nedir?
Örnek girdi verilerinin aşağıdaki formatta olduğunu düşünün
Not:
- Sensör, verileri 10 dakikalık aralıklarla pingler, ancak NA ile satırda gösterildiği gibi ağ sorunu vb. Nedeniyle veriler eksik olabilir.
- var1, var2, var3, yordayıcılar, açıklayıcı değişkenlerdir.
- fail_flag, makinenin başarısız olup olmadığını söyler.
- Makine kimliklerinin her biri için her 10 dakikada bir son 6 aylık verilerimiz var
DÜZENLE:
Beklenen çıktı tahmini aşağıdaki biçimde olmalıdır
Not: Önümüzdeki 30 gün boyunca makinelerin her biri için günlük seviyede arıza olasılığını tahmin etmek istiyorum.
failure_flag
.