Amacı, bir ithalatçının, distribütörlerin müşteri ağından ürünlerine olan talebi tahmin etmesini sağlamak olan bir tahmin uygulaması geliştiriyorum. Satış rakamları, talebi karşılamak için yeterli envanter olduğu sürece talep için oldukça iyi bir vekildir. Envanter sıfıra indirildiğinde (müşterimizin kaçınmasına yardımcı olmak istediğimiz durum), hedefi kaçırdığımızdan çok fazla şey bilmiyoruz. Yeterli tedarik olsaydı, müşteri kaç satış yapardı? Satış'ı basit bir hedef değişken olarak kullanan standart regresyon tabanlı ML yaklaşımları, zaman, tanımlayıcı değişkenlerim ve talep arasındaki ilişkinin tutarsız tahminlerini üretecektir.
Tobit modelleme, probleme yaklaşmanın en belirgin yoludur: http://en.wikipedia.org/wiki/Tobit_model . Verilerin sol elle sansürlenmiş yapısını da oluşturan rastgele ormanların, GBMS'nin, SVM'lerin ve sinir ağlarının ML uyarlamalarını merak ediyorum.
Kısacası, bağımlı ve bağımsız değişkenlerim arasındaki ilişkilerin tutarlı tahminlerini elde etmek için makine sansürleme araçlarını sol sansürlü regresyon verilerine nasıl uygularım? İlk tercih R'de mevcut olan çözümler, ardından Python olacaktır.
Alkış,
Aaron