Sol sansürlü verilerde standart makine öğrenme araçlarını kullanma


11

Amacı, bir ithalatçının, distribütörlerin müşteri ağından ürünlerine olan talebi tahmin etmesini sağlamak olan bir tahmin uygulaması geliştiriyorum. Satış rakamları, talebi karşılamak için yeterli envanter olduğu sürece talep için oldukça iyi bir vekildir. Envanter sıfıra indirildiğinde (müşterimizin kaçınmasına yardımcı olmak istediğimiz durum), hedefi kaçırdığımızdan çok fazla şey bilmiyoruz. Yeterli tedarik olsaydı, müşteri kaç satış yapardı? Satış'ı basit bir hedef değişken olarak kullanan standart regresyon tabanlı ML yaklaşımları, zaman, tanımlayıcı değişkenlerim ve talep arasındaki ilişkinin tutarsız tahminlerini üretecektir.

Tobit modelleme, probleme yaklaşmanın en belirgin yoludur: http://en.wikipedia.org/wiki/Tobit_model . Verilerin sol elle sansürlenmiş yapısını da oluşturan rastgele ormanların, GBMS'nin, SVM'lerin ve sinir ağlarının ML uyarlamalarını merak ediyorum.

Kısacası, bağımlı ve bağımsız değişkenlerim arasındaki ilişkilerin tutarlı tahminlerini elde etmek için makine sansürleme araçlarını sol sansürlü regresyon verilerine nasıl uygularım? İlk tercih R'de mevcut olan çözümler, ardından Python olacaktır.

Alkış,

Aaron


3
Scrt-öğren wrt bir cevap görmek isterim.
tobip

R'de cran.r-project.org/web/packages/censReg/censReg.pdf kullanabilirsiniz . Python'da scikit-learn hakkında ikinci kez @tobip
Adrian

Yanıtlar:


1

Kısacası, bağımlı ve bağımsız değişkenlerim arasındaki ilişkilerin tutarlı tahminlerini elde etmek için makine sansürleme araçlarını sol sansürlü regresyon verilerine nasıl uygularım?

Bir olasılık yazabilir ve işareti eksi olarak çevirebilirseniz, birçok makine öğrenme modeli için kullanılabilecek bir kayıp fonksiyonunuz vardır. Gradyan yükseltmede bu genellikle model yükseltme olarak görülür . Bkz., Ör., Yükseltme Algoritmaları: Düzenleme, Tahmin ve Model Uydurma .

Tobit modeline örnek olarak bkz . Varsayılan Tahmin kağıdı için Degrade Ağacı Artırılmış Tobit Modelleri . Yöntem makalede belirtilen scikit-öğrenme dalı ile mevcut olmalıdır.

Aynı düşünce örneğin sağ sansürlü veriler için kullanılır, gbmve mboostsağ sansürlü veriler için Ar paketler.

L2

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.