Veri madenciliği yöntemlerini incelerken iki ana kategori olduğunu anladım:
Tahmin yöntemleri:
- sınıflandırma
- gerileme
Açıklayıcı yöntemler:
- Kümeleme
- İlişkilendirme kuralları
Konum, aktivite, pil seviyesine (eğitim modeli için girdi) dayalı olarak kullanıcı kullanılabilirliğini (çıktı) tahmin etmek istediğim için, "Öngörücü yöntemler" i seçeceğimin açık olduğunu düşünüyorum, ancak şimdi seçim yapamıyorum sınıflandırma ve regresyon. Şimdiye kadar anladığım kadarıyla, sınıflandırma sorunumu çözebilir, çünkü çıktı "mevcut" veya "mevcut değil".
Sınıflandırma bana kullanıcının mevcut olma veya mevcut olma olasılığını (veya olasılığını) sağlayabilir mi?
Çıktıda olduğu gibi sadece 0 (mevcut değil) veya 1 (mevcut) için değil, aynı zamanda şöyle bir şey olurdu:
- mevcut
- müsait değil
Bu sorun regresyon kullanılarak da çözülebilir mi?
Regresyonun sürekli çıkış için kullanıldığını anlıyorum (sadece 0 veya 1 çıkış değil), ancak çıkış kullanıcı kullanılabilirliğinin sürekli değeri olamaz (çıkış anlamı kullanıcı kullanılabilir, dolaylı olarak kullanıcı kullanım dışı).