dengesiz veri seti için eğitim yaklaşımları


16

Dengesiz bir test veri setim var. Pozitif grup 100 vakadan, negatif grup 1500 vakadan oluşur. Antrenman tarafında ise daha büyük bir aday havuzum var: Pozitif antrenman setinin 1200 vakası ve negatif antrenman setinin 12000 vakası var. Bu tür bir senaryo için birkaç seçeneğim var:

1) Tüm eğitim seti için ağırlıklı SVM kullanma (P: 1200, N: 12000)

2) Örneklenen eğitim setini (P: 1200, N: 1200) temel alan SVM kullanarak, 1200 negatif vaka 12000 vakadan örneklenir.

Hangi yaklaşımın daha iyi olduğuna karar vermek için herhangi bir teorik rehberlik var mı? Test veri seti oldukça dengesiz olduğundan, dengesiz eğitim setini de kullanmalı mıyım?


1
lütfen aşağıdaki soruları kontrol edin: “Nadir” olaylarla denetimli öğrenme ve SVM ile dengesiz çok sınıflı veri kümesini ele almanın en iyi yolu . Bu yardımcı olur mu ? Açıkçası, sorularınız oldukça benzer;).
steffen

Yanıtlar:



0

İkili Genişletilmiş Lojistik Regresyon, ROC tabanlı öğrenme, Destekleme ve Torbalama (Bootstrap toplama), Bağlantı tabanlı küme topluluğu (LCE), Bayesian Ağı, En yakın sentroid sınıflandırıcılar, Bayesian Teknikleri, Ağırlıklı kaba küme, k-NN

ve dengesizliği ele almak için birçok örnekleme yöntemi.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.