Sorun, karar ağaçlarının oluşturulmasına işaret ediyor. Wikipedia'ya göre ' Gini katsayısı ' ' Gini katışıklığı ' ile karıştırılmamalıdır . Bununla birlikte, karar ağacı oluştururken her iki önlem de kullanılabilir - bunlar öğeler grubunu bölerken seçimlerimizi destekleyebilir.
1) 'Gini kirliliği' - standart bir karar ağacı yarma metriğidir (yukarıdaki bağlantıya bakınız);
2) 'Gini katsayısı' - Her bölme AUC kriterine göre değerlendirilebilir. Her bölme senaryosu için bir ROC eğrisi oluşturabilir ve AUC metrik değerini hesaplayabiliriz. Wikipedia'ya göre AUC = (GiniCoeff + 1) / 2;
Soru şudur: Bu iki önlem de aynı mı? Bir yandan, Gini katsayısının Gini safsızlığı ile karıştırılmaması gerektiği konusunda bilgilendirildim. Öte yandan, bu önlemlerin her ikisi de aynı şeyi yapmakta kullanılabilir - karar ağacının kalitesini değerlendirmek.