Yanıtlar:
Veri Madenciliğine Giriş bölümünde Tan. al:
Çalışmalar, safsızlık ölçümü seçiminin karar ağacı indüksiyon algoritmalarının performansı üzerinde çok az etkisi olduğunu göstermiştir. Bunun nedeni birçok safsızlık önleminin birbiriyle oldukça tutarlıdır [...]. Gerçekten de, ağacı budamak için kullanılan stratejinin, son ağaç üzerinde safsızlık ölçümü seçiminden daha büyük bir etkisi vardır.
Bu nedenle, CART gibi Gini dizinini veya C4.5 gibi Entropi'yi kullanmayı seçebilirsiniz.
Entropy'yi, daha özel olarak C4.5'in Kazanım Oranını kullanacağım çünkü Quinlan: C4.5'in Makine Öğrenimi Programları tarafından iyi yazılmış kitabı kolayca takip edebilirsiniz.