Kümeleme performansını değerlendirmeye çalışıyorum. Metriklerle ilgili skiscit-learn belgelerini okuyordum . ARI ve AMI arasındaki farkı anlamıyorum. Bana öyle geliyor ki aynı şeyi iki farklı şekilde yapıyorlar.
Belgelerden alıntı:
Ground_tre sınıfı atamaları label_true ve aynı sample_pred örneklerinin kümeleme algoritması atamaları hakkında bilgi verildiğinde, düzeltilmiş Rand endeksi , iki atamanın benzerliğini ölçen, permütasyonları göz ardı eden ve şans normalleştiren bir işlevdir .
vs
Zemin gerçeği sınıfı atamaları label_true ve aynı sample_pred örneklerinin kümeleme algoritması atamaları hakkında bilgi verildiğinde Karşılıklı Bilgi , iki atamanın anlaşmasını ölçen, permütasyonları göz ardı eden bir işlevdir ... AMI daha yakın zamanda önerildi ve şans.
Her ikisini de kümeleme değerlendirmemde kullanmalı mıyım yoksa bu gereksiz mi?