Bir sınıflandırma problemini çözmek için kullandığım üç özelliğim var. Başlangıçta, bu özellikler boole değerleri üretti, bu yüzden pozitif ve negatif sınıflandırma kümelerinin ne kadar örtüştüğüne bakarak artıklıklarını değerlendirebilirim. Şimdi bunun yerine gerçek değerler (skorlar) üretmek için özellikleri genişlettim ve artıklıklarını tekrar analiz etmek istiyorum, ancak bunu nasıl yapacağım konusunda tam bir kayıptayım. Birisi bana bu konuda nasıl bir işaretçi veya fikir verebilir?
Bu sorunun çok belirsiz olduğunu biliyorum, çünkü çok güçlü bir istatistik kavrayışım yok. Benim için bir cevabınız yoksa, belki de kendimi daha iyi anlamama yardımcı olabilecek bazı sorularınız var.
Düzenleme: Şu anda bu konuda Wikipedia'ya göz atıyorum, istediğim bir korelasyon katsayısı olduğunu hissediyorum, ama hala bu doğru bir yaklaşım olup olmadığını ve birçok mevcut katsayılardan hangisinin uygun olduğundan emin değilim.
Düzenleme 2: Boole durumunda, her özellik için ilk önce doğru olduğu örnek kümesini oluşturdum. Daha sonra, iki özellik arasındaki korelasyon, bu setlerin birleşmesinin boyutu üzerindeki bu setlerin kesişme boyutudur. Bu değer 1 ise, bunlar tamamen gereksizdir, çünkü her zaman aynıdır. Eğer 0 ise, asla aynı değildirler.