Tamam, bu yüzden 20: 1 kuralını göz önünde bulundurarak yeterince iyi bir örneğe sahip olduğumu düşünüyorum: toplam 7 aday belirleyici değişkeni için oldukça büyük bir örnek (N = 374).
Benim sorunum şudur: Ne kullanırsam tahmin değişkenleri kümesi ne olursa olsun, sınıflandırmalar% 100 özgüllük ve% 0 duyarlılıktan daha iyi olamaz. Bununla birlikte, tatmin edici olmayan, aday tahmin belirleyici değişkenleri (sapma yapamadığım) bir dizi verilen göz önüne alındığında, bu mümkün olan en iyi sonuç olabilir.
Ancak, yardım edemedim ama daha iyisini yapabileceğimi düşündüm, bu yüzden bağımlı değişkenin kategorilerinin neredeyse 4: 1 oranında oldukça dengesiz olduğunu fark ettim. Daha dengeli bir alt örnekleme sınıflandırmaları iyileştirebilir mi?