Test verilerinden bir karışıklık matrisi elde etmek için iki adım atmanız gerekir:
- Test verileri için tahminler yapın
Örneğin model.predict_generator
, test üreticisinden ilk 2000 olasılığı tahmin etmek için kullanın .
generator = datagen.flow_from_directory(
'data/test',
target_size=(150, 150),
batch_size=16,
class_mode=None, # only data, no labels
shuffle=False) # keep data in same order as labels
probabilities = model.predict_generator(generator, 2000)
- Etiket tahminlerine dayalı olarak karışıklık matrisini hesaplayın
Örneğin, olasılıkları sırasıyla 1000 kedi ve 1000 köpek olduğu durumla karşılaştırın.
from sklearn.metrics import confusion_matrix
y_true = np.array([0] * 1000 + [1] * 1000)
y_pred = probabilities > 0.5
confusion_matrix(y_true, y_pred)
Test ve doğrulama verileri hakkında ek not
Keras belgeleri üç farklı veri kümesi kullanır: eğitim verileri, doğrulama verileri ve test verileri. Egzersiz verileri, model parametrelerini optimize etmek için kullanılır. Doğrulama verileri meta parametreler, örneğin dönem sayısı gibi seçimler yapmak için kullanılır. Bir modeli en uygun meta parametrelerle optimize ettikten sonra, test verileri model performansının adil bir tahminini almak için kullanılır.