Doğrulama kaybı ve doğruluğu sabit kalır


12

Bu yazıyı bir dizi tıbbi görüntüye uygulamaya çalışıyorum . Bunu Keras'ta yapıyorum. Ağ temel olarak 4 döngü ve maksimum havuz katmanından sonra tamamen bağlı bir katman ve yumuşak maks sınıflandırıcıdan oluşur.

Bildiğim kadarıyla gazetede bahsedilen mimariyi takip ettim. Bununla birlikte, validasyon kaybı ve doğruluğu tümüyle sabit kalır. Doğruluk ~% 57.5 olarak sabit görünüyor.

Nerede yanlış gidiyor olabilirim herhangi bir yardım büyük mutluluk duyacağız.

Kodum:

from keras.models import Sequential
from keras.layers import Activation, Dropout, Dense, Flatten  
from keras.layers import Convolution2D, MaxPooling2D
from keras.optimizers import SGD
from keras.utils import np_utils
from PIL import Image
import numpy as np
from sklearn.utils import shuffle
from sklearn.cross_validation import train_test_split
import theano
import os
import glob as glob
import cv2
from matplotlib import pyplot as plt

nb_classes = 2
img_rows, img_cols = 100,100
img_channels = 3


#################### DATA DIRECTORY SETTING######################

data = '/home/raghuram/Desktop/data'
os.chdir(data)
file_list = os.listdir(data)
##################################################################

## Test lines
#I = cv2.imread(file_list[1000])
#print np.shape(I)
####
non_responder_file_list = glob.glob('0_*FLAIR_*.png')
responder_file_list = glob.glob('1_*FLAIR_*.png')
print len(non_responder_file_list),len(responder_file_list)

labels = np.ones((len(file_list)),dtype = int)
labels[0:len(non_responder_file_list)] = 0
immatrix = np.array([np.array(cv2.imread(data+'/'+image)).flatten() for image in file_list])
#img = immatrix[1000].reshape(100,100,3)
#plt.imshow(img,cmap = 'gray')


data,Label = shuffle(immatrix,labels, random_state=2)
train_data = [data,Label]
X,y = (train_data[0],train_data[1])
# Also need to look at how to preserve spatial extent in the conv network
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=4)
X_train = X_train.reshape(X_train.shape[0], 3, img_rows, img_cols)
X_test = X_test.reshape(X_test.shape[0], 3, img_rows, img_cols)
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')

X_train /= 255
X_test /= 255

Y_train = np_utils.to_categorical(y_train, nb_classes)
Y_test = np_utils.to_categorical(y_test, nb_classes)

model = Sequential()

## First conv layer and its activation followed by the max-pool layer#
model.add(Convolution2D(16,5,5, border_mode = 'valid', subsample = (1,1), init = 'glorot_normal',input_shape = (3,100,100))) # Glorot normal is similar to Xavier initialization
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size = (2,2),strides = None))
# Output is 48x48

print 'First layer setup'
###########################Second conv layer#################################
model.add(Convolution2D(32,3,3,border_mode = 'same', subsample = (1,1),init = 'glorot_normal'))
model.add(Activation('relu'))
model.add(Dropout(0.6))
model.add(MaxPooling2D(pool_size = (2,2),strides = None))
#############################################################################

print ' Second layer setup'
# Output is 2x24

##########################Third conv layer###################################
model.add(Convolution2D(64,3,3, border_mode = 'same', subsample = (1,1), init = 'glorot_normal'))
model.add(Activation('relu'))
model.add(Dropout(0.6))
model.add(MaxPooling2D(pool_size = (2,2),strides = None))
#############################################################################
# Output is 12x12

print ' Third layer setup'
###############################Fourth conv layer#############################
model.add(Convolution2D(128,3,3, border_mode = 'same', subsample = (1,1), init = 'glorot_normal'))
model.add(Activation('relu'))
model.add(Dropout(0.6))
model.add(MaxPooling2D(pool_size = (2,2),strides = None))
############################################################################# 

print 'Fourth layer setup'

# Output is 6x6x128
# Create the FC layer of size 128x6x6#
model.add(Flatten()) 
model.add(Dense(2,init = 'glorot_normal',input_dim = 128*6*6))
model.add(Dropout(0.6))
model.add(Activation('softmax'))

print 'Setting up fully connected layer'
print 'Now compiling the network'
sgd = SGD(lr=0.01, decay=1e-4, momentum=0.6, nesterov=True)
model.compile(loss = 'mse',optimizer = 'sgd', metrics=['accuracy'])

# Fit the network to the data#
print 'Network setup successfully. Now fitting the network to the data'
model. fit(X_train,Y_train,batch_size = 100, nb_epoch = 20, validation_split = None,verbose = 1)
print 'Testing'
loss,accuracy = model.evaluate(X_test,Y_test,batch_size = 32,verbose = 1)
print "Test fraction correct (Accuracy) = {:.2f}".format(accuracy)

Eğitim kaybı azalıyor mu?
Jan van der Vegt

Hayır, eğitim kaybı da sabit kalır.
Raghuram

Uygun çağrınızda herhangi bir doğrulama verisi veya validation_split belirlemediniz, neyi geçerli kılar? Yoksa test mi demek istediniz?
Jan van der Vegt

Bunu denedikten sonra. Yok olarak ayarlamadan önce validation_split = 0.2 ayarını yaptım ve bununla da denedim.
Raghuram

2
Eğitim kaybının daha düşük olup olmayacağını görmek için bir partiyi birçok kez takabilir misiniz?
Jan van der Vegt

Yanıtlar:


4

MSE'yi kayıp fonksiyonu olarak kullandığınız anlaşılıyor, kağıda bir bakıştan NLL (çapraz entropi) kullandıkları anlaşılıyor, MSE'nin diğer konular arasında veri dengesizliğine duyarlı olduğu düşünülüyor ve sorunun nedeni olabilir deneyim, ben senin durumunda categorical_crossentropy kaybı kullanarak eğitim denemek istiyorum, dahası 0.01 öğrenme oranı çok büyük görünüyor onunla oynamaya çalışacağım ve 0.001 veya hatta 0.0001 deneyin


2

Burada biraz geç kalmama rağmen, yakın zamanda benzer bir sorunu çözmeme yardımcı olduğu için iki sentimi koymak istiyorum. Kurtarıma gelen, kategorik çapraz entropi kaybının yanı sıra özellikleri (0,1) aralığına ölçeklendirmekti. Bununla birlikte, özellik ölçeklendirmesinin yalnızca özelliklerin farklı metriklere ait olması ve benim durumumda olduğu gibi birbirine göre çok daha fazla varyasyona (büyüklük sıralarında) sahip olması durumunda yardımcı olduğunu belirtmek gerekir. Ayrıca, hingemaksimum marj sınıflandırıcıları genellikle özellik değerleri arasındaki mesafelere duyarlı olduğundan, kayıp kullanıldığında ölçeklendirme gerçekten yararlı olabilir . Umarım bu gelecekteki ziyaretçilere yardımcı olur!

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.