MNIST veri kümesini sınıflandırmayla ilgili sorunu ele alalım.
Göre Yann LeCun en MNIST bir Web 'Ciresan ve diğ.' Evrimsel Sinir Ağı kullanılarak MNIST test setinde% 0.23 hata oranı elde edildi.
olarak ayarlanmış MNIST eğitimini , olarak ayarlanmış MNIST testini , h 1 olarak kullanarak elde ettikleri son hipotezi ve h_ kullanarak MNIST Test setindeki hata oranını gösterelim. , . E t e s t ( h 1 ) = 0.0023
Bunların bakış açısı içinde, bu yana rastgele bağımsız olarak giriş boşluğundan test seti örneklenir , gittikleri son hipotez bu dışı örnek hata performansını ısrar edilebilir olduğu Hoeffding Eşitsizliği burada. h 1 E o u t ( h 1 ) P [ | E o u t ( h 1 ) - E t e s t ( h 1 ) | < ϵ | ] ≥ 1 - 2 E 2 ε 2 N t l e s t , N t l e s t = |
Başka bir deyişle, en azından olasılık ,
Başka bir bakış açısı düşünelim. Bazı kişilerin MNIST test setini iyi sınıflandırmak istediğini varsayalım. Bu yüzden önce Yann LeCun'un MNIST Web Sayfasına baktı ve 8 farklı model kullanan başkaları tarafından elde edilen aşağıdaki sonuçları buldu,
8 model arasından MNIST test setinde en iyi performansı gösteren modelini seçti .
Onun için, öğrenme işlemi hipotez çekme test seti ile en iyi performansı D t l e s t bir hipotez kümesinden lH t r bir i , n , e d = { h 1 , h 2 , . . , h 8 } .
Bu nedenle, test seti 'deki hata bu öğrenme süreci için' örnek içi 'hatasıdır, bu nedenle sonlu hipotez setleri için bağlı VC'yi aşağıdaki eşitsizlik gibi uygulayabilir. P [ | E o u t ( g ) - E i n ( g ) | < Ε ] ≥ 1 - 2 | H t r a i n e d | e 2 ϵ 2 N
Bu sonuç, modeli birkaç model arasında en iyi performansı seçersek, test setinde aşırı uyum olabileceğini gösterir.
Howerver, bu iki eşitsizliğin uyumsuz olduğu açıktır.
Nerede yanlış yapıyorum? Hangisi doğru, hangisi yanlış?
İkincisi yanlışsa, bu durumda sonlu hipotez kümeleri için VC'ye bağlı uygulamanın doğru yolu nedir?