Bu soruyu tekrar okuduktan sonra, size aşağıdaki sınırı verebilirim:
B1 - δ
E [ E( h ) ] ≤ E^( h ) + B günlüğü1δ2 m-----√
m1 - δ
mE [ E( h ) ] genelleme hatasıdır ve E^( h ) hipotez için test hatasıdır.
Lütfen sadece çapraz doğrulama hatasını veya test hatasını bildirmeyin , bunlar sadece nokta tahminleri olduğu için genel olarak anlamsızdır.
Kayıt için eski gönderi:
Sorunuzu tamamen anladığımdan emin değilim, ama buna bir bıçakla bakacağım.
İlk olarak, model seçimi için bir tahmin aralığını nasıl tanımlayacağınızdan emin değilim, çünkü anladığım kadarıyla, tahmin aralıkları bazı dağıtım varsayımları yapar. Bunun yerine, rastgele bir değişkeni bazı olasılıklar için varyansıyla bağlayan konsantrasyon eşitsizlikleri elde edebilirsiniz. Konsantrasyon eşitsizlikleri, gelişmiş artırma teorisi de dahil olmak üzere düşünce makinesi öğreniminde kullanılır. Bu durumda, genelleme hatasını (genel olarak hatanız, görmediğiniz noktalar) ampirik hatanızla (test setindeki hatanız) artı bazı karmaşıklık terimiyle ve varyansla ilgili bir terimle sınırlandırmak istersiniz.
Şimdi, son derece yaygın olan çapraz doğrulama hakkında bir yanlış anlaşılmayı ortadan kaldırmam gerekiyor. Çapraz doğrulama size sadece bir SABİT ÖRNEK BOYUT İÇİN bir modelin beklenen hatası hakkında tarafsız bir tahmin verecektir. Bunun kanıtı yalnızca dışarıda bırakma protokolü için geçerlidir. Bu aslında oldukça zayıftır, çünkü size varyans hakkında hiçbir bilgi vermez. Öte yandan, çapraz doğrulama, teorik olarak en iyi çözüm olan yapısal risk minimizasyonu çözümüne yakın bir model döndürecektir. Kanıtı ekte şu adreste bulabilirsiniz: http://www.cns.nyu.edu/~rabadi/resources/scat-150519.pdf
Peki nasıl bir genelleme sınırı türetilir? (Genelleme sınırının temel olarak belirli bir model için genelleme hatasıyla ilgili bir tahmin aralığı olduğunu unutmayın). Bu sınırlar algoritmaya özgüdür. Ne yazık ki, makine öğreniminde yaygın olarak kullanılan tüm algoritmalar için (artırıcı dahil) sınır koyan tek bir ders kitabı var. Kitap Mohri, Rostamizadeh ve Talwalkar'ın Makine Öğrenmenin Temelleri (2012). Materyali kapsayan ders slaytları için, Mohri'nin web sayfasında bulabilirsiniz: http://www.cs.nyu.edu/~mohri/ml14/
İstatistiksel Öğrenmenin Unsurları önemli ve biraz yararlı bir kitap olmasına rağmen, çok titiz değildir ve algoritmalar ile ilgili çok önemli teknik ayrıntıları atlar ve her türlü genelleme sınırını tamamen atlar. Makine Öğrenmenin Temelleri, makine öğrenimi için en kapsamlı kitaptır (bu alandaki en iyilerden bazıları tarafından yazıldığı gibi mantıklıdır). Ancak, ders kitabı ileri düzeydedir, bu yüzden teknik ayrıntılara dikkat edin.
Artırmaya yönelik genelleme burada (kanıtla) bulunabilir: http://www.cs.nyu.edu/~mohri/mls/lecture_6.pdf
Umarım bunlar sorunuzu cevaplamak için yeterli işaretçilerdir. Tam bir cevap vermekte tereddüt ediyorum, çünkü ön tartışmaların yanı sıra gerekli tüm ayrıntıların üzerinden geçmek yaklaşık 50 sayfa alacak ...
İyi şanslar!