K-kat çapraz doğrulaması eğitim / doğrulama / test setleri bağlamına nasıl uyuyor?


14

Benim asıl sorum, k / kat çapraz doğrulamanın eğitim / doğrulama / test setlerine sahip olma bağlamında nasıl uyduğunu anlamaya çalışmakla ilgilidir (eğer bu bağlamda uyuyorsa).

Genellikle, insanlar verileri bir eğitim, validasyon ve test setine - örneğin Andrew Ng'in kursu başına 60/20/20 oranında) bölmekten söz ederler, böylece doğrulama seti model eğitimi için en uygun parametreleri tanımlamak için kullanılır.

Ancak, veri miktarı nispeten küçük olduğunda daha temsili bir doğruluk ölçüsü elde etmek umuduyla k-kat çapraz doğrulamayı kullanmak isterse, k-kat çapraz doğrulaması yapmanın tam olarak bu 60/20/20 ayrımında yapılması gerekir senaryo?

Örneğin, bu, eğitim ve test setlerini (verilerin% 80'i) gerçekten bir araya getireceğimiz ve doğruluk ölçümümüzü (açık bir 'test setine sahip olmakla etkili bir şekilde atarak) elde etmek için üzerlerinde k-kat çapraz doğrulama yapacağımız anlamına mı gelir? Öyleyse, hangi eğitimli modeli a) üretimde ve b) doğrulama setine karşı kullanmak ve en uygun eğitim parametrelerini belirlemek için kullanıyoruz? Örneğin, a ve b için olası bir cevap belki de en iyi modeli kullanmaktır.

Yanıtlar:


12

Çapraz doğrulama genellikle bir doğrulama setinden kaçınmaya yardımcı olur.

Eğitim / doğrulama / test veri setleriyle ilgili temel fikir aşağıdaki gibidir:

  1. Eğitim: Egzersiz verilerinde farklı hiperparametre seçeneklerine sahip farklı model türleri denersiniz (örneğin, farklı özellik seçimine sahip doğrusal model, farklı katman seçeneklerine sahip sinir ağı, farklı mtry değerlerine sahip rastgele orman).

  2. Doğrulama: Adım 1'deki modellerin performansını doğrulama kümesine göre karşılaştırır ve kazananı seçersiniz. Bu, eğitim veri setinin üzerine sığarak alınan yanlış kararların önlenmesine yardımcı olur.

  3. Test: Gerçekte ne kadar iyi performans gösterdiğini hissetmek için kazanan modelde test verisini denersiniz . Bu, 2. adımda ortaya konulan aşırı uyumu ortaya çıkarır. Burada, başka bir karar almayacaksınız. Bu sadece açık bir bilgidir.

Şimdi, doğrulama adımını çapraz doğrulama ile değiştirdiğinizde, verilere yapılan saldırı neredeyse aynı şekilde yapılır, ancak sadece bir eğitiminiz ve bir test veri setiniz vardır. Doğrulama veri kümesine gerek yoktur.

  1. Eğitim: Yukarıya bakınız.

  2. Doğrulama: Çapraz doğrulama performansıyla ilgili olarak Adım 1'in en iyi modelini seçmek için eğitim verilerinde çapraz doğrulama yaparsınız (burada, orijinal eğitim verileri tekrar tekrar geçici bir eğitim ve doğrulama kümesine ayrılır). Çapraz doğrulamada hesaplanan modeller, yalnızca tam eğitim setinde hesaplanan 1. Adımın en iyi modelini seçmek için kullanılır.

  3. Test: Yukarıya bakınız.


1
Teşekkürler! CV bağlamında, biri% 80 trene karşı% 20 test bölünmesine sahip olabilir. Daha sonra, verilerin% 80'inde bir model oluşturulabilir ve doğruluğu elde etmek için% 20'ye karşı test edilebilir. Farklı model varyasyonlarını denemek için, eğitim veri kümesinde (verilerin% 80'i) 10 kat CV yapılabilir - toplam verinin% 8'i üzerinde etkili bir şekilde eğitim ve her bir kattaki toplam verilerin% 72'sine karşı test. CV sonuçlarına dayanarak, optimal hiperparametre değerlerini belirleyebilir ve bunları tüm eğitim verileri (tam veri kümesinin% 80'i) üzerinde eğitilmiş yeni bir model oluşturmak ve kalan% 20 test veri kümesine karşı test etmek için kullanabilirsiniz. Doğru?
blu

3
Evet, her CV çalışmasında eğitim için% 72 ve onaylama için% 8 kullanacaksınız ;-)
Michael M

Müthiş yanıt @MichaelM. İç içe çapraz doğrulama (NCV) hakkında okuyordum ve kullanmam gerekip gerekmediğine karar vermekte zorlanıyorum ya da sadece CV için özetlediğinizi yapın. Ve tam olarak anladığım kadarıyla NCV, adım 3'e uygulanacaktı. 1 kazanan puan almak yerine, K kazanan puanları elde edersiniz (toplam koşuları K ile çarpma, adım 1-2 tekrarlanan K kez farkını% 80 tren verileriyle) ve daha sonra ortalama yapabilirsiniz. Yani sorular: 1) anlayışım doğru mu? 2) NCV kullanılması tavsiye edilir mi?
Aziz Javed

Kesinlikle haklısın. İç içe CV, yukarıda özetlenen "basit" yaklaşımdan daha güvenilir tahminler elde etmeye yardımcı olacaktır. Zaman izin verirse, kesinlikle bir seçenektir. Nihai modelin hangi veri kümesinde iç içe CV'de hesaplandığını biliyor musunuz? Tam olarak mı?
Michael M

3

K

Eğitim / validasyon / teste bölünmek de bir örnekleme stratejisidir.

K

K1

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.