Düz İngilizce olarak Çapraz Doğrulama?

77

Veri analizi geçmişi olmayan birine çapraz onaylamayı nasıl tarif edersiniz ?

cross-validation

— Shane
kaynak

3

Bu soru, site adı teklifi ile ilgili herhangi bir karışıklığa yardımcı olmak içindir: meta.stats.stackexchange.com/questions/21/… .

— Shane,

54

Aşağıdaki durumu göz önünde bulundurun:

Ofisime gitmek için metroyu yakalamak istiyorum. Planım arabamı almak, metroya park etmek ve sonra da ofisime gitmek için trene binmek. Amacım her gün saat 8.15’de trene binmek, böylece ofisime zamanında ulaşabilmek. Aşağıdakilere karar vermem gerekiyor: (a) evimden ayrılmam gereken zaman ve (b) karakola gitmek için kullanacağım rota.

Yukarıdaki örnekte, iki parametrem var (yani, evden ve rotadan istasyona gitmek için ayrılma zamanım) ve bu parametreleri seçmem gerekiyor, öyle ki, istasyona sabah 8.15'e kadar ulaşacağım.

Yukarıdaki problemi çözmek için, hangi kombinasyonun 'en iyi' olduğunu görmek için Pazartesi, Çarşamba ve Cuma günleri farklı 'parametre' setlerini (örneğin, farklı kalkış ve rota kombinasyonları) deneyebilirim. Buradaki düşünce, bir kez en iyi kombinasyonu belirlediğimde, hedefime ulaşmak için her gün kullanabilirim.

Fazla Takma Problemi

Yukarıdaki yaklaşımla ilgili sorun, temelde tanımlayabileceğim en iyi kombinasyonun bir şekilde Pzt, Çar ve Cuma günleri için benzersiz olabileceği ve kombinasyonun Tue ve Per için işe yaramayabileceği anlamına gelebileceği anlamına gelebilir. Zaman ve rotaların en iyi birleşimini arayışımda, Pzt / Çar / Cuma günlerinde, Tue ve Per.

Kıyafet Yenileme İçin Bir Çözüm: Çapraz Doğrulama

Çapraz doğrulama, fazla uydurma için bir çözümdür. Fikir, en iyi parametre kombinasyonumuzu belirlediğimizde (bizim vaktimiz ve rotamızda), bu parametre setinin performansını farklı bir bağlamda test etmemizdir. Bu nedenle, seçimlerimizin o günlerde de çalışmasını sağlamak için Tue ve Thu'da test yapmak isteyebiliriz.

Analojiyi istatistiklere genişletme

İstatistiklerde benzer bir sorunumuz var. Bilmediğimiz bilinmeyen parametreleri tahmin etmek için genellikle sınırlı miktarda veri kullanırız. Eğer fazla kullanıyorsak, parametre tahminlerimiz mevcut veriler için çok iyi çalışacaktır, ancak bunları başka bir bağlamda kullandığımız zamanlar için de iyi sonuç vermeyecektir. Bu nedenle, çapraz doğrulama, parametre tahminlerinin, onları tahmin etmek için kullandığımız verilere özgü olmadığına dair bazı güvencelerimizi kanıtlayarak, yukarıdaki fazlalık sorunundan kaçınmaya yardımcı olur.

Tabii ki, çapraz doğrulama mükemmel değildir. Metro örneğimize geri dönersek, çapraz onaylamadan sonra bile, en iyi parametre seçimimiz, çeşitli sorunlar nedeniyle (örneğin inşaat, trafik hacmi değişimleri vb.) Bir ay boyunca çalışmayabilir.

— jbaums
kaynak

2

Teknik olarak, bu bekleme doğrulamadır ancak bir metro örneğini bir çapraz doğrulama bağlamına genişletme hayal edilebilir. Yardımcı olursa, çapraz onaylamaya özgü olan örneği ve metnin geri kalanını tekrar yazacağım.

@ srikant .. bir kelime olarak fazlaca vurgulanan kelime bir şeyin "aşırı" yapıldığını gösterir .. gereğinden fazla… yani ne yapılır? Değişken yok mu? Üzgünüm, pek çok kez bu terimin gereğinden fazla kullanıldığını duydum ve bu fırsatı size açıklamak için harcayacağım.

— ayush biyani

1

Bence bu cevap CV'nin elde tutma testinden ne kadar farklı olduğunun anahtarı olan kıvrımlar kavramı eklenerek daha da geliştirilebilir. Örnekte (Pazartesi için M, Salı için T, ..., Perşembe, R, ... kısaltması kullanılarak): Böylece en iyi kombinasyon için TWRF'ye bakarsınız ve bunun M, ardından MWRF üzerinde nasıl çalıştığını görürsünüz. T, vb. üzerinde çalışır. Dolayısıyla, her gün dört kez sorunun bir parçası olarak ve bir kez sorunun kontrolü olarak kullanılır, ancak hiçbir zaman sorun ve aynı rauntta kontrol edilmez.

— Wayne

43

Bunun en iyi şekilde aşağıdaki resim ile açıklandığını düşünüyorum (bu durumda k-kat çapraz onaylamayı gösteriyor):

alt metin

Çapraz doğrulama, özellikle veri miktarının sınırlı olabileceği durumlarda, öngörücü bir modelde aşırı yüklenmeye karşı koruma sağlamak için kullanılan bir tekniktir. Çapraz doğrulama işleminde, verilerin sabit bir şekilde katlanmasını (veya bölümlemesini) yaparsınız, analizleri her bir katlamada çalıştırır ve ardından genel hata tahminini ortalarsınız.

— Shane
kaynak

2

Bu sitede başka bir yerde yapılan tartışmalara göre, k-katlama çapraz doğrulamanın sadece bir tür çapraz onaylama olduğu ve bunun tanımlanmasının, çapraz onaylamanın ne olduğunu açıklayan genel bir iş yapmadığı anlaşılmaktadır.

— russellpierce

3

@drknexus: Bu adil, ama bunun k-kat olduğunu ve açıklamak için sürecin görselleştirilmesini sağlamak istediğimi söylüyorum.

— Shane,

Hızlı açıklama: Nfold = 4'ün test seti için% 25 olduğu durum; nfold = 5, test seti için% 20 anlamına gelir; nfold = 10, test setinde% 10 anlamına gelir ve bunun için: nfold = n, test setine yüzde 100 / n gittiğini gösterir?

— johnjps111

9

"Eğitimli modelin bağımsız verilerde iyi performans gösterdiğinden emin olarak egzersiz verilerinizi yürekten öğrenmekten kaçının."

— Andre Holzner
kaynak

3

Bu, cv'nin kendisinin bir tarifinden ziyade cv için motivasyondur.

— jbaums

6

Diyelim ki bazı süreçleri araştırıyorsunuz; açıklayan bazı veriler topladınız ve bir model oluşturdunuz (istatistiksel ya da ML önemli değil). Ama şimdi, tamam mı? Muhtemelen dayandığı verilere şüpheyle uyuyor, bu yüzden hiç kimse modelinizin düşündüğünüz kadar muhteşem olduğuna inanmayacak.
İlk fikir, verilerinizin bir alt kümesini ayırmak ve onu modelin geri kalan verileri üzerinde oluşturduğu yöntemi test etmek için kullanmaktır. Şimdi sonuç kesinlikle fazla yorulmadan-ücretsiz, yine de (özellikle küçük kümeler için), şansın yaver gitmesi ya da çekmesi (daha az) daha basit vakalar olabilirdi, tahmin etmesini (zorlaştırması) daha kolay ... Hata / iyilik tahmini, model karşılaştırması / optimizasyonu için işe yaramaz çünkü muhtemelen dağılımı hakkında hiçbir şey bilmiyorsunuz.
Şüphe duyduğunuzda kaba kuvvet kullanın, bu yüzden yukarıdaki işlemi tekrarlayın, doğruluk / hata / iyilikle ilgili birkaç tahmin toplayın ve bunları ortalayın - ve böylece çapraz doğrulama elde edersiniz. Daha iyi tahminler arasında bir histogram da elde edersiniz, böylece dağılımı yaklaşık olarak hesaplayabilir veya parametrik olmayan bazı testleri yapabilirsiniz.
Ve işte bu; Test treni bölmenin detayları, nadir bulunan durumlar ve eşdeğer oldukları küçük güç farklılıkları dışında, farklı CV türlerinin nedenidir. Gerçekten de büyük bir avantaj, çünkü onu kurşun geçirmez bir yöntem haline getiriyor; hile yapmak çok zor.

3

Eğitim sırasındaki test verilerine erişiminiz olmadığından ve modelinizin görülmeyen test verilerinde iyi çalışmasını istediğiniz için, testlerin küçük bir kısmını tekrar tekrar örnekleyerek bazı test verilerine erişiminiz varmış gibi davranırsınız. Eğitim verileriniz, modeli eğitirken bu seti kaldırın ve ardından düzenlenen seti test verilerinin bir vekili olarak ele alın (ve tutulan veriler üzerinde en iyi performansı veren model parametrelerini seçin). Eğitim verilerinden çeşitli altkümeleri rastgele örnekleyerek, bunları test verileri gibi göstermesini sağlayabilirsiniz (ortalama davranış anlamında) ve bu nedenle, öğrenilen model parametrelerinin de test verileri için iyi olacağını (ör. Modeliniz) görünmeyen veriler için iyi genelleştirir).

— ebony1
kaynak