Kısa cevap: Her iki validasyon tekniği bir dizi modelin eğitimini ve testini içerir.
En iyi nasıl yapılacağı hakkında uzun cevap: Elbette buna bağlı. Ancak burada, yeniden örnekleme ile ilgili kararlarımı yönlendirmek için kullandığım bazı düşünceler. Ben kemometrikçiyim, bu yüzden bu stratejiler ve terimler az çok analitik-kimyasal problemlerle yakından ilgilidir.
Düşüncelerim biraz açıklamak gerekirse, ben olarak doğrulama düşünüyorum ölçmek gibi model kalitesi ve eğitimin ölçülmesi oldukça güçlü benzetme bu potansiyel ölçüm diğer her türlü - Model parametrelerini.
Validasyon konusunda bu yaklaşımlara iki farklı bakış açısı vardır:
yeniden örnekleme doğrulaması için geleneksel bir bakış açısı: yeniden örneklenen veri kümesi (bazen vekil veri kümesi veya altkümesi olarak da adlandırılır) pratik olarak orijinal (gerçek) veri kümesiyle aynıdır.
Bu nedenle, vekil veri setine uyan bir "vekil model" pratik olarak tüm gerçek veri setine uyan modelle aynıdır. Ancak bazı örnekler vekil veri kümesinin dışında bırakılır, model bunlardan bağımsızdır. Bu nedenle, dışarıda bırakılan veya önyükleme dışı örnekleri, vekil model için bağımsız doğrulama seti olarak alıp sonucu tüm veri modelinin yaklaşımı olarak kullanıyorum.
Bununla birlikte, vekil model genellikle tüm veri modeliyle gerçekten eşdeğer değildir: eğitim için daha az örnek kullanıldı (bootstrap için bile, farklı örneklerin sayısı daha azdır). Öğrenme eğrisi arttığı sürece, vekil model ortalama olarak tüm veri modelinden biraz daha kötüdür. Bu, yeniden örnekleme doğrulamasının iyi bilinen kötümser önyargısıdır (iyimser bir önyargı ile sonuçlanırsanız, genellikle sol / oob test setinin modelden bağımsız olmadığının bir göstergesidir).
İkinci bakış açısı, yeniden örneklenen veri kümesinin, tüm veri kümesinin bozuk bir versiyonu olduğudur. Vekil modellerin (ya da dışarıda bırakılan / oob örnekleri için tahminlerinin) tüm veri modelinden nasıl farklı olduğunu incelemek, eğitim verilerine göre model istikrarı hakkında bir şeyler söyler.
Bu açıdan bakıldığında, vekil modeller tekrarlanan ölçümlere benzer. Senin görevin bütün bir cevher treninin bazı mineral içeriğini ölçmek olduğunu varsayalım. Cevher homojen değildir. Böylece farklı konumlardan fiziksel örnekler alıyorsunuz ve daha sonra genel içeriğe ve trendeki varyasyonuna bakıyorsunuz. Benzer şekilde, modelinizin istikrarlı olmayabileceğini düşünüyorsanız, yedek modellerin genel performansına ve varyasyonuna bakabilirsiniz.
n
Genellikle vakaları yeniden örneklendiririm, örneğin bir vaka = bir hastanın tüm ölçümleri. O zaman çanta dışı tüm hastalar eğitim verilerinde hiçbir ölçüm yapılmaz. Bu, bir vakanın ölçümlerinin, diğer vakaların ölçümlerine kıyasla daha benzer olduğunu biliyorsanız (veya en azından bu olasılığı hariç tutamazsanız) faydalıdır.
Yeniden örnekleme doğrulaması, bilinmeyen örnekler için performansı ölçmenize izin vermez . Ek olarak, gelecekteki bilinmeyen numunelerin (enstrümantal sürüklenme!) Performansını ölçmek istiyorsanız, "gelecekte" ölçülen bir test setine ihtiyacınız vardır, yani tüm eğitim örnekleri ölçüldükten belirli bir süre sonra. Analitik kimyada buna, örneğin enstrümanınızın kalibrasyonunu ne sıklıkta yeniden yapmanız gerektiğini öğrenmek istiyorsanız (her belirleme için günlük, haftalık, aylık, ...)
Önyükleme ve çapraz doğrulama terminolojisi :
- değiştirme ile yeniden örnekleme genellikle bootstrap olarak adlandırılır,
- yedek çapraz doğrulama olmadan yeniden örnekleme.
Her ikisinde de bir çeşit tabakalaşma olabilir. Tarihsel olarak, çapraz validasyon için ayırma (en azından kemometride) çoğu zaman rastgele olmayan bir şekilde, örneğin kalibrasyon için abcabc..abc (veri kümesi olarak sıralanmış veri seti) 3 kat çapraz validasyonunda yapılmıştır. çok az vakanız varsa (fiziksel örnekler) ve tüm veri aralığınızın kapsandığından emin olmak istiyorsanız.
Her iki teknik de genellikle birkaç kez tekrarlanır / tekrarlanır. Yine tarihsel nedenlerden dolayı ve en azından kemometride, k-kat çapraz doğrulama genellikle k modellerinin eğitimi ve test edilmesi anlamına gelir (her biri eğitimde yer almayan verilerin 1 / k'ı ile test edilmiştir). Böyle rastgele bir bölünme tekrarlanırsa, insanlar yinelenen veya yinelenen çapraz doğrulama olarak adlandırılır.
kknnn
- Önyükleme işleminin, ilk önce yinelenen ölçümleri kaldıran bazı model uydurma teknikleri için uygun olmadığını unutmayın.
- Bazı bootstrap varyantları vardır, örneğin .632-bootstrap ve .632 + -bootstrap
kk