Her vekil model için ızgara araması yaptıktan sonra, birkaç şeyi kontrol edebilir ve kontrol etmelisiniz:
- optimize edilmiş parametrelerin değişimi (burada ve C ).
Optimal parametreler kararlı mı? Değilse, başınız büyük belada.γC
- İç ve dış çapraz doğrulamanın rapor edilen performansını karşılaştırın.
İç (yani ayarlama) çapraz doğrulaması dıştan (son modelin doğrulaması) çok daha iyi görünüyorsa, o zaman da başınız belada: aşırı uyuyorsunuz. Ayarlanan parametrelerin hiç optimal olmaması konusunda önemli bir risk vardır. Bununla birlikte, dış çapraz doğrulama düzgün bir şekilde yapılırsa (tüm test setleri ilgili vekil modellerden gerçekten bağımsızsa), en azından hala modelin performansı hakkında tarafsız (!) Bir tahmininiz vardır. Ancak bunun en uygun olduğundan emin olamazsınız.
- Optimum ne kadar belirgindir? Yetersiz parametreler için performans hızla düşüyor mu? Optimum performans ne kadar iyi?
Model seçimiyle aşırı sığdırma hakkında söylenecek çok şey var. Bununla birlikte, hem varyansın hem de iyimser önyargının gerçekten zarar verebileceğini unutmayın.
- varyans, yanlışlıkla gerçekten optimal hiper parametrelerden oldukça uzakta olabileceğiniz anlamına gelir.
- aynı zamanda önyargı da incinebilir: eğer fazla takıyorsanız, birçok modelin iç çapraz doğrulamaya mükemmel göründüğü durumlarla karşılaşabilirsiniz (ancak gerçekten değiller). Bu durumda, ayarlamalar yoldan çıkabilir, çünkü modeller arasındaki farkları tanımıyor.
- Önyargı hiper parametrelere bağlıysa, büyük beladasınız demektir.
Bir örnekle ilgileniyorsanız ve Almanca okuyabiliyorsanız, Diplom tezimi çevrimiçi yapabilirim.
Deneyimlerime göre, hiperparametreleri ayarlamak aşırı uyum için son derece etkili bir fikirdir ...
Şimdi, aşırı taktığınızı fark ederseniz, esas olarak iki seçeneğiniz vardır:
- optimizasyonun fazla takmayla ilgili bir sorunu olduğunu ancak bununla sonuçlanan uygun bir dış doğrulama yaptığınızı bildiriniz (dış çapraz doğrulama sonuçları).
- modelin karmaşıklığını kısıtlar. Bunu yapmanın bir yolu hiper parametrelerini düzeltmektir:
Hiper parametreleri her bir eğitim setine ayarlamaya alternatif olarak, parametreleri (hiper) önceden belirtebilirsiniz (yani önceden sabitleyebilirsiniz). Bunu modellerim için olabildiğince çok yapıyorum, genellikle sizden daha az vakaya sahibim, aşağıya bakın.
Ancak, bu sabitleme gerçekten ve dürüst bir şekilde önceden yapılmalıdır: örneğin, bir meslektaşımdan benzer bir veri setinde (bağımsız deney) optimize edilmiş parametrelerini sordum veya parametreler üzerinde ızgara araması da dahil olmak üzere bir ön deneme yaptım. Bu ilk deney daha sonra gerçek deney ve veri analizi için bazı deneysel parametrelerin yanı sıra model parametrelerini düzeltmek için kullanılır. Daha fazla açıklama için aşağıya bakın.
Elbette, otomatik olarak optimize edilmiş modellerde (çift veya iç içe doğrulama) uygun testler yapmak mümkündür, ancak örnek boyutunuz verilerin iki kez bölünmesine izin vermeyebilir .
Bu durumda, IMHO, modelleme parametrelerinin nasıl seçileceğine ilişkin profesyonel deneyim kullanılarak oluşturulmuş bir model için dürüst bir tahminin, bir tür otomatik olarak optimize edilmiş modele ilişkin overoptimistik bir tahminin rapor edilmesinden çok daha iyi olduğunu bildirir.
Durumla ilgili başka bir bakış açısı, ticaret yapmak zorunda olduğunuz
- parametre optimizasyonu için başka bir grup vakayı bir kenara bırakması nedeniyle daha kötü performans (daha küçük eğitim örnek boyutu => daha kötü model, ancak "optimal" parametreler)
- uzman tarafından yetersiz parametre sabitlemesi nedeniyle daha kötü performans (ancak daha büyük egzersiz verilerinde).
Benzer bir soruya benzer bazı düşünceler: /stats//a/27761/4598
Parametrelerin sabitlenmesi ve Dikran Marsupial'ın yorumları
Dikran Marsupial'ın makalesinde kullandığı hiper-parametreler terimini kullanıyorum (cevabındaki bağlantı)
Spektroskopik verilerle çalışıyorum. Bu, veri analizi ve modellemesinin genellikle biraz ön işleme içerdiği bir tür ölçümdür. Bu hiper-parametreler olarak görülebilir (örneğin, taban çizgisi için hangi polinom sırası kullanılmalı? Hangi ölçüm kanalları dahil edilmelidir?). Svm parametrelerinize daha yakın olan başka kararlar da vardır, örneğin "gerçek" model eğitilmeden önce boyutsal azaltma için bir PCA yapılırsa kaç ana bileşen kullanılır? Ve bazen SVM sınıflandırmasını da kullanıyorum, bu yüzden SVM parametrelerine karar vermeliyim.
Şimdi, IMHO hiper parametrelerini düzeltmenin en iyi yolu, uygulamadan gelen nedenleriniz varsa. Örneğin genellikle fiziksel / kimyasal / biyolojik nedenlerle ne tür bir taban çizgisinin kullanılacağına karar veririm (örn. Örnek hakkında bilgi ve bundan sonra gelen spektroskopik davranış). Ancak, SVM parametrelerine yardımcı olan böyle bir argümanın farkında değilim ...
Yukarıda bahsettiğim ön deneyler durumu aşağıdaki gibidir:
- bir grup hücrenin verilerini alıyoruz (farklı hücre çizgilerini ayırt etmek istiyoruz).
Spektrumlar analiz edilir, yinelenen çift çapraz doğrulama SVM çalıştırılır (hesaplama sunucusunda bir veya iki gece geçirilir).
- γC
- Ayrıca belirli bir aşırı sığdırmayı gözlemliyorum: dış çapraz doğrulama, ayarlama sonuçları kadar iyi değil. Beklendiği gibi.
- Yine de, hiper parametrelerin ayar aralığı üzerinde performans farklılıkları vardır ve ayar ızgarası üzerindeki performans makul derecede pürüzsüz görünür. İyi.
Sonuç olarak: son hiper-parametrelerin optimal olduğundan emin olamasam da, dış çapraz doğrulama bana vekil modellerin performansı hakkında doğru bir tahmin verir.
Deneysel kısımda, deney düzeneğindeki bazı değişikliklere karar verdik (verilerin gürültüsüne giden sinyali etkilemeyen, ancak cihazın otomatikleştirilmesinde bir adım daha ileri gidenler)
Deneysel ayarları geliştiriyoruz ve yeni spektrumlar elde ediyoruz. Hücreler olduğu gibi, taze olarak büyütülmeleri gerekir. Yani yeni veri seti bağımsız kültür gruplarıdır.
Şimdi kararla yüzleşiyorum: İç çapraz doğrulamayı "atlamalı" ve sadece eski verilerle belirlediğim hiper parametrelerle mi gitmeliyim?
- Yukarıda belirtildiği gibi, bu önceden belirlenmiş hiper parametrelerin optimal olmaması riskini taşıyorum.
- Ancak, iç (ayarlama) çapraz doğrulamasını yaparak gerçekten en uygun hiper parametrelerini elde edeceğinden de emin olamıyorum.
- Bununla birlikte, eski verilerdeki ayar sabitti.
- Optimizasyonu yapmak Daha az örnek üzerinde çalışacağım: Zaten çok az örnek (TM) olduğu için, ikinci bir çapraz doğrulama turu için daha fazla örnek ayırırsam daha kötü modeller elde etmeyi beklemeliyim.
Bu durumda, sabit parametrelerle gitmeye karar verdim (benzer verilerdeki deneyim ve gelecekte bu kararları büyük verilerle tekrar kontrol etmek de dahil olmak üzere "ödevimizi" yapmak zorunda kalacağımızı bilerek).
Önemli olan , dış olanı değil, iç kısmı ( çapraz geçerliliği ayarlama ) atladığımdır . Sabit hiper-parametrelerle, muhtemelen yetersiz bir modelin performansının tarafsız bir tahminini alırım. Bu tahminin yüksek varyansa tabi olduğu doğrudur, ancak bu varyans iç ayarlamayı yapsam da yapmasam da temelde aynıdır.
Dış çapraz vaidasyonu atlamak Ayarlanmış bir modelin iyimser bir şekilde taraflı bir tahminini alırım - uygulamaya ve verilere bağlı olarak değersiz olabilir (çok fazla aşırı uzamsalsa) ve iyimser önyargı açıkça kabul edilemez olabilir.