Özel test setinin sonuçları modeli daha da hassaslaştırmak için kullanılamazken, özel test seti sonuçlarına dayanarak çok sayıda modelden model seçimi yapılmıyor mu? Tek başına bu süreç boyunca özel test setine fazla uyuşmaz mıydınız?
Göre : "Sözde Matematik ve Mali Şarlatanlık Out-of-the Numune Performansına Backtest overfitting Etkileri" Bailey ve arkadaşları tarafından aynı veri kümesinde değerlendirilen çok sayıda modelden en iyi olanı seçerken "tersine çevirmek" nispeten kolaydır. Bu Kaggle'ın özel skor tahtasında gerçekleşmiyor mu?
- Özel skor tahtasında en iyi performans gösteren modellerin, örnek dışı verileri en iyi şekilde genelleştiren modeller olması için istatistiksel gerekçeler nelerdir?
- Şirketler gerçekten kazanan modelleri kullanıyor mu yoksa özel liderlik panosu sadece "oyunun kurallarını" sağlamak için orada mı ve şirketler aslında sorunun tartışılmasından kaynaklanan içgörü ile daha mı ilgileniyor?