Tekrarlanan bir k-kat çapraz validasyonu gerçekleştirmeden önce verilerin normalleştirilmesi (sıfır ortalama ve birlik standart sapmasına sahip olmak için) aşırı sığdırma gibi herhangi bir olumsuz kontrole sahip mi?
Not: Bu #cases> toplam #features bir durum içindir
Bazı verilerimi bir günlük dönüşümü kullanarak dönüştürüyorum, sonra yukarıdaki gibi tüm verileri normalleştiriyorum. Daha sonra özellik seçimi yapıyorum. Sonra genelleştirilmiş sınıflandırıcı performansını denemek ve tahmin etmek için seçilen özellikleri ve normalize edilmiş verileri tekrarlanan 10 kat çapraz doğrulamaya uyguluyorum ve normalleştirmek için tüm verilerin kullanılmasının uygun olmayabileceğinden endişe ediyorum. Her kat için test verilerini, o kat için egzersiz verilerinden elde edilen normalleştirici verileri kullanarak normalleştirmeli miyim?
Herhangi bir görüş minnetle alındı! Bu soru açık görünüyorsa özür dileriz.
Düzenleme: Bu test (aşağıdaki önerileri doğrultusunda) CV önce normalizasyon CV içinde normalizasyon ile karşılaştırıldığında performans açısından çok fark yapmadığını buldum.