Son zamanlarda , belirli bir veri setinde bir k-NN sınıflandırıcısının kullanılmasını öneren bir makale ile karşılaştım . Yazarlar, farklı k değerleri için k-kat çapraz doğrulama yapmak ve mevcut en iyi hiperparametre konfigürasyonunun çapraz doğrulama sonuçlarını bildirmek için mevcut tüm veri örneklerini kullandı .
Bildiğim kadarıyla, bu sonuç önyargılı ve hiperparametre optimizasyonu gerçekleştirmek için kullanılmayan numuneler üzerinde bir doğruluk tahmini elde etmek için ayrı bir test setini tutmalıydılar.
Haklı mıyım Bu çapraz onaylamanın kötüye kullanımını açıklayan bazı referanslar (tercihen araştırma makaleleri) verebilir misiniz?