Performansını geri test etmek istediğim bazı öngörülü modellerim var (yani, veri setimi al, önceki bir noktaya "geri sar" ve modelin prospektif olarak nasıl performans göstereceğini görüyorum).
Sorun şu ki, bazı modellerim etkileşimli bir süreçle oluşturuldu. Örneğin, Frank Harrell'in Regresyon Modelleme Stratejilerindeki tavsiyeyi takiben, bir modelde, özellikler ve yanıt arasındaki olası doğrusal olmayan ilişkileri ele almak için kısıtlı kübik splinelar kullandım. Her spline'ın serbestlik derecesini, alan bilgisi ve tekli birlik gücü ölçülerinin bir kombinasyonuna dayanarak ayırdım. Ancak, modelime izin vermek istediğim özgürlük dereceleri, geri test yaparken önemli ölçüde değişen veri kümesinin boyutuna açıkça bağlı. Modelin geri test edildiği her sefer için serbestlik derecelerini ayrı ayrı seçmek istemezsem, diğer seçeneklerim nelerdir?
Başka bir örnek olarak, şu anda yüksek kaldıraçlı noktalar bularak aykırı algılama üzerinde çalışıyorum. Bunu elle yapmaktan mutlu olsaydım, her yüksek kaldıraçlı veri noktasına bakar, verilerin temiz olup olmadığını kontrol eder ve ya filtreleyebilir ya da elle temizleyebilirim. Ama bu bir sürü alan bilgisine dayanıyor, bu yüzden süreci nasıl otomatikleştireceğimizi bilmiyorum.
Hem (a) model oluşturma sürecinin interaktif parçalarını otomatik hale getirme genel sorununa, hem de (b) bu iki durum için özel tavsiyeye ilişkin tavsiye ve çözümleri takdir ediyorum. Teşekkürler!