Daha verimli bir soru "öğrendiğim klasik istatistiklerde neden kullanılmadı?"
Öğretildiği seviyeye / seviyelere bağlı olarak, bu dersin içeriği (ve mevcut zamanı), çeşitli faktörlerin bir kombinasyonundan kaynaklanıyor olabilir. Genellikle önemli konular bir kenara bırakılır çünkü diğer materyaller bir nedenden ötürü öğretilmeli, daha sonraki derslerde ele alınabileceği ümidiyle.
En azından bazı duyularda, kavram uzun zamandır çeşitli insanlar tarafından kullanılmaktadır. Bazı bölgelerde diğerlerinden daha yaygındı. İstatistiğin pek çok kullanımı, ana bileşen olarak tahmin veya model seçimine sahip değildir (veya bazı durumlarda, hatta hiç) ve bu durumda, ayırma örneklerinin kullanımı, tahminin ana noktadan daha az kritik olabilir. Muhtemelen, bazı ilgili uygulamalarda daha erken bir aşamada olduğundan daha yaygın bir şekilde kullanılmalıdır, ancak bu bilinmemekle aynı şey değildir.
Tahmin üzerine odaklanan alanlara bakarsanız, modelinizi tahmin etmek için kullanmadığınız verileri tahmin ederek model değerlendirme kavramı kesinlikle etraftaydı (evrensel olmasa da). Bunu kesinlikle 1980'lerde yaptığım zaman serisi modellemesiyle yapıyordum, örneğin, en son verilerin örnek dışı tahmin performansının özellikle önemli olduğu yerlerde.
En azından bazı verileri dışarıda bırakma kavramı, örneğin regresyonda (silinen artıklar, PRESS, jacknife, vb.) Ve aykırı analizlerde kullanılmıştır.
Bu fikirlerin bazıları hala daha iyi bir geri dönüş verisine sahiptir. Stone (1974) [1], 1950 ve 60'lı yıllardan itibaren çapraz doğrulama (başlıktaki kelime ile) ile ilgili kağıtları ifade eder. Belki de niyetinize daha da yaklaştığında, Simon'a (1971) "yapı örneği" ve "geçerlilik örneği" terimlerini kullandığından bahseder - fakat aynı zamanda "Larson (1931) 'in örnek bir eğitim katında rastgele bölünmesi kullandığına işaret eder. regresyon çalışması ".
Çapraz doğrulama ve öngörüye dayalı istatistiklerin kullanılması gibi konular, 70'lerde ve 80'lerde istatistik literatüründe önemli ölçüde daha sık hale geliyordu, ancak temel fikirlerin çoğu bir süredir bile vardı sonra.
[1]: Stone, M., (1974)
"Çapraz Doğrulayıcı Seçim ve İstatistiksel Tahminlerin Değerlendirilmesi,"
Kraliyet İstatistik Kurumu Dergisi. Seri B (Metodolojik) , Cilt. 36, No. 2., s. 111-147