Bir pazardaki alıcılar ve satıcılar arasında "eşleşmeleri" gözlemlediğinizi varsayalım. Ayrıca, gelecekteki maçları tahmin etmek ve pazarın her iki tarafına önerilerde bulunmak için kullanmak istediğiniz alıcıların ve satıcıların özelliklerini de gözlemleyebilirsiniz.
Basitlik için, N alıcı ve N satıcı olduğunu ve her birinin bir eşleşme bulduğunu varsayalım. N ve (N-1) (N-1) eşleşmeyen maçlar var. Her şey dahil eğitim veri kümesinde N + (N-1) * (N-1) gözlemleri vardır ve bunlar büyük ölçüde geniş olabilir. Görünüşe göre (N-1) (N-1) eşleşmeden rastgele örnekleme ve bu azaltılmış veriler üzerinde bir algoritma eğitimi daha verimli olabilir. Sorularım:
(1) Bir eğitim veri seti oluşturmak için eşleşmeyenlerden örnekleme, bu sorunla başa çıkmak için makul bir yöntem midir?
(2) Eğer (1) doğruysa, (N-1) (N-1) yığınının ne kadar büyük olduğuna karar vermenin titiz bir yolu var mı?