Diyelim ki iki çok değişkenli veri kümesi veriliyor, eski bir tane ve yeni bir tane var ve bunların aynı süreç tarafından (modeliniz olmayan) tarafından oluşturulmuş olması gerekiyor, ama belki de toplama / yaratma çizgisi boyunca bir yerde veri, bir şeyler ters gitti. Yeni verileri, örneğin eski veriler için bir doğrulama kümesi olarak kullanmak veya eski verilere eklemek istemezsiniz.
Wilcoxon sıra toplamı gibi bir grup 1-istatistik (bir değişken başına) yapabilir ve birden fazla test düzeltmesi deneyebilirsiniz, ancak bunun en uygun olduğundan emin değilim (çoklu test sorunlarına izin vermeden çok değişkenli verilerin karmaşıklıklarını yakalamak için). Bunun bir yolu bir sınıflandırıcı kullanmak ve iki veri kümesi arasında ayrım yapıp yapamayacağınızı görmektir (optimal olan optimal bir sınıflandırıcı verildiğinde). Bu işe yarıyor gibi görünüyor ama yine de a) perhpas daha iyi bir yol var b) Neden farklı olduğunu söylemek için gerçekten tasarlanmamıştır (başka hiçbir şey en iyi tahmin edicileri kullanmaz ve muhtemelen daha iyi olanlar tarafından desteklenen diğer iyi tahmin edicileri kaçırır)