Aynı temel popülasyondan iki çok değişkenli dağılımın örneklenip örneklenmediğini nasıl test edebilirim?


13

Diyelim ki iki çok değişkenli veri kümesi veriliyor, eski bir tane ve yeni bir tane var ve bunların aynı süreç tarafından (modeliniz olmayan) tarafından oluşturulmuş olması gerekiyor, ama belki de toplama / yaratma çizgisi boyunca bir yerde veri, bir şeyler ters gitti. Yeni verileri, örneğin eski veriler için bir doğrulama kümesi olarak kullanmak veya eski verilere eklemek istemezsiniz.

Wilcoxon sıra toplamı gibi bir grup 1-istatistik (bir değişken başına) yapabilir ve birden fazla test düzeltmesi deneyebilirsiniz, ancak bunun en uygun olduğundan emin değilim (çoklu test sorunlarına izin vermeden çok değişkenli verilerin karmaşıklıklarını yakalamak için). Bunun bir yolu bir sınıflandırıcı kullanmak ve iki veri kümesi arasında ayrım yapıp yapamayacağınızı görmektir (optimal olan optimal bir sınıflandırıcı verildiğinde). Bu işe yarıyor gibi görünüyor ama yine de a) perhpas daha iyi bir yol var b) Neden farklı olduğunu söylemek için gerçekten tasarlanmamıştır (başka hiçbir şey en iyi tahmin edicileri kullanmaz ve muhtemelen daha iyi olanlar tarafından desteklenen diğer iyi tahmin edicileri kaçırır)

Yanıtlar:


3
http://131.95.113.139/courses/multivariate/mantel.pdf

Veri kümeleriniz aynı boyuttaysa bunu yapmanın iki olası yolunu tartışır. Temel yaklaşım, gözlemlenen iki matrisiniz arasındaki bir mesafe metriğini hesaplamaktır. Sonra bu mesafenin önemli olup olmadığını belirlemek için bir permütasyon testi kullanırsınız .

Veri kümeleriniz aynı boyutta değilse, çok popüler görünmese de çapraz eşleme testini kullanabilirsiniz . Çapraz eşleme testi yerine, verilerinizi aynı boyutta olacak şekilde yukarı veya aşağı örneklemeyi deneyebilir, ardından ilk makalede belirtilen yaklaşımlardan birini kullanabilirsiniz.


Eşit olmayan boyutta veri kümelerimiz varsa, eşleşme testini kullanın. Ancak bahsettiğiniz makalenin ardından, eşit eşit veri kümeleri kullanırlar ve mesafelere göre eşleşirler. Bunun kullanıldığına dair herhangi bir kanıt buldunuz mu? çapraz eşleme için sürüm notlarında bile, örnek eşit veri kümeleri kullanır
lukeg

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.