Herhangi bir alt grubun özelliklerini bilmeden bir popülasyonun alt gruplarını tanımlamak ve izole etmek için veri setlerini analiz etmek ve ayrıştırmak için yeni bir yöntem üzerinde çalışıyorum. Yöntem yapay veri örnekleriyle (yani, popülasyonun alt kümelerini tanımlamak ve ayırmak amacıyla özel olarak oluşturulmuş veri kümeleri) yeterince iyi çalışsa da, onu canlı verilerle test etmeyi denemek istiyorum.
Aradığım şey serbestçe ulaşılabilir (yani gizli olmayan, özel olmayan) bir veri kaynağıdır. Tercihen, bir çift modlu veya çok modlu dağılımlar içeren veya açıkça geleneksel yollarla kolayca ayrılamayan çoklu alt gruplardan oluşan bir tanesi. Bu bilgiyi nereden bulabilirim?