1000'den fazla özelliğe (veya eğriler varsa örnek noktalara) sahip sınıflandırma için serbestçe kullanılabilir veriler nelerdir?
Ücretsiz veri setleri hakkında zaten bir topluluk wiki'si var: Serbestçe kullanılabilir veri örneklerini bulma
Ancak burada daha rahat kullanılabilecek daha odaklanmış bir listeye sahip olmak güzel olurdu , ayrıca aşağıdaki kuralları öneriyorum:
- Veri kümesi başına bir yayın
- Veri kümesi kümesine bağlantı yok
her veri kümesi gerekir ilişkilendirilebilir
bir isim (neyle ilgili olduğunu bulmak için) ve veri setine bir link (R veri setleri paket ismi ile isimlendirilebilir)
özelliklerin sayısı ( p diyelim ) veri kümesinin boyutu ( n diyelim ) ve etiket / sınıf sayısı ( k diyelim )
Deneyiminizden (kullanılan algoritmayı kelimelere yazınız) ya da kitapçıktan (bu son durumda kağıdı bağlayın) tipik bir hata oranı