Makine öğrenimi sınıflandırma / regresyon görevleri için birkaç klasik veri kümesi vardır. En popüler olanları:
Ancak ağ analizi / grafik teorisi için benzer veri kümelerini bilen var mı? Daha somut - Karşılaştırma / değerlendirme / öğrenme için Gold standart veri kümeleri arıyorum :
- merkeziyet tedbirleri;
- ağ kümeleme algoritmaları.
Halka açık ağların / grafiklerin büyük bir listesine ihtiyacım yok, ancak aslında bilmeniz gereken veri kümelerinin bir çiftine ihtiyacım var.
DÜZENLE:
"Altın standart veri kümesi" için kesin özellikler sağlamak oldukça zordur, ancak işte bazı düşünceler. Bence, gerçek klasik veri seti bu kriterleri karşılamalıdır:
- Makale ve ders kitaplarında çoklu referanslar;
- İyi bilinen ağ analizi yazılım paketlerine dahil etme;
- Yeterli varlık zamanı;
- Grafik analizi üzerine bir dizi derste kullanım.
İlgi alanımla ilgili olarak, köşeler ve / veya önceden hesaplanmış (veya önceden tanımlanmış) "otorite puanları" (yani merkezî tahminler) için etiketli sınıflara da ihtiyacım var. Bu soruyu sorduktan sonra aramaya devam ettim ve işte bazı uygun örnekler:
- Zachary's Karate Club : 1977'de tanıtılan ve 1.5k kereden fazla alıntı yapılan (Google Akademik'e göre), köşe noktalarının Faction (kümeleme için kullanılabilen) özelliği vardır.
- Erdos İşbirliği Ağı : Ne yazık ki, bu ağı veri dosyası biçiminde bulamadım, ancak oldukça ünlü ve birisi matematikçilerin uzmanlık verileriyle ağı zenginleştirecekse, kümeleme algoritmalarını test etmek için de kullanılabilir.