Sanat akım öğrenme öğrenme


25

Son zamanlarda büyük veri kümeleriyle çalışıyorum ve çok sayıda akış yöntemi buldum. Birkaç isim:

Ancak, birbirleriyle nasıl karşılaştırıldıklarına dair herhangi bir belge bulamadım. Okuduğum her makale farklı veri setlerinde deneyler yapıyor gibi görünüyor.

Sofia-ml, vowpal wabbit'i biliyorum ama mevcut yöntemlerin büyük miktarına kıyasla çok az yöntem kullanıyorlar!

Daha az yaygın olan algoritmalar yeterince performans göstermiyor mu? Mümkün olduğu kadar çok yöntemi incelemeye çalışan herhangi bir makale var mı?


7
Yoksa, kendin yazmalısın :)
Chris C

1
Akademideki insanların bildiri yazmak / yeni algoritmalar bulmak zorunda olduklarını ve algoritmalarının en iyi performans gösterdiği veri kümelerini arayacaklarını anlıyorsunuz. Vowpal-wabbit gibi bir kütüphanenin nasıl çalıştığını (yani tüm parametreler vb.) Anladığınızdan emin olmanızı tavsiye ederim.
seanv507

1
Bu aslında tam tersi! İnsanların en iyi veri setini seçtiğini ve genellikle algoritmaları (hem kendilerine hem de rekabet eden yöntemlere) nasıl çapraz onayladıkları konusunda nispeten sessiz olduklarını anladım. Daha çok jmlr.org/papers/volume15/delgado14a/delgado14a.pdf sayfasının
RUser4512

1
Gerçekten bağladığın JMLR kağıdı gibi. Ben kendim bu yüzden akış algoritmaları için benzer bir karşılaştırma bilmiyordum. Muhtemelen akış daha niş olduğundan ve ayrıca statik veri kümeleri için sınıflandırıcıları karşılaştırmak zor olduğu için akış verileri için adil bir karşılaştırma yapmak daha da karmaşıktır.
stats0007

1
Bunlar, sorunuza özel olarak cevap vermese de, iki ilgili kaynak şunlardır: Değerlendirme tekniklerini tartışan Gama ve arkadaşlarının Veri Akışlarından Öğrenen Algoritmaları ve değerlendirme tekniklerini tartışan GAMA ve diğerleri tarafından yapılan veri toplama madenciliği için açık kaynaklı bir çerçeve olan MOA'yı (Massive Online Analysis) değerlendirme performansı değerlendirme yeteneği.
user77876,

Yanıtlar:


1

Bağladığınız Delgado makalesine benzer çok sayıda algoritma içeren titiz bir anket bildiğim kadarıyla mevcut değil, ancak algoritma aileleri için sonuç toplama çabaları oldu.

İşte yararlı bulduğum bazı kaynaklar (feragatname: Bölgede yayınlarım, bu yüzden seçimimde önyargılıyım):

Bazı yazılım paketleri:

Gerekirse daha fazla bilgi ve kaynak ekleyebilirim. Diğerlerinin dediği gibi alan kapsamlı bir anket kullanabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.