Ortak çalışmaya dayalı filtreleme için karşılaştırma veri kümeleri


9

Ortak çalışmaya dayalı filtreleme için yeni bir algoritmayı test etmek istiyorum . Tipik bir kullanım durumu, belirli bir kullanıcıya benzer kullanıcıların tercihlerine göre film önerilmesidir.

Araştırmacıların algoritmalarını test etmek için sıklıkla kullandıkları bazı karşılaştırmalı değerlendirme veri setleri nelerdir? Computer Vision'da insanların genellikle MNIST veya CIFAR kullandıklarını biliyorum, ancak işbirlikçi filtreleme için benzer veri kümeleri bulamadım.


1
Netflix ödül veri kümesine bir göz attınız mı? Evet, rekabet çoktan sona erdi ve bazı gizlilik nedenleriyle resmi web sitesinden çekildi. Yine de başka yerlerde bulmayı deneyebilirsiniz.
Vladislavs Dovgalecs

Kaggle.com bir grup var. Sadece 'öneri: veri kümesi' veya 'öneri: rekabet' ifadesini arayın.
ran8

Yanıtlar:


8

Açık cevap Netflix ödül veri seti olacaktır, üzerinde çok fazla araştırma var ve çoğu CF algoritmasının puanları biliniyor.

Genellikle karşılaştırma ölçütü olarak kullanılan diğer kullanılabilir veri kümeleri vardır:

  • Film mercek Veri Kümesi : CF algoritmalarını karşılaştırmak için kullanılan 20 milyon derecelendirme veri kümesi;

  • Jester Veri Kümesi : 6 milyondan fazla derecelendirmeye sahip bir şaka öneri veri kümesi;

  • Bu bağlantıda daha birçok veri kümesi bulabilirsiniz


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.