Ortak çalışmaya dayalı filtreleme için karşılaştırma veri kümeleri

9

Ortak çalışmaya dayalı filtreleme için yeni bir algoritmayı test etmek istiyorum . Tipik bir kullanım durumu, belirli bir kullanıcıya benzer kullanıcıların tercihlerine göre film önerilmesidir.

Araştırmacıların algoritmalarını test etmek için sıklıkla kullandıkları bazı karşılaştırmalı değerlendirme veri setleri nelerdir? Computer Vision'da insanların genellikle MNIST veya CIFAR kullandıklarını biliyorum, ancak işbirlikçi filtreleme için benzer veri kümeleri bulamadım.

dataset recommender-system

— pir
kaynak

1

Netflix ödül veri kümesine bir göz attınız mı? Evet, rekabet çoktan sona erdi ve bazı gizlilik nedenleriyle resmi web sitesinden çekildi. Yine de başka yerlerde bulmayı deneyebilirsiniz.

— Vladislavs Dovgalecs

Kaggle.com bir grup var. Sadece 'öneri: veri kümesi' veya 'öneri: rekabet' ifadesini arayın.

— ran8

8

Açık cevap Netflix ödül veri seti olacaktır, üzerinde çok fazla araştırma var ve çoğu CF algoritmasının puanları biliniyor.

Genellikle karşılaştırma ölçütü olarak kullanılan diğer kullanılabilir veri kümeleri vardır:

Film mercek Veri Kümesi : CF algoritmalarını karşılaştırmak için kullanılan 20 milyon derecelendirme veri kümesi;
Jester Veri Kümesi : 6 milyondan fazla derecelendirmeye sahip bir şaka öneri veri kümesi;
Bu bağlantıda daha birçok veri kümesi bulabilirsiniz

— João Almeida
kaynak

1

Sana yardım edebilecek bir havuzum var.

https://github.com/ArthurFortes/Datasets-for-Recommneder-Systems/

— Arthur Fortes
kaynak

3

Lütfen sadece link cevapları göndermeyin, cevaplar kendi içinde olmalıdır. Bağlantının sağladığı bilgilerden en az birkaçını eklemek için yanıtınızı düzenlemenizi ve daha sonra keşif için bağlantı sağlamanızı öneririz.

— Mephy