Olumsuzluk, işbirlikçi filtreleme / tavsiye sistemleri için neden önemlidir?


11

Matris çarpanlarına bağlı olduğunu gördüğüm tüm modern tavsiye sistemlerinde, kullanıcı-film matrisi üzerinde negatif olmayan bir matris çarpanına ayrılmıştır. Olumsuzluğun yorumlanabilirlik için ve / veya seyrek faktörler istiyorsanız neden önemli olduğunu anlayabiliyorum. Ancak sadece netflix ödül yarışmasında olduğu gibi sadece tahmin performansını önemsiyorsanız, neden olumsuzluk kısıtlamasını dayatmalısınız? Faktorizasyonunuzda da negatif değerlere izin vermekten kesinlikle daha kötü görünüyor.

Bu çalışma, işbirlikçi filtrelemede negatif olmayan matris çarpanlarına ayırma yönteminin kullanımına değinilmiş bir örnektir.


1
Tavsiye sistemlerine çok aşina değilim (belki de sorunuza bazı örnek makaleler ekleyebilir misiniz?). Çıkarım yaptığınız NNMF tercihi örüntüsü doğruysa, en muhtemel cevap genelleştirilebilirliği artırmaktır. Başka bir deyişle, ampirik olarak "yorumlanabilirlik / seyreklik" eksikliğinin aşırı uydurma ile ilişkili olması olabilir . Ancak seyrek kodlama (yani L1 düzenlenmesi / LASSO) bu gereksinimleri bildiğim kadarıyla karşılayabilir. (Yine de NNMF daha yüksek yorumlanabilirliğe sahip olabilir.)
GeoMatt22

Yanıtlar:


14

Tavsiye sistemlerinde uzman değilim, ancak anladığım kadarıyla, bu sorunun öncüsü yanlış.

Negatif olmama, işbirlikçi filtreleme için o kadar önemli değildir.

Netflix ödülü 2009 yılında BellKor ekibi tarafından kazanıldı. İşte algoritmalarını açıklayan makale: Netflix Ödülüne BellKor 2008 Çözümü . Görmesi kolay olduğu gibi SVD tabanlı bir yaklaşım kullanıyorlar:

2008 yılındaki ilerlememizin temelleri KDD 2008 belgesinde yer almaktadır [4]. [...] Makalede [4] üç faktörlü modelin ayrıntılı bir tanımını veriyoruz. Birincisi basit bir SVD'dir [...] İkinci model [...] bu modele “Asimetrik-SVD” adını vereceğiz. Son olarak, daha doğru faktör modeli, “SVD ++” olarak adlandırılacak [...]

Aynı ekip tarafından tavsiye sistemi için Matris çarpanlara ayırma tekniklerinin bu popüler makalesine de bakınız . SVD hakkında çok konuşuyorlar ama NNMF'den hiç bahsetmiyorlar.

Ayrıca bu popüler blog yazısına da bakın Netflix Güncellemesi: 2006'dan Bunu Denemek , SVD fikirlerini de açıklamak.

Tabii ki haklısınız ve işbirlikçi filtreleme için de NNMF kullanma konusunda bazı çalışmalar var. Peki daha iyi olan nedir, SVD veya NNMF? Hiçbir fikrim yok, ama işte 2012'den itibaren İşbirlikçi Filtreleme Algoritmalarının Karşılaştırmalı Bir Çalışması :

Matris-Çarpanlara Dayalı yöntemler genellikle en yüksek doğruluğa sahiptir. Özellikle, düzenli SVD, PMF ve varyasyonları, NMF'nin en iyi performansı sergilediği çok seyrek durumlar haricinde, MAE ve RMSE'ye kadar en iyi performansı gösterir.


2
Genel olarak bu iyi bir cevaptır. Ancak sadece bazı gerçekleri düzeltmek için BellKor 2008 çözümü ilerleme ödülünü kazandı. Toplam kazanan algoritma, 100'ün üzerinde öngörücünün bir karışımıydı (Töscher ve ark. 2009). NMF de bunun bir parçasıydı.
dpelisek
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.