Gizli özelliklerin anlamı?


24

Tavsiye sistemleri için matris faktörleştirmeyi öğreniyorum ve terimin latent featuresçok sık meydana geldiğini görüyorum ama bunun ne anlama geldiğini anlayamıyorum. Bir özelliğin ne olduğunu biliyorum ama gizli özellikler fikrini anlamıyorum. Lütfen açıklayabilir misiniz? Ya da en azından beni okuyabileceğim bir yere / yere yönlendir.


Gizli değişkenler, modelleri neyin modellenebileceği konusunda daha güçlü kılmayı sağlar. Değerlerini tanımlamak veri ve algoritmaya bağlıdır. Başka bir deyişle, gizli değişkenler, gözlemlenen değişkenleriniz ve istenen öngörü arasındaki boşluğu dolduran "adım" gibidir. Bu "boşluk" ne kadar genişse gizli değişkenler o kadar yararlıdır.
Vladislavs Dovgalecs

Yanıtlar:


25

Aşırı basitleştirme pahasına gizli özellikler, onları gözlenen özelliklerden ayırmak için 'gizli' özelliklerdir. Gizli özellikler, matris faktörü kullanarak gözlenen özelliklerden hesaplanır. Bir örnek metin belgesi analizi olabilir. belgelerden çıkarılan 'kelimeler' özellikleridir. Kelimelerin verilerini çarpanlara ayırırsanız, 'konular'ı bulabilirsiniz; burada' topic ', anlamsal alaka düzeyine sahip bir kelime grubudur. Düşük dereceli matris faktoringi, birkaç sırayı (gözlenen özellikler) daha küçük bir sıra kümesine (gizli özellikler) eşler. Ayrıntılı olarak, belgede [yelkenli tekne, yelkenli, yat, vapur, kruvazör] gibi özellikler (kelimeler), 'gemi' ve 'tekne' gibi gizli bir özelliğe (konu) 'çarpan' olan 'gözlenebilir.

[yelkenli tekne, yelkenli, yat, vapur, kruvazör, ...] -> [gemi, tekne]

Temel fikir, gizli özelliklerin, gözlemlenen özelliklerin anlamsal olarak 'toplu' olması ile ilgilidir. Büyük ölçekli, yüksek boyutlu ve gürültülü gözlemlenen özelliklere sahipseniz, sınıflandırıcınızı gizli özelliklere göre oluşturmak mantıklı olacaktır.

Bu elbette kavramı açıklamak için basitleştirilmiş bir tanımdır. Doğru bir tanım için Latent Dirichlet Allocation (LDA) veya olasılıksal Latent Semantic Analysis (pLSA) modelleri hakkındaki ayrıntıları okuyabilirsiniz.


"Gizli özellikler, matris faktörü kullanarak gözlenen özelliklerden hesaplanır." Matris faktoringi kullanılarak yapılan hesaplama, gizli olarak sayılacak bir miktar için gerekli bir koşul mu?
flow2k

5

Diyelim ki, (MxN)matrisiniz varsayalım ki M- tavsiye veren kullanıcıların Nsayısını ve önerilen öğelerin sayısını belirtir. matris elemanının bazı unsurlar eksik, belirli bir öneri, örneğin tahmin edilmesi.xij

Ardından, matrisiniz K"gizli faktörler " ekleyerek "faktörize edilebilir ", böylece bir matris yerine iki tane olur: - (MxK)kullanıcılar (KxN)için ve - matris çarpımını orijinal matrisi üreten öğeler için.

Son olarak sorunuza: matris faktoringinde gizli özellikler nelerdir? Bunlar Kkullanıcı zevklerinde ve önerilen öğelerde bilinmeyen özelliklerdir ( ), bu iki matris çarpıldığında, bilinen önerilerin matrisini üretir. Belirli ağırlıklar (belirli bir özelliğe yönelik kullanıcı tercihleri ​​ve belirli bir öğedeki özellik miktarları), daha çok burada okuyabileceğiniz Alternatif En Küçük Kareler algo ile tanımlanır.


3

Görünen o ki gizli özellikler , varlıkları yapılarına göre sınıflandırmak için kriterleri tanımlamak için kullanılan bir terimdir , başka bir deyişle, ait oldukları sınıflar yerine, içerdikleri özellikler (özellikler) ile. Burada "gizli" kelimesinin anlamı, büyük olasılıkla gizli terim değişkeninin ( http://en.wikipedia.org/wiki/Latent_variable ) gözlemlenemeyen değişken (kavram) anlamına geldiği sosyal bilimlerdeki anlamına benzemektedir .

Aşağıdaki yazıda "Giriş" bölümü gizli özelliklerin anlamını ve sosyal bilimler fenomeninin modellenmesinde kullanımının iyi bir açıklamasını sunar : http://papers.nips.cc/paper/3846-nonparametric-latent-feature-models-for- bağlantı tahmini.pdf .


Başvuru yaptığınız makalenin girişini okudum ancak gizli özellikler kavramını anlamada çok faydalı bulamadım.
Will

@ Daha iyi bir açıklama ile kaynak (lar) önermek için çekinmeyin.
Aleksandr Blekh


@ Teşekkür ederim. Katılıyorum - bu oldukça iyi bir giriş / açıklama (ancak, orada dağılmış başka pek çok iyi olduğuna eminim).
Aleksandr Blekh

1

Başka bir örnek olarak, kullanıcıların Netflix kurulumu gibi bir film derecelendirme matrisini düşünün. Bu, işlenmesi zor olan büyük bir seyrek matris olacaktır.

Her kullanıcının, bilim kurgu filmleri veya romantizm filmleri vb. Gibi belirli bir tercihi olacağını unutmayın. Dolayısıyla, tüm film derecelendirmelerini kaydetmek yerine, farklı Türlere ait olan film kategorisi gibi tek bir gizli özelliği saklayabiliriz : örneğin, bilim-kurgu ya da romantizm, hangisi her kategori için zevkini ölçerse. Bunlara film listesinin tamamını depolamak yerine zevkinin özünü yakalayan Latent Features adı verilir .

Tabii ki bu bir yaklaşım olacak, ama kapak tarafında, saklamak için çok az şey var.

Bu, genellikle bir kırdığı SVD gibi matris ayrıştırma teknikleri kullanılarak yapılır öğe tavsiye matrise kullanıcı kullanıcı tercih matrisi ve ilave avantaj yerine depolanması olan, madde tercih matrisi etkili bir numara, saklayın .N 1 1 N N 2 2 NNNN11NN22N

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.