Gizli özelliklerin anlamı?


15

Tavsiye sistemleri için matris çarpanlara ayırma modellerini anlamaya çalışıyorum ve her zaman 'gizli özellikleri' okuyorum, ama bu ne anlama geliyor? Bir özelliğin bir eğitim veri kümesi için ne anlama geldiğini biliyorum, ancak gizli özellikler fikrini anlayamıyorum. Konuyla ilgili bulabildiğim her makale çok sığ.

Düzenle:

en azından beni fikri açıklayan bazı makalelere yönlendirebilirsen.


İşte size yardımcı olabilecek basit bir örnek: quuxlabs.com/blog/2010/09/…
Akavall

Yanıtlar:


9

Gizli, doğrudan gözlenemeyen anlamına gelir. PCA ve Faktör Analizinde terimin ortak kullanımı, çok sayıda doğrudan gözlemlenebilir özelliğin boyutunu, daha küçük bir dizi dolaylı gözlemlenebilir özelliğe indirmektir.


böylece küçültülmüş boyutlar gizli özelliklerdir? PCA durumunda, kovaryans matrisinin öz vektörleri, yani temel bileşenler, değil mi?
Jack Twain

Doğrulanmış @AlexTwain
samthebest

Bana bundan bahseden bir öğretici / makale verebilir misiniz? Sistematik bir öğretici / makale bulamıyorum!
Jack Twain

Eh wiki sayfasında, gerçekten orada isterseniz başvuruları oldukça iyi takip edebilirsiniz edilir en.wikipedia.org/wiki/Latent_variable
samthebest

1
@JackTwain doğru PCA benzetmesi, gizli özelliklerin özvektörler olmasıdır. Ana bileşenler, ana özvektörler için her bir gözleme atanan ağırlıklardır. Diğer matris çarpanlara ayırma modellerinde gizli özellikler özvektörlerin rolünü oynar. Bu bilgiçlikçik gelebilir, ancak hata insanlar için karışıklık yaratmaz.
varsayımlar

3

Çarpanlara Ayırma Yöntemi bağlamında, gizli özellikler genellikle her boyut boyunca öğeleri karakterize etmek içindir. Örnek olarak açıklayayım.

Biz öğe kullanıcıların etkileşimlerinin bir matris olduğunu varsayalım . Matris Çarpanlara ayırma yöntemlerindeki model varsayımı , bu matrisin her hücresinin , örneğin - kullanıcı ile gizli bir gizli vektörü arasındaki bir nokta ürünü tarafından , öğesini tanımladığıdır. . Sezgisel olarak, bu ürün bu vektörlerin ne kadar benzer olduğunu ölçer. Egzersiz sırasında, yaklaşık hatası en aza indirilecek şekilde "iyi" vektörler bulmak istersiniz.R u i p T u q i p u u q i iRRuipuTqipuuqii

Bir bu gizli özellikler olduğunu, kullanıcının vektör bir özellik vardır, anlamlı olduğunu düşünebilir öğenin vektör içinde ve karşılık gelen özelliği "özelliği X öğeleri sever" gibi "özelliği X vardır" gibi. Ne yazık ki, bir şekilde uygulanmadıkça, yorumlanabilir gizli özellikler bulmak zor. Böylece, gizli özellikleri bu şekilde düşünebilirsiniz, ancak bu özellikleri veriler hakkında akıl yürütmek için kullanamazsınız.q ipuqi


Bazı hedef değişkenleri tahmin etmek için gizli özelliklerin ("kullanıcı vektörü") kullanıldığı kağıtları okudum, örnek olarak cinsiyet kullanalım. Öngörülü bir modelin bu şekilde oluşturulabilmesi için "çalışır". Benim sorum, "kullanıcı vektörü" ile diyelim ki, bir kullanıcının "ziyaret ettiği" tüm öğeler için "öğe vektörlerinin" ortalamasının alınması arasındaki fark nedir? IOW, yukarıda belirtilen tahmin modelinin bir diğerine karşı daha iyi veya daha kötü olmasını bekler misiniz? Teşekkürler (bunu görürseniz).
thecity2

@ thecity2, kullanıcının öğelerini ortalayabilirsiniz ve bu, önceden hesaplanmış kullanıcı vektörlerine sahip olmadığınız yeni gelenlerle uğraşırken faydalı olabilir (ancak bunu hesaplamak için birkaç optimizasyon yinelemesi çalıştırmak zor olmalıdır). Düz ortalama alma ile ilgili bir sorun da var: kullanıcı ne kadar çok öğe tüketirse - ortalama öğe vektörü sıfıra yaklaştıkça (tipik L2 düzenleyici ve belki de yüksek boyutlu alanların diğer kötü özellikleri nedeniyle) olasıdır. Son olarak, ayrı bir vektörün olması daha esnektir: modeliniz böyle bir ortalamayı öğrenebilir.
Artem Sobolev

Bununla birlikte, kullanıcının vektörünü modellemek için kullanıcının geçmişini kullanma girişimleri vardır. Örneğin, "İnternet Radyo Akışlarını
Modelleyerek

0

Bir değişkenin 'gecikme' / gizlilik algısı elde etmek için faktörlerin temel bileşenlerden daha temsili olduğunu söyleyebilirim. Gecikme, davranış bilimcilerinin duygu, üzüntü gibi algısal yapıları birden fazla madde / önlem olarak ölçmesinin ve doğrudan ölçülemeyen bu tür gizli değişkenler için bir sayı türetmesinin nedenlerinden biridir.


0

Burada verileriniz, çeşitli kullanıcılar tarafından çeşitli filmlere verilen derecelendirmelerdir. Diğerlerinin de belirttiği gibi, gizli araçlar doğrudan gözlemlenemez.

Bir film için gizli özellikleri eylem, romantizm, hikaye çizgisi, ünlü bir aktör vb. Miktarını belirler. Benzer şekilde, el yazısı rakamlardan oluşan başka bir veri kümesi için, gizli değişkenler kenar açısı, eğim vb. Olabilir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.