Benim sorum aptalca olabilir. Bu yüzden önceden özür dilerim.
Stanford NLP grubu ( link ) tarafından önceden eğitilmiş GLOVE modelini kullanmaya çalışıyordum . Ancak, benzerlik sonuçlarımın bazı negatif sayılar gösterdiğini fark ettim.
Bu, hemen sözcük-vektör veri dosyasına bakmamı istedi. Görünüşe göre, sözcük vektörlerindeki değerlerin negatif olmasına izin verildi. Bu neden olumsuz kosinüs benzerlikleri gördüğümü açıkladı.
Değerleri [0, 1] 'de sınırlı olan frekans vektörlerinin kosinüs benzerliği kavramına alışkınım. Nokta ürün ve kosinüs fonksiyonunun vektör arasındaki açıya bağlı olarak pozitif veya negatif olabileceğini biliyorum. Ama bu olumsuz kosinüs benzerliğini anlamak ve yorumlamakta gerçekten zorlanıyorum.
Örneğin, -0.1 benzerliği veren bir çift kelimem varsa, benzerlikleri 0.05 olan başka bir çiftten daha az benzerler mi? -0.9 ile 0.8 arasındaki benzerliği karşılaştırmaya ne dersiniz?
Yoksa minimum açı farkının mutlak değerine bakmalı mıyım? Skorların mutlak değeri?
Çok çok teşekkürler.
An angular-type similarity coefficient between two vectors. It is like correlation, only without centering the vectors.
İkisi arasındaki tek fark, korelasyon sapmalarında (anlar) - çapraz çarpılan - ortalamadan, kosinüs sapmalarında orijinal 0'dan - yani değerlerin oldukları gibi olmasıdır .