Bir sosyal ağdaki olası bağlantılar nasıl belirlenir?


29

"Önerilen arkadaşlar" algoritmasıyla mücadeleye yönelik bir yaklaşım belirlemeyi merak ediyorum.

Facebook , size tanıdıklarını düşündüğü bireyleri tavsiye edebileceği bir özelliğe sahiptir. Bu kullanıcılar normalde ( bir kullanıcının özellikle bir arkadaşını önerdiği son durumlar hariç ), kendisiyle oldukça benzer bir ağa sahiptir. Yani, ortak arkadaş sayısı yüksektir. Twitter’ın “Kim Takip Ediyor” mekanizması için de benzer bir yol izlediğini düşünüyorum.

Bir Facebook çalışanı olan Stephen Doyle (Igy) , EdgeRank formülünü kullanan ilgili haber bülteninin , görünüş gibi arkadaşlardan daha değerli olduğunu gösteren göründüğünü belirtti. Başka bir kullanıcı Google Rank sistemini önerdi.

Facebook'tan onların Haber Kaynağı Optimizasyonu devletler olarak neredeΣuewede

= görüntüleme kullanıcısı ile kenar yaratıcısı arasındaki ilişki puanları w e = bu kenar için ağırlık (oluştur, yorum yap, beğen, etiket, vb.) d e = kenarın ne kadar zaman önce yaratıldığına bağlı olarak zaman bozunum faktörü ue
we
de

Bu maddelerin toplanması, Igy'nin ima ettiği gibi bir nesnenin rütbesini vermesi gerektiği, benzer arkadaşlar için benzer bir formatta bir şey kullanıldığı anlamına gelir.

Yani, bunun genel olarak tüm tipler için bağlantıların bir sıralama sistemi aracılığıyla yapılma şekli olduğunu tahmin ediyorum.


Basit bir başlangıç ​​noktası olarak, "arkadaşların arkadaşları" öneri sistemini kullanabilirsiniz. Yani, eğer X kişisinin arkadaşı olan birçok arkadaşınız varsa, o zaman belki de X
Joe

1
Gerçek bir sosyal ağın yapısını yakalamaya çalışan çeşitli rasgele grafik modelleri vardır. Potansiyel bir sınır olasılığını hesaplamak, kullandığınız modele ve mevcut bilgilere bağlıdır.
Kaveh

Yanıtlar:


7

MM2M2


1
fbenp

Sorunu bir grafikle modellemenin hem daha kolay hem de daha sezgisel olduğunu düşünüyorum.
MMS

11

Aradığın sezgisel. Hiçbir algoritma, bir arkadaş grafiği olarak verilen tek girdi olarak, doğrudan bağlı olmayan iki kişinin arkadaş olup olmadığını söyleyemez; arkadaşlık / tanışma ilişkisinin geçişli olduğu garanti edilmez (simetriyi varsayabiliriz, ancak bu gerçek hayatta gergin olabilir). Bu nedenle, herhangi bir iyi sezgisel ilişkinin grafiklerinin doğasını matematiksel olarak anlamak yerine insanların nasıl etkileşime girdiğinin bir anlayışına dayanması gerekir (bu bağlamda sezgisel ölçmemiz gerekecek).

Eşit olasılıkla arkadaşlarına arkadaş önermek nispeten ucuz ama yanlış bir sezgiseldir. Örneğin, babamın arkadaşları var, ama hiçbiriyle arkadaş olmadığımı söyleyemem (muhtemelen, sosyal ağ amaçları için babamın bir arkadaşı olduğumu söylememe rağmen). Birinin nispeten yakın bir mesafede olması, mutlaka mükemmel bir aday olmasını gerektirmez.

Çok fazla genişletilmiş bağlantıya sahip olduğunuz kişileri önermek, genel olarak kötü bir seçim gibi görünmektedir, çünkü bu daha erken öne çıkan insanların arkadaşlarının katlanarak büyümesine yol açacaktır (Kevin Bacon oyunundan yedi derece ayrılma derecesi bir bunun örneği).

R,

  _____
 /     \
a---c   f
|   | /
b   d---e
| \ |
g   h   i

Diyelim ki yeni arkadaşlar bulmak istiyoruz a. abireyin şimdiki arkadaşlar b, cve f. Biz net eşdeğer arasındaki direnci değerlendirmek ave her d, e, g, h, ve i:

pair   resistance
(a,d)   6/7
(a,e)  13/7
(a,g)   7/4
(a,h)   1/1
(a,i)   inf

Buna göre sezgisel, den iyi aday arkadaş, yakından takip ediyor h. gsonraki en iyi bahis ise yakından takip ediyor e. ibu buluşsal yöntemle asla aday arkadaş olamaz. Bu buluşsal sonuçları bulup bulmamanın gerçek insan sosyal etkileşimlerinin temsilcisi olması önemli. Hesaplamalı olarak konuşursak, bu iki birey arasındaki tüm yolları içeren bir alt yazı bulmayı (ya da belki de ilginç bir şekilde, bunun anlamlı bir şekilde seçilmiş bir kısmını kesmeyi), ardından kaynak ve lavabo düğümleri arasındaki eşdeğer direnci değerlendirmeyi içerecektir.

EDIT: Peki bunun için sosyal motivasyonum nedir? Peki, bu, arabulucular (arkadaşlar) aracılığıyla muhtemelen önemli miktarda bilgiyi iletmenin ne kadar zor olduğunu gösteren bir model olabilir. CS terimlerinde (fizik terimleri yerine), bu, bir grafikteki iki düğüm arasındaki bant genişliği olarak yorumlanabilir. Bu sistemin uzantıları, farklı ağırlıklardaki (direnç, bant genişliği vb.) İnsanlar arasında farklı bağlantı türlerine izin vermek ve yukarıdaki gibi ilerlemek olacaktır.


10

Sosyal ağların popülaritesinin artması nedeniyle bu konuda çok fazla çalışma yapıldı. Sorun genellikle "Bağlantı Tahmini" olarak adlandırılır ve burada ve burada çok iyi ve kapsamlı anketler bulunabilir . Metotlar çok basitten (örneğin düğümler arasındaki Jaccard benzerliği) çok komplekse (örneğin, üretici bağlantı işleminin istatistiksel modellerini oluşturmak) kadar uzanmaktadır. Veri kümenizdeki özelliklere (örneğin yalnızca ağ yapısı, düğüm nitelikleri?, Kenar nitelikleri, ...) çok fazla bağlıdır, ancak bu anketler nereden başlayacağınız konusunda size iyi bir fikir verecektir.


4

Yasal Uyarı: Burada çılgınca tahmin ediyorum; Hiçbir tür araştırması okumamıştım.

Düğümlerle yapılan kaç bağlantının, bir düğümün sahip olduğu bağ sayısıyla göreli olarak paylaştığını görebilirsiniz. Bu çok saf (yerel olarak) bir fikir, ancak işte böyle.

N-CN-N-1N-2N-2N-1

|CN-1CN-2||CN-1|α

α[0,1]

Başka bir fikir daha küresel: eldeki ile benzer bir düğüm seti belirleyin ve çoğunun paylaştığı bağlantılar önerin. Yani, benzer düğümler kümesini tanımlayın

SN-={M:|CN-CM|N-α}

ve belirlenen makul öneriler

{S:ΣMSN-[SM]|SN-|β}

α,β[0,1]

SN-

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.