Geçici Ağda Link Anomalisi Tespiti


32

Trend konularını tahmin etmek için link anomalisi tespitini kullanan bu makaleyle karşılaştım ve inanılmaz derecede ilgi çekici buldum: “Sosyal Bağlantılarda Yeni Gelişen Konuları Link Anomalisi Tespiti ile Keşfetmek” .

Farklı bir veri setinde çoğaltmayı çok isterdim, ama onları nasıl kullanacaklarını bilecek yöntemlere yeterince aşina değilim. Diyelim ki altı aylık bir süre boyunca bir dizi düğüm ağının anlık görüntüsüne sahibim. Düğümlerin uzun kuyruklu bir derece dağılımı vardır, çoğu yalnızca birkaç bağlantıya sahipken, bazıları çok sayıda bağlantıya sahiptir. Bu süre zarfında yeni düğümler belirir.

Bir patlamaya öncülük edebileceğini düşündüğüm anormal bağlantıları tespit etmek için, kağıt üzerinde sıralı olarak indirimli normalize edilmiş maksimum olabilirlik hesaplamaları nasıl yapabilirim? Daha uygun olabilecek başka yöntemler var mı?

Hem teorik hem de pratik olarak soruyorum. Birisi beni bunu python veya R'de uygulayacak bir yolu gösterebilirse, bu çok yardımcı olacaktır.

Kimse? Akıllı olduğunuzu biliyorum, cevap için bazı başlangıç ​​düşünceleri var.


1
R / python tercihini gevşetmeyi sakıncası yoksa, bu işim yardımcı olabilir mi? goo.gl/l7SLlB Bu yöntemin avantajlarından bazıları, özellik tipleri, normalizasyonlar ve daha fazlası hakkında endişelenmenize gerek olmamasıdır.
arielf

1
Soruyu yanlış anlamadığım sürece, yöntemi kâğıttan yazarların da yöntemi uyguladığı gibi uygulayabilmelisiniz. Eğer yöntem kağıttan tekrar üretilemiyorsa, yazarlara başvurmalısınız. Yazarlar ayrıca kodlarını vermeye istekli olabilir. Özel teorik sorularınız veya programlama sorularınız varsa, ayrıca sorulmaları gerekir.
Nat

Yanıtlar:


0

Öncelikle yeni bir düğüm için anomali skoru tanımlamanız gerekir (bkz. Bölüm 3.1, 3.2). Neyse ki, yeni bir gönderi (kendi durumunda) ve yeni bir düğüm (sizin durumunuzda) arasındaki yazışma neredeyse bire birdir, çünkü yalnızca düğümün (gönderen) olduğu düğümler kümesi (kullanıcılar) ile ilgileniyoruz. ile ilgili.

Böylece, yeni bir düğümü sahip olduğu kenar / bağlantı sayısı ve bağlı olduğu diğer düğümlerin V seti ile niteleyebiliriz. Dolayısıyla denklemler (1) - (4) benzer şekilde yazılabilir. Daha sonra, yeni bir parametre tanıttıktan sonra, 3.1. Alt bölümün sonunda açıklandığı gibi Chinese Restaurant işlemini kullanabilirsiniz.γ. Şimdi, olasılıkları (3) elde ettiğin göz önüne alındığında, link-anomali skorunu (7) elde edebilirsin.

SDNML'nin uygulandığı 3.4. Alt bölümde açıklanan adımları izlemekte zorluk çekiyorsanız, ayrıca sorun.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.