Gangnam Style’ın Youtube görünümlerinin sayısını öngörme modeli


73

PSY'nin müzik videosu "Gangnam style" popülerdir, 2 aydan biraz fazla bir süre sonra yaklaşık 540 milyon izleyiciye sahiptir. Bunu geçen hafta akşam yemeğinde varoluşum çocuklarımdan öğrendim ve kısa bir süre sonra tartışma 10-12 gün içinde ne kadar izleyicinin olacağına dair bir tür tahminde bulunup bulunmadığı yönünde oldu. 800 milyon izleyiciyi veya 1 milyar izleyiciyi geçecek.

İşte, gönderildiğinden bu yana izleyenlerin sayısındaki resim: PSY OGS

Her ikisi de çok daha uzun zamandır devam eden No1 "Justin Biever-Baby" ve No2 "Eminem - Yalan söyleyişini seviyorum" un izleyicisinin resmi Justin Eminem

Model hakkında ilk akıl yürütme denemem bunun bir S eğrisi olması gerektiği, ancak bu No1 ve No2 şarkılarına uymuyor gibi görünüyor ve müzik videosunun kaç kez göründüğü konusunda da bir sınır yok. sadece daha yavaş bir büyüme olabilir.

Öyleyse sorum şu: müzik videosu izleyicisinin sayısını tahmin etmek için ne tür bir model kullanmalıyım?


21
Yemek masası konuşmalarını Gangnam'dan istatistiklere yönlendirmeyi başarması için +1. Senin gibi insanlara ihtiyacımız var!
Stephan Kolassa

4
Gui11aume veya bunu modellemeye çalışmak için denklem yazan diğer kişiler için faydalı olacağını umduğum tartışmaya ekleyebileceğim, KONY örneğinde, coğrafi kümelenmenin viral yayılmanın önemli bir yönü olduğudur. PSY'nin önce Koreli, sonra Asyalı bir fenomen olması gerçeği, hikayenin önemli bir parçası. Bunun nasıl modelleneceğini tam olarak bilmiyorum ama bir ipucu olabilir.

Kasım 2012 boyunca videonun görünümleri, yorumları, beğenileri ve beğenilmemesiyle ilgili veriler docs.google.com/spreadsheet/…
FredrikD

Yanıtlar:


38

Aha, mükemmel bir soru!

Ayrıca saf bir S-şekilli logisitik eğri önerebilirdim, ama bu açıkça zayıf bir uyum. Bildiğim kadarıyla, sürekli artış bir yaklaşımdır çünkü YouTube benzersiz görüşleri sayar (IP adresi başına bir tane), bu nedenle bilgisayarlardan daha fazla görüntüleme olamaz.

x(t)y(t)tXY

x˙(t)=r1(x(t)+y(t))(Xx(t))
y˙(t)=r2(x(t)+y(t))(Yy(t)),

r1>r2Yy

x˙(t)=r1x(t)(Xx(t))
y˙(t)=r2x(t),

r1>r2Yy(t)r2

Bu sistem çözer

x(t)=XC1eXr1t1+C1eXr1t
y(t)=r2x(t)dt+C2=r2r1log(1+C1eXr1t)+C2,

C1C2x(t)+y(t)

0600,000,000x(t)y(t)

x˙(t)=r1x(t)(Xx(t))
y˙(t)=r2,

ve çözer

x(t)=XC1eXr1t1+C1eXr1t
y(t)=r2t+C2.

x(0)=1t=0C1=1X11XXC2=y(0)C2=0Xr1r2

X=600,000,000r1=3.6671010r2=1,000,000

Gangnam stilinin büyüme modeli

Güncelleme: Youtube’un, IP’yi değil de, büyük bir fark yaratan görüşlerini (gizli şekilde) saydığını anladım. Çizim tahtasına geri dönelim.

Basit tutmak için, izleyicilere video tarafından "bulaştığını" varsayalım. Enfeksiyonu giderene kadar düzenli olarak izlemeye gelirler. En basit modellerden biri, aşağıdaki olan SIR'dir (Duyarlı Enfekte Dayanıklı):

S˙(t)=αS(t)I(t)
I˙(t)=αS(t)I(t)βI(t)
R˙(t)=βI(t)

αβx(t)x˙(t)=kI(t)k

Bu modelde, görüntü sayımı enfeksiyonun başlamasından bir süre sonra aniden artmaya başlar; bu, orijinal verilerde olmadığı gibi, belki de videolar viral olmayan (veya meme) bir şekilde yayıldığı için. SIR modelinin parametrelerini tahmin etmede uzman değilim. Sadece farklı değerlerle oynuyorsun, işte (R cinsinden) geldiğim şey.

S0 = 1e7; a = 5e-8; b = 0.01 ; k = 1.2
views = 0; S = S0; I = 1;
# Exrapolate 1 year after the onset.
for (i in 1:365) {
   dS = -a*I*S;
   dI = a*I*S - b*I;
   S = S+dS;
   I = I+dI;
   views[i+1] = views[i] + k*I 
}
par(mfrow=c(2,1))
plot(views[1:95], type='l', lwd=2, ylim=c(0,6e8))
plot(views, type='n', lwd=2)
lines(views[1:95], type='l', lwd=2)
lines(96:365, views[96:365], type='l', lty=2)

Gangnam tarzı Youtube videosu görünümlerinin dışlanması

Model açıkça kusursuz değil ve birçok ses yolunda tamamlanabilir. Bu çok kaba taslak, Mart 2013'ün bir yerinde milyarlarca kez görüş öngörüyor, bakalım ...


5
(+1) İlk yaklaşım olarak. Youtube'un görüş sayma politikasının, algoritmalarını halka açıklamadıkları göz önüne alındığında iyi anlaşılmadığını unutmayın. Sadece diyorlar ki: "YouTube’da bir video izleyen bir kullanıcı sayılır. Yapay olarak sayıları artırma denemelerine teşebbüs etmekten kaçınmak için bundan daha spesifik olmaz" (bkz.) .

3
@ FredrikD teşekkürler. Yanlış yaparsam hala Mart 2013’te kabul etmeyi kaldırabilirsiniz: D
gui11aume

2
SIR modeli parametre tahmini, bkz. Rsfs.royalsocietypublishing.org/content/2/2/156.full
FredrikD

1
Görünüşe göre bunu kaybedeceğim! Onlar milyon bile 2013'ten önce ... vurabilir
gui11aume

2
engadget.com/2012/12/21/gangnam-style-one-billion-views Böylece dünya bitmedi, ancak bugün 1 Milyar görüşe düştü.
DanTheMan

5

Muhtemelen, yeni ürün benimsemesini tahmin etmenin en yaygın modeli , @ gui11aume'un cevabına benzer şekilde, mevcut ve potansiyel kullanıcılar arasındaki etkileşimi modelleyen Bass difüzyon modelidir . Yeni ürünün benimsenmesi tahminlerde oldukça sıcak bir konudur, bu terimi aramak tonlarca bilgi vermelidir (ki maalesef burada genişletmek için zamanım yok).


evet, aynı zamanda bir aday model. Ancak, yalnızca bir kez kullanıcı olabileceğinizi varsayıyor gibi görünüyor. Burada, eğer "enfekte" iseniz, videoyu birkaç kez izlersiniz.
FredrikD

1
@ FredrikD: alınan nokta. (Kişisel olarak bu "ürünün" tek bir "kullanımıyla" bile oturmayı başaramasam da ...) Bununla başa çıkmak için Bas'ın genelleştirmeleri olmalı. (Utanmaz fiş) Gelecek yılın Uluslararası Tahmini Sempozyumu Seul'de yapıldı, bu yüzden herkes en sevdiği Gangnam tahmin modelini orada sunmayı düşünmeli! ;-)
Stephan Kolassa

4

Ben bakardım Gompertz büyüme eğrisi .

Gompertz eğrisi, bağımsız bir değişken olarak T zamanına sahip, 3 parametreli (a, b, c) çift katlı bir formüldür.

R kodu:

gompertz_growth <- function(a=a,b=b,c=c, t) { a*exp(b*exp(c*t)) }

Gompertz büyüme formülünün, ilk büyümede hızlanan bir çok yaşam döngüsü olayını tarif etmede iyi olduğu bilinmektedir, daha sonra incelir, türevi sol üstte sağdan daha dik olan asimetrik bir sigmoid eğrisi ile sonuçlanır. Örneğin, Vikipedi'de de doğada viral olan toplam makale sayısı, yıllardır büyük bir doğrulukla Gompertz büyüme eğrisini (belirli a, b, c parametreleriyle) izlemektedir.

Gompertz eğrilerinin tablosu: toplam büyüklük ve büyüme hızı türevi

Düzenleme: Gompertz eğrisi, aradığınız şekle yaklaşmak için yeterli değilse, Exponentaited Generalized Weibull Gompertz Dağılımıd bölümünde açıklanan parametreleri eklemek isteyebilirsiniz . Bu kağıdın bağımsız zaman parametresi yerine kullandığını unutmayın . İlginç bir şekilde, Wikipedia , 2012'den sonraki gerçek değerden bir tahmin ayrışması için tek bir 4. parametre ekleyerek en iyi yaklaşımlarını değiştirdi . Değiştirilmiş 4-param Gompertz eğrisi formülü:xtd

gompertz_2 <- function(a=A,b=B,c=C,d=D, t) {a * exp(b * exp(c*t) + d*t)}

Gompertz işlevi, onu tanımlayan ilk matematikçi olan Gauss çağdaşı (sadece 2 yıl Gauss'un juniorı) olan Benjamin Gompertz'in (1779-1865) adını almıştır .


İyi bir nokta! Bununla birlikte, modeli zorlayan, bunun bir sınır gibi görünmediğidir (No1 ve No2'ye bakınız). Yani, modeldeki a faktörü de zamanla artıyor.
FredrikD

"Bir sınır yokmuş gibi görünmüyor" diye itiraf ediyorum. Gangnam tarzı 1B'ye ulaşabilir mi? 10B? 100B? görünümler? Sonunda büyüme hızı sıfıra yaklaşır ve eğri platoları. Şu an Gangnam'da olduğumuz gibi yüksek büyüme aşamasındayken bunu görmek zor, ama sadece birkaç yıl bekle ve Gompertz kazanacaksın :) Tabii ki, doğru olanı bulmak için b, c) bu özel durum için parametreler.
arielf

2
Gompertz modelinin parametrelerini tahmin etmek için referans: bkz. Weibull.com/RelGrowthWeb/…
FredrikD

3

Sanırım çoğunu meme / viral bir şey olarak görmekte olan Gangnam Style gibi fenomenleri kendi başlarına büyük sanatçılar olan ve aynı zamanda geleneksel bir ortamda yaygın olarak yayılacak olan Justin Bieber ve Eminem'den ayırmanız gerektiğini düşünüyorum. JB ya da Eminem de çok fazla single satabilirdi, PSY'nin alacağından emin değilim.


iyi bir nokta. PSY ve "OGS" (Oppa Gangnam Style) arkasındaki ekip röportajlarını okuduktan ve dinledikten sonra, viral bir şey oluşturmak için hangi düğmeye basacaklarını iyi bildikleri açıktır. Yukarıdaki görünüm resimlerinin bazı görüntü analizleri sayesinde, görünüm sayısının lansmandan yaklaşık 90 gün öncesine kadar doğrusal olduğu, ardından PSY'nin Kore Grand Prix'sinde göründüğü görülüyor ve zaman birimindeki görünüm sayısı artıyor.
FredrikD

- ve bu iki sınıf nasıl "klasiklerden" farklıdır - ilk YouTube'a yüklendiklerinde muhtemelen iyi bilinen şarkılar (David Bowie'yi düşünüyorum)?
abaumann

2

5
Siteye Hoşgeldiniz @ ProfRoy47. Bu yazıyı biraz detaylandırabilir misiniz? Bunun aslında OP'nin sorusuna bir cevap olduğu açık değil / tamamen kendi başına duruyor. OTOH, bir yorum olarak sığmayacaktı & bence bu konuya faydalı bir katkı yapabileceğini düşünüyorum. Bizim SSS sizin için yararlı olabilir CV sağlayan cevapları, yeniden bazı tartışma vardır.
gung

1

Model açıkça kusursuz değil ve birçok ses yolunda tamamlanabilir. Bu çok kaba taslak, Mart 2013'ün bir yerinde milyarlarca kez görüş öngörüyor, bakalım ...

Geçtiğimiz haftaki görünümlerdeki yavaşlamaya bakıldığında, Mar-13 tarihi iyi bir bahis gibi gözüküyor. Yeni görünümlerin çoğu, günde birden çok kez dönen virüslü kullanıcılar olarak görünmektedir.

Modelinizi tamamlama ile ilgili olarak, araştırmacıların bir virüsün yayılmasını izlemek için kullandıkları bir yöntem genom mutasyonlarını izlemektir - mutasyona uğradığı zaman ve nerede araştırmacılara bir virüsün ne kadar hızlı bulaşıp yayıldığını gösterebilir (bkz. ABD'de West Nile Virus izleme) .

Pratik anlamda, Gangnam Style ve Party Rock Anthem (LMFAO grubu tarafından) gibi videoların, Justin Bieber'ın Baby veya Eminem şarkılarından daha fazla parodi, flaş çetesi, düğün dansı, remiks ve diğer video yanıtlarına 'mutasyona uğraması' muhtemeldir.

Araştırmacılar mutasyonlar için bir vekil olarak video yanıtlarının sayısını (ve özellikle de parodileri) analiz edebilirler. Bu mutasyonların sıklığını ve popülaritesini videonun yaşamının başlarında ölçmek, kullanım ömrü boyunca YouTube görüşlerini modellemekte faydalı olabilir.


Siteye hoş geldin, @lucasng. Özgeçmiş, temel sorulara ciddi, olgusal cevaplar vermeyi amaçlamaktadır ( sss'imizi okumak isteyebilirsiniz ) ve OP'nin bunu aklından geçirdiğini sordum. Cevabınız burada sınırda; Mutasyonlar vb. Hakkındaki düşüncelerine dayanarak kalması gerektiğini düşünüyorum, ancak videoların esası hakkındaki fikirlerin gerçekten alman olmadığını unutmayın.
gung

Bence bu fikir güzel. @gung True’in OP’ye bir cevap olmadığı, ancak ikinci yanıtın da olmadığı.
gui11aume

@gung: (Bir Google araması, şunu önerir) lucasng, yeniden düzenlediğiniz kısımda bir görüş belirtmiyor, şarkıyı söyleyen grubun ismine işaret ediyor!
kardinal

1
@ cardinal, heads up için teşekkürler. Lucasng, karışıklık için üzgünüm; Grup adını geri koydum.
gung
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.