Lognormal ve güç kanunu dağılımı arasındaki farkı yorumlama (şebeke derece dağılımı)


22

Öncelikle, istatistikçi değilim. Ancak doktora için istatistiksel ağ analizi yapıyorum.

Ağ analizinin bir parçası olarak, ağ derecelerinin Tamamlayıcı Birikimli Dağılım Fonksiyonunu (CCDF) çizdim. Bulduğum şey, geleneksel ağ dağıtımlarından farklı olarak (örneğin WWW), dağıtımın en iyi şekilde lognormal bir dağılıma uymasıydı. Ben bunu bir güç yasasına uymaya çalıştım ve Clauset ve arkadaşlarının Matlab betiklerini kullanarak, eğrinin kuyruğunun kesilmiş bir güç yasasına uyduğunu gördüm.

görüntü tanımını buraya girin

Noktalı çizgi, güç yasasına uygun olduğunu gösterir. Mor çizgi log-normal uyumu temsil eder. Yeşil çizgi üstel uyumu temsil eder.

Anlamak için uğraştığım şey tüm bunların ne anlama geldiği? Bu makaleyi, bu konuya biraz değinen Newman tarafından okudum: http://arxiv.org/abs/cond-mat/0412004

Aşağıda benim vahşi tahminim:

Dereceli dağılım bir güç yasası dağılımını takip ederse, bunun bağlantıların ve ağ derecesinin dağılımında doğrusal tercihli bağlanma olduğu anlamına gelir (zengin, zengin efekt ya da Yules işlemi alır).

Tanık olduğum lognormal dağılımda, eğrinin başında alt çizgi tercihli bir bağlanma olduğunu ve bunun bir güç yasasının öngördüğü kuyruğa doğru daha doğrusal hale geldiğini söylemekte haklı mıyım?

Ayrıca, rasgele değişkenin logaritması (örneğin X) normal olarak dağıtıldığında log-normal bir dağılım meydana geldiğinden, log-normal dağılımda, X'ten daha küçük ve X'den daha büyük büyük değerler olduğu anlamına gelir. Bir güç kanunu dağılımını izleyen rastgele değişken olur mu?

Daha da önemlisi, ağ derecesi dağılımı ile ilgili olarak, log-normal tercihli bir ek hala ölçeksiz bir ağ önerir mi? İçgüdülerim bana eğrinin kuyruğunun bir güç yasası ile donatılabileceğinden, ağın hala ölçeksiz özellikler gösterdiği sonucuna varılabileceğini söylüyor.


2
Mike, baktığın komployu görmenin çok ilginç olacağını düşünüyorum. Cevabınızı eklemek için düzenlemeyi düşünür müsünüz? Hemen fark ettiğim bir şey, güç yasaları ve tercihli bağlanma ile ilgili imaların geriye dönük olmasıdır. Tercihli bağlanma düzenleri (bazı) iktidar yasası dereceli dağılımlar oluştururken, tersi sonuç doğru değildir (yani tek yol bu değildir). Ne tür bir ağa baktığınıza ilişkin bazı bilgiler de yardımcı olabilir. Şerefe.
kardinal

1
Yani, tercihli bağlanma, sadece “zengin zenginleşir” efekti için bir başka isimdir, değil mi? Eğer durum buysa, doğrusal (güç yasası) ağ derece dağılımı, tercihli bağlılığı gösteren birçok derece dağılımından sadece biridir. Başka bir deyişle, eğrinin gradyanı bir log-log arsa üzerinde negatif olduğu sürece, dağılımdan bağımsız olarak bazı tercihli bağlanma elemanları vardır? O zaman log-normal ve power-law derece dağılımı arasındaki fark, tercihli bağlılık olup olmadığına değil, orantılılığına bağlıdır.
Mike,

1
Tercihli bağlanma bir ağ için güç yasası derece dağılımları üreten (stokastik) bir süreç olduğunu unutmayın . Doğrunun eğimi güç kanun için ölçekleme üs göre değişecektir, ancak bir lognormal durumunda, arsa olacak değil hatta kuyruk, doğrusal olmak. Hayatta kalma dağılımının gradyanı , etkinin ne olduğu fark etmeksizin daima negatif olacaktır . (Neden?)
kardinal

Bu çok iyi bir düzenleme. Sağol Michael! Gösterdiğiniz bölgeye lognormal uyum oldukça dikkat çekicidir. Kuyruğunda biraz parçalanıyor gibi görünüyor.
kardinal

Cevabınız için tekrar teşekkürler Kardinal. Öyleyse, tercih ettiğiniz ekin gözlemlediğim ağda hala işte olduğunu kabul ediyor musunuz? Yol açan bir başka soru da ağın ölçeksiz olup olmadığıdır. Tercihli ek ağda çalışıyorsa ve ağ yeni üyeler aldığı sürece, ağ derecesi dağılımı doğrusal olmasa da ağ ölçeksiz olarak sınıflandırılabilir. Burası tam olarak emin değilim.
Mike,

Yanıtlar:


12

Soruyu iki kısma ayırmanın faydalı olacağını düşünüyorum:

  1. Ampirik dağılımınızın işlevsel şekli nedir? ve
  2. Bu işlevsel biçim, ağınızdaki üretim süreci hakkında ne anlama geliyor?

p>0.1x15p<0.1temelde aynı şeyi yapmak anlamına gelir. Bu modeli sahip olduğunuz derece dağıtım verisi için üretim süreci olarak reddedebilir misiniz? Değilse, log-normalini "makul" kategorisine koymanıza izin verilir.

x1

İkinci soru aslında ikisinden daha zor. Yukarıdaki açıklamalarda bazılarının işaret ettiği gibi, güç yasası dağılımları üreten pek çok mekanizma vardır ve tercihli bağlanma (tüm varyasyonları ve ihtişamıyla) pek çok şeyden sadece biridir. Bu nedenle, verilerinizde bir güç yasası dağılımını gözlemlemek (gerekli istatistiksel testleri geçen gerçek bir bile olsa), üretim sürecinin tercihli bağlanma olduğu sonucuna varmak için yeterli kanıt değildir . Veya, daha genel olarak, verilerde bazı X düzenini üreten bir mekanizmaya sahipseniz (örneğin, ağınızda log-normal bir derece dağılımı). Verilerinizde X modelini gözlemlemek, verilerinizin A mekanizması tarafından üretildiğinin kanıtı değildir. Veriler A ile tutarlıdır, ancak bu A'nın doğru mekanizma olduğu anlamına gelmez.

Gerçekten A'nın cevap olduğunu göstermek için, mekanik varsayımlarını doğrudan test etmeli ve bunların sisteminiz için de geçerli olduğunu göstermeli ve tercihen mekanizmanın diğer tahminlerinin de verilerde bulunduğunu göstermelisiniz. Varsayım testi kısmına gerçekten harika bir örnek, Sid Redner tarafından yapılmıştır ( bu yazının Şekil 4'üne bakınız ), alıntı alıntı ağları için, doğrusal tercihli bağlanma varsayımının gerçekte veride bulunduğunu göstermiştir.

Son olarak, "ölçeksiz ağ" terimi literatürde aşırı yüklenmiştir, bu yüzden bundan kaçınmayı şiddetle tavsiye ederim. İnsanlar güç hukuk derecesi dağılımları ağları başvurmak için kullanmak ve(doğrusal) tercihli ataşmanla büyüyen ağlara. Ancak az önce açıkladığımız gibi, bu iki şey aynı değildir, bu yüzden ikisine de atıfta bulunmak için tek bir terim kullanmak kafa karıştırıcıdır. Sizin durumunuzda, log-normal bir dağıtım klasik lineer tercihli ek mekanizma ile tamamen tutarsızdır, bu nedenle log-normal'in 1. soruya verilen cevap olduğuna karar verirseniz (benim cevabımda), o zaman ağınızın olmadığı anlamına gelir. bu anlamda özgür ölçeklendirin. Üst kuyruğun bir güç yasası dağılımı olarak 'tamam' olması bu durumda anlamsız olacaktır, çünkü her zaman bu testi geçecek olan herhangi bir ampirik dağılımın üst kuyruğunun bir kısmı vardır (ve testten geçeceği için Çok fazla veri bulunmadığında gücü kaybeder, bu da en üst sıralarda olan şeydir.


Üst kuyruk uyumu için p-değerini söylerken <ve> karıştırdın mı?
David Nathan

Bu yorumdaki p değeri koşulları doğru. Burada belirtilen p-değerleri , büyük değerlerin iyi uyumu temsil ettiği ve küçük değerlerin kötü uyumu temsil ettiği arxiv.org/abs/0706.1062 bölüm 4.1'den gelmektedir . Bkz. Sayfa 17'nin altındaki 8 numaralı dipnot.
Jonathan S.

3

Böyle güzel bir soru. CrossValidated üzerinde başka bir yerde sorduğum bir soru ile ilgili olarak ilgili bir görüşme yapıyorum. Orada, gama dağılımının, bağlanma olasılığının, düğümlerin sürekli "popülerlik" özelliğine endojen olduğu bir sosyal ağ simülasyonunda kullanmak için iyi bir dağıtım olup olmadığını sordum. @NickCox lognormal dağılımı kullanmamı önerdi. Lognormal dağılımın, popülariteyi tanımlayan temel süreç olarak bazı teorik gerekçelere sahip olduğunu, çünkü popülerliğin birçok pozitif değerli rastgele değişkenin (örneğin, servet, gelir, boy, cinsel prowess, dövüş, IQ) bir ürünü olarak yorumlanabileceğini söyledim. Bu, bana güç yasasının teorik gerekçesinden daha mantıklı geliyor ve deney yasası değişiminin derecedeki dağılımdaki ağlar arası değişimi açıklamak için çok esnek olduğunu öne süren ampirik verilerle hareket ediyor. Lognormal, Karşılaştırma yapmak gerekirse, çok değişken bir şekle sahip olan mod, yüksek varyans için sıfıra yaklaşmaktadır. Ayrıca, derece dağılımının eğriliğinin, tercih edilen bağlanma etkisinden dolayı meydana gelen varyans ile artması gerektiği anlaşılmaktadır.

Özetle, lognormal dağılımın verilerinize en uygun olduğunu düşünüyorum çünkü lognormal dağılım, temel derece dağılım oluşum sürecini güç yasası veya üstel dağılımlardan daha iyi tanımlar.


2

Kabarcık dağılımımı saydıktan ve viskozite verileri için güç yasasını kullandıktan sonra bu siteye geliyor.

Örnek veri kümelerini gözden geçirmek, Clauset ve ark. Argümanlarını desteklemek için güç yasası veri setlerinden uzak, bazı gerçek veri setleri dehşeti ortaya koymuşlardır. Sadece sağduyulu bir şekilde, çoğu için bir veri yasası işlevini tüm veri aralığına uymaya çalışmazdım. Bununla birlikte, gerçek dünyadaki kendi kendine ölçeklendirme davranışı, gözlemlenen bir sistemin bir kısmı boyunca geçerli olabilir, ancak bazı sistem özellikleri fiziksel veya işlevsel bir sınıra ulaştığında bozuluyor.

Aşağıdaki çok okunaklı yazılar, gözlem temelli nüfus davranışı modellerine dayanarak, güç yasası ve ilgili dağılımlar hakkında iyi bir tartışma ile ekolojistler için uygun büyüme eğrisi anlamına gelir.

Yazar, Clauset ve arkadaşlarından çok daha pragmatiktir. Alıntı: "... amaç sadece en iyisi ise ve veri setinin ölçek penceresi dışındaki ölçekler tartışılmazsa, iyi bir model ürettiği ve incelenen ölçek penceresi içerisinde maksimum veya minimum üretmediği göz önüne alındığında herhangi bir model yeterli olabilir. ." “Bir başka kişi, parametre değerlerini karşılaştırabilmek için, diğer araştırmacılar kendi verilerine uyguladıkları için aynı modeli zorlamakta zorlanır, ancak daha iyi bir model veya daha iyi beklenen modellerin uygulanmasına ek olarak bunu da yapabilirler. şekiller veya her ikisi de. " Huzurlu sözler.

Tjørve, E. (2003). Tür-alan eğrilerinin şekilleri ve işlevleri: Muhtemel modellerin gözden geçirilmesi. Biyocoğrafya Dergisi, 30 (6), 827-835.

Tjørve, E. (2009). Tür-alan eğrilerinin şekilleri ve işlevleri (ii): Yeni modellerin ve parametreleştirmelerin gözden geçirilmesi. Biyocoğrafya Dergisi, 36 (8), 1435-1445.


1

Yukarıdaki sonuçlar, derece dağılımının hem güç kanunu hem de lognormal olabileceğini göstermektedir; bu, küçük dünya ve ölçeksiz mülklerin incelenen ağda birlikte var olduğunu gösterebilir. Ağın ölçeksiz olup olmadığını (sabit ölçeklendirme parametresiyle) tercihli bağlantı ile incelemek için, genellikle deneysel tasarım gerekir. Yukarıda bahsedilen Sid Redner makalesinde, büyüme hızı büyüme mekanizmasını anlamak için kullanılmaktadır. Gallos, Song ve Makse, ağı kapsayacak şekilde kutular kullanırken ve eğer ağ derece dağılımının, eğer NB (lB) ~ lB ^ -dB ise, güç yasası dağılımını takip ettiği sonucuna varmıştır. Veya küme katsayısı ve derecesi arasındaki ilişkilerin incelenmesi (ilişkinin güç yasasını sağlayıp sağlamadığı). Aksi halde, hierachical ağların hem küçük dünyaya hem de ölçeksiz ağ özelliklerine sahip olduğu tartışılmaktadır. (Fraktal ölçeğini ücretsiz yazarak,

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.