Analitik olarak, bir miktarı rastgele bölmenin üssel bir dağılıma (örneğin gelir ve servet) neden olduğunu nasıl kanıtlayabilirim?


36

BİLİM'in bu güncel makalesinde aşağıdakiler önerilmektedir:

Diyelim ki rasgele bir şekilde 500 milyon kişiyi gelir ile 10.000 kişi arasında paylaştırın. Herkese eşit, 50.000 pay vermenin tek yolu var. Eğer kazancınızı rastgele dağıtıyorsanız, eşitlik son derece düşüktür. Ancak, birkaç kişiye çok para vermenin ve birçok kişiye hiç ya da hiçbir şey vermenin sayısız yolu vardır. Aslında, geliri dağıtabileceğiniz tüm yollar göz önüne alındığında çoğu, katlanarak gelir dağılımı sağlar.

Bunu, sonucu tekrar doğrulayan görünen aşağıdaki R kodu ile yaptım:

library(MASS)

w <- 500000000 #wealth
p <- 10000 #people

d <- diff(c(0,sort(runif(p-1,max=w)),w)) #wealth-distribution
h <- hist(d, col="red", main="Exponential decline", freq = FALSE, breaks = 45, xlim = c(0, quantile(d, 0.99)))

fit <- fitdistr(d,"exponential")
curve(dexp(x, rate = fit$estimate), col = "black", type="p", pch=16, add = TRUE)

görüntü tanımını buraya girin

Sorum
, analitik olarak ortaya çıkan dağılımın gerçekten de üstel olduğunu nasıl ispatlayabilirim?

Ek
Cevap ve yorumlarınız için teşekkür ederiz. Sorun hakkında düşündüm ve aşağıdaki sezgisel akıl yürütme ile geldi. Temel olarak aşağıdakiler olur (Dikkat: ileride basitleştirme): Miktar boyunca ilerlersiniz ve (bozuk) bir yazı tura atarsınız. Örneğin her kafa kafaya geldiğinde miktarı bölüştürürsün. Sonuçta ortaya çıkan bölümleri dağıtırsınız. Kesikli durumda, madeni para atma binom dağılımını takip eder, bölümler geometrik olarak dağılır. Sürekli analoglar sırasıyla poisson dağılımı ve üstel dağılımdır! (Aynı nedenden ötürü, geometrik ve üstel dağılımın neden ezberlik özelliğine sahip olduğu da sezgisel olarak anlaşılır - çünkü madalyonun da hafızası yoktur).


3
Parayı birer birer dağıtırsanız, eşit şekilde dağıtmak için birçok yol vardır ve neredeyse eşit şekilde dağıtmak için daha birçok yol vardır (örneğin, neredeyse normal ve ortalama ve 224'e yakın bir standart sapma olan bir dağıtım )50000224
Henry

@ Henry: Lütfen bu işlemi biraz daha açıklayabilir misiniz? Özellikle "tek tek" ile ne demek istiyorsunuz? Belki kodunu bile verebilirsin. Teşekkür ederim.
von 04

vonjd: 500 milyon jetonla başla. Her madeni parayı bağımsız ve rasgele eşit olasılıkla 10 bin birey arasında dağıtın. Her bireyin kaç para kazandığını topla.
Henry,

@ Henry: Orijinal ifade, nakit dağıtma yollarının çoğunun üstel bir dağıtım getirdiğiydi. Nakit dağıtma yolları ve madeni paraları dağıtma yöntemleri izomorfik değildir, çünkü 10.000 kişiye (500.000.000 $ ' lık veriniz ) aynı şekilde 500.000.000 $ dağıtmanın tek bir yolu vardır, ancak 500.000.000! / ((50.000!) ^ 10.000) yolu vardır. Her 10.000 kişiye 50.000 jeton dağıttı.
supercat 23

1
@Henry En üstteki açıklamada açıkladığınız senaryoda, başlangıçtan itibaren her bir insanın madeni para alma olasılığının eşit olduğu belirlenmiştir. Bu koşul, madeni paraları dağıtmanın farklı yollarını eşit olarak düşünmek yerine, normal dağılıma büyük bir ağırlık verir.
higgsss

Yanıtlar:


27

Sorunu daha basit hale getirmek için, her bir kişinin payının izin verilen değerlerinin, örneğin tamsayılar gibi ayrık olduğu durumunu düşünelim. Aynı şekilde, bir "gelir eksenini" eşit aralıklı aralıklara bölmeyi ve tüm değerlerin orta nokta tarafından verilen bir aralığa düşenlere yaklaşmayı hayal edebilir.

Toplam gelir gösteren , s olarak değeri izin inci x s , olarak toplam kullanıcı sayısını N , ve son olarak, payları kişi sayısı x s olarak n s , aşağıdaki şartın yerine getirilmesi gerekmektedir: 1 ( { n s } ) Σ s n s - N = 0 , ve Cı- 2 ( { n s } ) Σ s , n sXsxsNxsns

C1({ns})snsN=0,
C2({ns})snsxsX=0.

Payı bölmenin birçok farklı yolunun aynı dağıtımı temsil edebileceğine dikkat edin. Örneğin, bölme görüldüğü takdirde $ veren, iki kişi arasındaki 4 $ Alice 3 ve $ Bob ve tam tersi iki özdeş dağılımları verecek 1. Bölünme rastgele olduğu için, payı bölüşmenin maksimum sayıda karşılık gelen yolla dağılımı en iyi şansı verir.

Böyle bir dağılım elde etmek için, kişi yukarıda verilen iki kısıtlama altında. Lagrange çarpanları yöntemi bunun için kanonik bir yaklaşımdır. Ayrıca, bir çalışmayı seçebilirlnByerineB"olarak, kendi başınaln" monoton artan bir fonksiyon olmasıdır. Yani, lnBeyaz

W({ns})N!sns!,
lnWWlnλ1,2çarpanları. Bildirim ona göreStirling'in formülü, lnn! nlnn-n, yol dlnn!
lnWns=λ1C1ns+λ2C1ns=λ1+λ2xs,
λ1,2
lnn!nlnnn,
Bu nedenle, lnB
dlnn!dnlnn.
Daha sonra, aşağıdaki bu nsexp(-λ1-λ2xs), bir üstel dağılım olan. Biri, kısıtlamaları kullanarak Lagrange çarpanlarının değerlerini elde edebilir. İlk kısıtlamadan N
lnWnslnns.
nsexp(λ1λ2xs),
buradaΔxizin verilen değerler arasındaki boşluktur. Benzer şekilde, X
N=snssexp(λ1λ2xs)1Δx0exp(λ1λ2x)dx=1λ2Δxexp(λ1),
Δx Bu nedenle, exp(-λ1)=N2Δx
X=snsxssxsexp(λ1λ2xs)1Δx0xexp(λ1λ2x)dx=1λ22Δxexp(λ1).
ve λ2=N-
exp(λ1)=N2ΔxX,
Bu gerçekten maksimum yerine bir minimum veya bir eyer nokta O, Hessian görülebildiği arasındalnB-λ11-λ2Cı-2. ÇünküC1,2lineerdir, nsbunun aynıdır,lnB: 2 lnW
λ2=NX.
lnWλ1C1λ2C2C1,2nslnW ve 2lnB
2lnWns2=1ns<0,
Bu nedenle, Hessian içbükey ve bulduğumuz gerçekten bir maksimum.
2lnWnsnr=0(sr).

W({ns})W({ns})ns1ns

N1023


1
Teşekkürler, lütfen Glen_b'in cevabına bir göz atın. Bu, cevabınız ile tutarlı mı?
vonjd

2
@ vonjd Bir şey değil! Cevabının benimki ile tutarlı olduğunu düşünüyorum. Bana göre Poisson sürecine şu şekilde bir benzetme yapıyor gibi görünüyor: "Ortalama zaman aralığı" olan 50.000 olan bir Poisson sürecini düşünün ve 10.000 olayı sayın. Daha sonra, ortalama olarak, "toplam zaman aralığı" 50.000 x 10.000 = 500 milyondur.
higgsss

2
@ vonjd Cevabımı güncelledim. En önemlisi, tipik olarak gözlemlediğimiz dağılımın en muhtemel dağılıma yakın bir şey olması şartıyla tartışmayı ekledim.
higgsss

2
Kesikli durumlar göz önüne alındığında, T şeylerinin N insanlar ((N + T-1) seçim (N-1)) yollarına bölebileceğini gözlemlemek yardımcı olur mu? İlk kişi başka şeyler alırsa, kalanını dağıtabilecek kişi sayısı ((N + Tf-2) seçim (N-2)); bunun 0'dan N'ye kadar olan değerlerin toplamı, her şeyi dağıtmanın toplam yol sayısıdır.
supercat,

1
TN,ff(N+Tf2)(N2)=(N+Tf2)!/(N2)!/(Tf)! (N+Tf2)!/(Tf)!(Tf)N2TN2e(N2)f/T

17

Aslında bunun önemsiz olmadığını, neredeyse önemsizce olduğunu kanıtlayabilirsiniz:

500500

Bununla birlikte, tek tip boşluk örneğiniz için üstelin yakın olması gerektiğini görmek zor değil.

Poisson sürecini düşünün - olayların bazı boyutlar boyunca rastgele gerçekleştiği yerler. Aralığın birimi başına düşen olay sayısı bir Poisson dağılımına sahiptir ve olaylar arasındaki boşluk üsseltir.

Sabit bir aralık alırsanız, içine giren bir Poisson işlemindeki olaylar aralık içinde eşit olarak dağıtılır. Buraya bakınız .

[Ancak, aralığın sınırlı olduğu için, aralık uzunluğundan daha büyük boşlukları gözlemleyemezsiniz ve neredeyse o kadar büyük boşlukların olması muhtemel olmaz (örneğin, bir birim aralığındaki boşlukları düşünün - 0,04 ve 0,01, bir sonraki boşluk 0,95'ten büyük olamaz).]

n

nn+1n

Daha spesifik olarak, Poisson işlemi üzerine yerleştirilen aralıkta başlayan herhangi bir boşluğun, aralığın sonuna kadar girerek "sansürlenme" (etkili bir şekilde olması gerekenden daha kısa kesilmesi) şansı vardır.

görüntü tanımını buraya girin

Daha uzun boşlukların bunu daha kısa olanlardan daha yapma olasılığı daha yüksektir ve aralıktaki daha fazla boşluk ortalama boşluk uzunluğunun düşmesi gerektiği anlamına gelir - daha kısa boşluklar. Bu “kesilme” eğilimi, kısa aralıklardan daha uzun aralıkların dağılımını etkileme eğiliminde olacaktır (ve aralıkla sınırlı herhangi bir aralığın aralığın uzunluğunu aşma şansı yoktur - bu nedenle boşluk büyüklüğünün dağılımının düzgün bir şekilde azalması gerekir. tüm aralığın boyutunda sıfıra).

Diyagramda, uçtaki uzunca bir aralık daha kısa kesilmiş ve başlangıçtaki nispeten daha kısa bir aralık da daha kısadır. Bu etkiler bizi üstelikten uzaklaştırıyor.

n

n

İşte n = 2 için boşlukların dağılımının bir simülasyonu:

görüntü tanımını buraya girin

Çok üstel değil.

n1n+1

görüntü tanımını buraya girin

exp(21x)

görüntü tanımını buraya girin

n=10000


2
Yani sadece seni doğru anlayabilmek için: Bunun üstel olmadığını mı söylüyorsun ? Higgsss , üstel olduğunu kanıtlıyor !
vonjd

3
Cevabımı söyleyeyim: (i) "gerçekte üstel olmadığını ispatlayabilirsin" AMA (ii) 'a baktığın tek biçimli boşluklar için ... çok küçük." ... Ne belirsiz?
Glen_b

5
nsexp(λ1λ2xs)

2
Bu cevabın soruna bakmak için harika bir yol olduğunu düşünüyorum ve daha fazla puan kazanmayı hak ediyor. Yine de Poisson sürecine benzetmenin nasıl çalıştığını (örneğin, "hangi zaman" ın karşılık geldiğini) belirsiz görünebileceğinden korkuyorum. Daha fazla ayrıntı vermeye istekli misiniz?
higgsss

3
@higgsss Hafifçe yeniden ele aldım (zamana referans kaldırarak), küçük bir ayrıntı ve bir bağlantı ekledim. Daha sonra biraz daha tartışma ekleyebilirim. Belirli bir öneriniz varsa, cevabımı daha da geliştirmek istiyorum.
Glen_b

8

Paranın sınırsız bir şekilde bölünebileceğini varsayalım.

t=500000000n=10000

p(x)=n1t(1xt)n2
0xt
P(Xx)=1(1xt)n1.

XttXnn1n=2n=1

nnt(1ym)mexp(y)m


8

Diyelim ki, "rastgele olarak 500000000000000000 gelirini 10.000 kişi arasında paylaştığınızı varsayalım" sorusunu cevaplamak için yeterince spesifik değil. Sabit sayıda insana sabit miktarda para tahsis etmek için kullanılabilecek pek çok farklı rastgele süreç vardır ve bunların her biri sonuçta ortaya çıkan dağılım için kendine has özelliklere sahip olacaktır. İşte düşünebildiğim üç üretici süreç ve her birinin yarattığı zenginlik dağılımları.

library(MASS)

w <- 500000000 #wealth
p <- 10000 #people

OP tarafından gönderilen Metot 1:

[0, w) 'den' p 'sayılarını rasgele eşit olarak seçin. Bunları sırala. Öne doğru '0' ekleyin. Bu listedeki ardışık öğeler arasındaki farklarla temsil edilen dolar miktarlarını dağıtın.

d <- diff(c(0,sort(runif(p-1,max=w)),w)) #wealth-distribution
h <- hist(d, col="red", main="Exponential decline", freq = FALSE, breaks = 45,
     xlim = c(0, quantile(d, 0.99)))
fit <- fitdistr(d,"exponential")
curve(dexp(x, rate = fit$estimate), col = "black", type="p", 
      pch=16, add = TRUE)

düzgün aralık sonları

Yöntem 2:

'P' sayılarını [0, w) den rastgele bir şekilde eşit şekilde seçin. Bu 'ağırlıkları' göz önünde bulundurun, yani 'w' aslında bu aşamada önemli değil. Ağırlıkları normalleştir. Her ağırlığa karşılık gelen 'w' oranı ile temsil edilen dolar miktarlarını dağıtın.

d <- runif(p,max=w) #weigh-distribution
d <- d/sum(d)*w #wealth-distribution
h <- hist(d, col="red", main="pretty uniform", freq = FALSE, breaks = 45, 
          xlim = c(0, quantile(d, 0.99)))

kireçlenmiş ağırlıklar

Yöntem 3:

'P' 0s ile başlayın. w kez, rasgele bir şekilde seçilen bunlardan birine 1 ekleyin.

d <- rep(0, p)
for( i in 1:5000000){ ## for-loops in R are terrible, but this gives the idea.
    k <- floor(runif(1, max=p)) + 1    
    d[k] = (d[k] + 1)
}
h <- hist(d, col="red", main="kinda normalish?", freq = FALSE, breaks = 45,
          xlim = c(0, quantile(d, 0.99)))

yinelemeli dolar


4

Zeyilname hakkında bir şey ekleyeyim.

p(x)=N1X(1xX)N2,
NX

Mm

p(m)=N1M+1j=0N3(1mMj)N2.
MNN

N

Bununla birlikte, hata analizini yapmak basit görünmemektedir çünkü bu durumda farklı örneklemeler bağımsız değildir. Toplam miktarın toplamını ve ilk kişinin ne kadar alacağını, ikinci kişi için olasılık dağılımını vb. Etkiler.

Önceki cevabım bu sorundan muzdarip değil, ancak bu yaklaşımda nasıl çözülebileceğini görmenin faydalı olacağını düşünüyorum.


3

Öngörülen cevaplar tarafından yapılan iyi teorik analiz. Ancak, işte dağılımın neden üstel olduğu konusundaki basit, deneysel görüşüm.

Parayı rastgele dağıtırken, tek tek yaptığınızı düşünelim. S orijinal toplamı olsun.

İlk kişi için 0 ile S arasında rastgele bir miktar seçmelisiniz. Bu nedenle, ortalama olarak S / 2 seçecek ve S / 2 ile kalacaktır.

İkinci adam için, rasgele 0 ve ortalama olarak S / 2 arasında bir seçim yapardınız. Böylece, ortalama olarak, S / 4'ü seçersiniz ve S / 4 ile kalırsınız.

Yani, temelde toplamı her seferinde ikiye böldünüz (istatistiksel olarak konuşursunuz).

Gerçek hayattan bir örnekte sürekli yarıya kadar değerlere sahip olmayacak olsanız da, bu dağılımın neden üssel olmasını beklemeniz gerektiğini gösteriyor.


3
Algoritmanız, ilk kişiye diğerlerinden daha fazla para vermek zorunda kalıyor. Bu önyargıya sahip olmayan başka yaklaşımlar da var.
Henry,

@ Henry Parayı başka nasıl paylaşmaya başlarsın? Biriyle başlamalısın. Ve bunu yaptığınızda, önünüzdeki her şey size aittir. Ona rastgele bir kesir vermek, kelimenin tam anlamıyla rasgele seçmenin anlamıdır. Birincisi, "ilk erkeğe" sahip olmanın varsayımının yanlış olduğu söylenemez, çünkü aksi halde parayı paylaşan kişi, kaç kişi olduğunu önceden bildiğinden beri toplamı erkek sayısına böler. Bu sadece benim bakış açım: parayı "rastgele" paylaştığınızı söylerken, sadece daha fazla para alan bir kişi olacak
Bogdan Alexandru

Bogdan Alexandru: Algoritmam (başka bir cevap), ilk önce, ortada mı yoksa sonda mı olursa olsun, her bireyin dağılımının aynı olması özelliğine sahiptir. Aynı zamanda tahsis edilen toplam miktar ile sınırlandırılan alan boyunca eşit bir yoğunluğa karşılık gelir.
Henry,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.