Bu ayrık dağılımın bir adı var mı?


21

Bu ayrık dağılımın bir adı var mı? İçini1...N

f(i)=1Nj=iN1j

Bu dağılıma aşağıdakilerden rastladım: Bazı faydalı işlevlere göre sıralanmış öğelerinin bir listesine sahibim . Rastgele bir listeyi seçmek istiyorum, listenin başlangıcına doğru eğilimliyim. Bu yüzden ilk önce 1 ile arasında eşit bir indisi seçiyorum . Sonra indeks 1 ve arasında bir madde seçiyorum . Bu sürecin yukarıdaki dağılımla sonuçlandığını düşünüyorum.j N jNjNj


2
Bu bir dağıtım değil: normalize edilmemiş.
whuber

@whuber İlk başta böyle düşündüm (ve yorumu yanlış anladığımı ve yorumu kaldırdığımı fark etmeden önce yorum yaptım), ancak tanımı yanlış anladım. Daha fazla yanlış anlamadığım sürece normalize edilmiş bir olasılık kütle işlevidir.
Glen_b

4
Normalleştirildi. Toplamda 1/1 tam olarak bir kez belirecektir (f (1) 'de olacaktır). 1/2 tam olarak iki kez görünecektir (f (1) ve f (2) 'de olacaktır). Böylece tüm bu toplamların toplamı N olacaktır ve normalleştirme sabiti 1 / N olarak gösterilmektedir. kontrol eder.
rcorty

1
Daha doğrusu, bu dağıtıma ne dendiğini bilmiyorum. Ayrıca tarif ettiğiniz sürecin bu rahatsızlığa nasıl yol açtığını da bilmiyorum. Düşündüğüm bir düşünce, bir parçalama sürecinin ayrı bir versiyonu gibi göründüğü, ki bu oldukça googlable.
rcorty

@Glen_b Teşekkürler. Ben oluşturmaması Telefonumda, bu okuyordu yeterince açık. f
whuber

Yanıtlar:


30

Negatif log dağılımının ayrık bir versiyonuna sahipsiniz, yani desteği ve pdf'i olan dağıtım .f ( t ) = - günlük t[0,1]f(t)=logt

Bunu görmek için, ben sette değerlerini almak için rasgele değişkeni yeniden tanımlamak için gidiyorum yerine ve sonuçtaki dağıtımı çağır . O zaman benim iddiam bu{ 0 , 1 , 2 , , N } T{0,1/N,2/N,,1}{0,1,2,,N}T

Pr(T=tN)1Nlog(tN)

olarak ise tN,t (yaklaşık olarak) sabit tutulur. tN

İlk olarak, bu yakınsamayı gösteren küçük bir simülasyon deneyi. İşte dağıtımınızdan örnekleyicinin küçük bir uygulaması:

t_sample <- function(N, size) {
  bounds <- sample(1:N, size=size, replace=TRUE)
  samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
  samples / N
}

İşte dağıtımınızdan alınan büyük örneklerin histogramı:

ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)

görüntü tanımını buraya girin

ve işte kaplanmış logaritmik pdf:

linsp <- 1:100 / 100
lines(linsp, -log(linsp))

görüntü tanımını buraya girin

Bu yakınsamanın neden gerçekleştiğini görmek için ifadenizle başlayın

Pr(T=tN)=1Nj=tN1j

ve çarp ve ile bölN

Pr(T=tN)=1Nj=tNNj1N

Toplam şimdi işlevi için bir Riemann toplamıdırg(x)=1xtN1N

Pr(T=tN)1NtN11xdx=1Nlog(tN)

ulaşmak istediğim ifade bu.


Son derece rica ederim. Bu harika bir soruydu ve bunu çözerken çok eğlendim.
Matthew Drury

6

Bu Whitworth dağılımına bağlı görünüyor. (Whitworth dağıtımı olduğuna inanmıyorum, çünkü doğru hatırlıyorsam, bu bir sıralı değerler kümesinin dağılımıdır, ancak buna bağlı görünüyor ve aynı toplama şemasına dayanıyor.)

Whitworth hakkında bazı tartışmalar var.

Anthony Lawrance ve Robert Marks, (2008)
“Sınırlı kaynaklara sahip bir sektördeki firma büyüklüğü dağılımları”,
Applied Economics , vol. 40, sayı 12, sayfa 1595-1607

(Çalışan bir kağıt versiyonu olmalı görünüyor burada )

Ayrıca bakınız

Nancy L Geller, (1979)
Whitworth dağıtımı için bir anlamlılık testi
, Amerikan Bilgi Bilimi Derneği Dergisi , Cilt 30 (4), s.229-231


2
Bu cevabı kendi kendine yeterli kılmak için Whitworth dağılımının bir tanımını yapabilir ve belki de gördüğünüz bağlantı ile ilgili birkaç açıklamada bulunabilir misiniz?
whuber

@whuber Evet, olduğu gibi bir yorum olmalıdır. Bazı detayları düzenleyeceğim ancak daha uzun sürecek bir anlaşma olacak.
Glen_b -Reinstate Monica

Sadece bir çeşit tanım iyi olurdu.
whuber

Teşekkürler, bu anlaşıldı, ancak yine de sonuç olacak.
Glen_b-Monica'yı
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.