Kırık bir çubuğun en büyük parçasının dağılımı (boşluklar)


21

1 uzunluğundaki bir çubuğun rastgele eşit olarak fragmanları halinde kırılmasına izin verin . En uzun parçanın uzunluğunun dağılımı nedir?k+1

Daha resmi olarak, IID olsun ve ilişkili ilişkili sipariş istatistikleri olsun, yani sadece sipariş verelim. örnek, . Let .(U1,...Uk)U(0,1)(U(1),...,U(k))U(1)U(2),...,U(k)Zk=maksimum(U(1),U(2)-U(1),...,U(k)-U(k-1),1-U(k))

dağıtımı ile . Momentler, asimptotik sonuçlar veya k \ uparrow \ infty için yaklaşık değerler de ilginçtir. k Zkk


9
Bu iyi çalışılmış bir sorundur; bakınız R. Pyke (1965), "Spacings," JRSS (B) 27 : 3, sayfa 395-449. Birileri beni atmadığı sürece daha sonra bilgi eklemek için geri gelmeye çalışacağım. Aynı yazarın 1972 tarihli bir makalesi de var (“ Boşluklar tekrar ziyaret edildi ”) ama bence peşinde olduğun şey hemen hemen hepsi. Devroye'de (1981) , "Düzgün Aralıkların Sıra İstatistikleri İçin İterasyonlu Logaritmanın Yasası", Asimptotikler var . Probab. , 9 : 5, 860-867.
Glen_b -Reinstate Monica

4
Bunlar, daha sonra ihtiyacınız olursa daha sonra çalışmanız için iyi arama terimleri de vermelidir.
Glen_b -Reinstate Monica

3
Bu harika. İlk referansı bulmak zor. İlgilenenler için Grand Locus'a yazdım .
gui11aume

Lütfen yanlış yazdırmayı düzeltin: yerine . Y(k)U(k)
Viktor,

@Viktor teşekkürler! Böyle küçük şeyler için, düzenlemeyi kendiniz yapmaktan çekinmeyin (onayın diğer kullanıcılar tarafından inceleneceğini düşünüyorum).
gui11aume

Yanıtlar:


18

@Glen_b tarafından verilen bilgilerle cevabı bulabilirim. Soru ile aynı notasyonları kullanmak

P(Zkx)=Σj=0k+1(k+1j)(-1)j(1-jx)+k,

burada eğer ve , aksi. Aynı zamanda Gumbel ( NB : Beta değil ) dağılımına ilişkin beklenti ve asimptotik yakınsamayı da veriyorum.a > 0 0bir+=birbir>00

E(Zk)=1k+1Σben=1k+11ben~günlük(k+1)k+1,P(Zkx)~exp(-e-(k+1)x+günlük(k+1)).

İspatların materyali referanslarda yer alan çeşitli yayınlardan alınmıştır. Onlar biraz uzun, ama basit.

1. Kesin dağılımın kanıtı

Let aralığında olmasına IID düzgün rastgele değişkenler . Onları sipariş ederek, belirtilen sırası istatistiklerini elde ediyoruz . Tek biçimli boşluklar , ve . Sıralanan boşluklar, karşılık gelen sıralı istatistiklerdir . İlgili değişken .( 0 , 1 ) k ( U ( 1 ) , ... , U ( k ) ) Δ i = U ( i ) - U ( i - 1 ) , U ( 0 ) = 0 , U ( k + 1 ) = 1 Δ ( 1 )(U1,...,Uk)(0,1)k(U(1),...,U(k))Δben=U(ben)-U(ben-1)U(0)=0U(k+1)=1 Δ ( k + 1 )Δ(1)...Δ(k+1)Δ(k+1)

Sabit , gösterge değişkenini tanımlarız . Simetriye göre, rasgele vektör değişebilir, bu nedenle büyüklüğünde bir alt kümenin eklem dağılımı, ilk . Ürünü genişleterek, böylece elde1 i = 1 { Δ i > x } ( 1 1 , , 1 k + 1 ) j jx(0,1)1ben=1{Δben>x}(11,...,1k+1)jj

P(Δ(k+1)x)=E(Πben=1k+1(1-1ben))=1+Σj=1k+1(k+1j)(-1)jE(Πben=1j1ben).

Şimdi , ki yukarıda verilen dağılımı belirleyeceğini ispatlayacağız . Genel durum da benzer şekilde kanıtlandığı için bunu için kanıtlıyoruz. j = 2E(Πben=1j1ben)=(1-jx)+kj=2

E(Πben=121ben)=P(Δ1>xΔ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).

Eğer , kesme noktaları aralığı içindedir . Koşullu olarak, bu olayda kesme noktaları hala değişebilir, bu nedenle, ikinci ve birinci kesme noktası arasındaki mesafenin büyük olması olasılığı, birinci kesme noktası ile sol bariyer arasındaki mesafenin ( ) olma olasılığı ile aynıdır. büyük . Yanik ( x , 1 ) x x xΔ1>xk(x,1)xxx

P(Δ2>x|Δ1>x)=P(tüm noktalar içinde (2x,1)|tüm noktalar içinde (x,1)),yaniP(Δ2>xΔ1>x)=P(tüm noktalar içinde (2x,1))=(1-2x)+k.

2. Beklenti

Sonlu destekli dağıtımlar için

E(X)=P(X>x)dx=1-P(Xx)dx.

Dağılımını entegre , elde ederizΔ(k+1)

E(Δ(k+1))=1k+1Σj=1k+1(k+1j)(-1)j+1j=1k+1Σj=1k+11j.

Son eşitlik, harmonik sayılarının klasik bir temsilidir .Hi=1+12++1ben

Hk+1=011+x++xkdx=011xk+11xdx.

değişkeninin değişmesi ve ürünü genişletereku=1x

Hk+1=01j=1k+1(k+1j)(1)j+1uj1du=j=1k+1(k+1j)(1)j+1j.

3. Düzgün aralıkların alternatif yapısı

En büyük parçanın asimptotik dağılımını elde etmek için, toplamlara bölünerek üstel değişkenler olarak düzgün aralıklarla klasik bir yapı sergilememiz gerekir. İlgili sipariş istatistiği olasılık yoğunluk olduğu(U(1),,U(k))

fU(1),U(k)(u(1),,u(k))=k!,0u(1)u(k+1).

Biçimdeş aralıkları belirtmek durumunda , ile elde ederiz,Δi=U(i)U(i1)U(0)=0

fΔ1,Δk(δ1,,δk)=k!,0δi++δk1.

tanımlayarak , böylece elde ederiz.U(k+1)=1

fΔ1,Δk+1(δ1,,δk+1)=k!,δ1++δk=1.

Şimdi, , ortalama 1 ile IID üstel rasgele değişkenler olsun ve . Basit bir değişken değişikliği ile bunu görebiliriz.(X1,,Xk+1)S=X1++Xk+1

fX1,Xk,S(x1,,xk,s)=es.

tanımlayın , öyle ki değişkenin değişmesi ile elde ederizYi=Xi/S

fY1,...Yk,S(y1,...,yk,s)=ske-s.

Bu yoğunluğu ile bütünleştirerek , böyleces

fY1,...Yk,(y1,...,yk)=0ske-sds=k!,0yben+...+yk1,ve böylecefY1,...Yk+1,(y1,...,yk+1)=k!,y1+...+yk+1=1.

Bu nedenle, tek biçimli aralıkların aralığındaki eklem dağılımı, üstel rasgele değişkenlerinin eklem dağılımları ile aynıdır , toplamlarına bölün. Aşağıdaki dağılım denkliğine geldikk+1(0,1)k+1

Δ(k+1)X(k+1)X1++Xk+1.

4. Asimptotik dağılım

Yukarıdaki denkliği kullanarak,

P((k+1)Δ(k+1)log(k+1)x)=P(X(k+1)(x+log(k+1))X1++Xk+1k+1)=P(X(k+1)log(k+1)x+(x+log(k+1))Tk+1),

burada . Bu değişken olasılık içinde kaybolur, çünkü ve . Asimptotik olarak, dağılım aynıdır . Çünkü IID, bizTk+1=X1++Xk+1k+11E(Tk+1)=0Var(log(k+1)Tk+1)=(log(k+1))2k+10X(k+1)log(k+1)Xi

P(X(k+1)log(k+1)x)=P(X1x+log(k+1))k+1=(1exlog(k+1))k+1=(1exk+1)k+1exp{ex}.

5. Grafiksel genel bakış

Aşağıdaki çizim, farklı değerleri için en büyük parçanın dağılımını göstermektedir . İçin , aynı zamanda asimptotik Gumbel dağılımına (ince çizgi) üst üste gelmiş. Gumbel, değerinin küçük olması için çok kötü bir yaklaşımdır, bu yüzden resmi aşırı yüklememelerini ihmal ettim. Gumbel yaklaşımı kadardır .kk=10,20,50kk50

Kırık bir çubuğun en büyük parçasının dağılımı

6. Kaynaklar

Yukarıdaki ispatlar referans 2 ve 3'ten alınmıştır. Alıntılanan literatür, herhangi bir sıradaki sıralı aralıkların dağılımı, limit dağılımları ve sıralı tek biçimli aralıkların bazı alternatif yapıları gibi daha birçok sonuç içerir. Anahtar referanslara kolayca erişilemiyor, bu yüzden tam metne bağlantılar da veriyorum.

  1. Bairamov ve diğ. (2010) Sıralanan tekdüze aralıklar için sonuçları sınırlama, Stat papers, 51: 1, pp 227-240
  2. Holst (1980) Rasgele kırılmış bir çubuk parçalarının uzunlukları üzerinde , J. Appl. Prob., 17, sayfa 623-634
  3. Pyke (1965) Aralıklar , JRSS (B) 27: 3, sayfa 395-449
  4. Renyi (1953) Düzen istatistikleri teorisi üzerine , Acta math Hung, 4, s. 191-231

Parlak. Bu arada, bilinen bir asimptotik var mı? E(Zk2)
Amir Sagiv

@AmirSagiv bu iyi bir soru. Referanslara hızlıca baktım ve bulamadım. Ayrıca yukarıdaki kanıtı da uyarlayamadım. Bu bir Gumbel karesinin dağılımının ne olduğunu bilmediğimi fark etmemi sağladı. Belki başlamak için iyi bir yer?
gui11aume

1
$ gui11aume Buraya bakın: mathoverflow.net/a/293381/42864
Amir Sagiv

1
@AmirSagiv Bu çok iyi bir yazı. Bir nedenden ötürü, sorunuzu yanlış anladım ve asimptotik dağılımına ilgi duyduğunuzu düşündüm (yorumunuz çok açık olmasına rağmen), bu yüzden yukarıdaki yorumum bu kadar alakalı değil. Zk2
gui11aume

3

Bu tam bir cevap değil, ancak bazı hızlı simülasyonlar yaptım ve elde ettiğim de bu: En uzun parçanın histogramı

Bu, dikkat çekici bir şekilde beta-ish görünüyor ve bu, bir anlam ifade eden dağılımların düzen istatistikleri beta wiki olduğundan, biraz mantıklı geliyor .

Bu sonuç pdf türetmek için bazı başlangıç ​​noktası verebilir.

Son bir kapalı çözüme ulaşırsam güncelleme yapacağım.

Şerefe!


Sadece bir şey daha, k'yi artırmak için histogramın şekli, 0'a yakın "squisel" olmaktan başka, önemli ölçüde değişmez.
Lima,

1
Düşünceleriniz için teşekkürler @ Lima (ve Cross Validated'e hoş geldiniz). Bence cevabınız geliştirilebilir. İlk olarak, kanıt olmadan açıklama yapmaktan kaçınırdım. Eğer bu yanlışsa, bu konuyu gören insanları yanlış yolda bırakabilirsiniz. İkincisi, yaptığınız şeyi belgeleyeceğim. Kullandığınız değeri veya kod olmadan, şekil kimseye yardımcı olmaz. Son olarak, cevabı kopyalayıp düzenler ve doğrudan soruyu yanıtlamayan her şeyi kaldırırdım. k
gui11aume

1
Önerileriniz için teşekkürler. Yığın değişiminin ötesinde geçerlidirler ve onları kullanmayı hatırlayacağım.
Lima,

1

Bir konferansın cevabını 2005 yılında Siena'da (İtalya) ürettim. Makale (2006) burada web sitemde (pdf) sunulmaktadır . Tüm aralıkların tam dağılımları (en küçükten en büyüğe) sayfa 75 ve 76'da bulunmaktadır.

Bu konuyla ilgili Eylül 2016’da Manchester’de (İngiltere) yapılan RSS Konferansında sunum yapmayı umuyorum.


2
Siteye Hoşgeldiniz. Sorular ve cevaplar şeklinde yüksek kalitede istatistiksel bilgilerin kalıcı bir deposunu oluşturmaya çalışıyoruz. Bu nedenle, linkrot nedeniyle sadece link cevaplarına karşı temkinliyiz. Öldüğü takdirde, linkte yer alan bilgilerin bir özetini ve bir özetini gönderebilir misiniz? Ayrıca, lütfen yayınlarınızı burada imzalamayın. Her yayın, bu bilgileri yayınlayabileceğiniz kullanıcı sayfanıza bir bağlantı içerir.
gung - Monica 'ya geri dönün
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.