Stokastik süreç gibi çığ


16

Aşağıdaki işlemi düşünün:

Yukarıdan aşağıya doğru düzenlenmiş kutu vardır . Başlangıçta her bölmede bir top bulunur. Her adımda, bizn

  1. rastgele bir top seçin veb
  2. içeren seleden tüm topları altındaki seleye taşıyın . Zaten en düşük kutu ise, topları işlemden kaldırırız.b

İşlem sona erene kadar, yani tüm toplar işlemden çıkarılıncaya kadar kaç adım beklenir ? Bu daha önce incelendi mi? Cevap bilinen tekniklerden kolayca takip ediliyor mu?n

En iyi durumda, işlem adımdan sonra tamamlanabilir . En kötü durumda adımlarını atabilir . Her iki durum da pek olası değildir. My varsayım o almasıdır adımlarını ve bazı deneyler yaptık görünüyor bu onaylayın.Θ ( n 2 ) Θ ( n log n )nΘ(n2)Θ(nlogn)

(Bir kutuyu rasgele bir şekilde , bitirmek için açıkça adımlarını alacak çok farklı bir işlem olduğunu unutmayın .)Θ(n2)


Soru ilginç görünüyor (yanıtı bilmememe rağmen). Monotonik olmama nedeniyle zor görünüyor; tüm n topları üst bölmedeyse, işlem tam olarak n adımda açıkça sona erer.
Tsuyoshi Ito

Yanıtlar:


11

Gerçekten bir cevap değil, András'ın cevabı hakkında genişletilmiş bir yorum.

András'ın cevabı hoş bir sezgi içeriyor, ancak beklenen adım sayısının titiz bir hesaplaması olduğuna inanmıyorum. Bence bu belki de bir cevaba iyi bir yaklaşımdır, ancak en üstteki çöp kutusunun altındaki çöp kutusunun üst haznenin aşağı doğru boşaltılmasından önce boşaldığı durumlarla düzgün bir şekilde ilgilenmiyor gibi görünmektedir. Yine de, bu makul bir yaklaşım olabilir (emin değilim).

Hesaplaması, ölçeklendirmeyi etkileyen bir hata içeriyor. Aynı başlangıç ​​noktasını alacağım ve hesaplamayı tekrar yapıp genişleteceğim.

Rastgele Doğru sele seçme olasılığı gibi, toplamı içindeki p bir faktör özlüyor 1yerine npn . Sonuç olarak1n

n+p=1nk=0(k+1)pn(npn)k=n+p=1npnk=0(k+1)(npn)k=n+p=1npnn2p2=n+np=1n1/p=n(1+Hn)

burada n'inci Harmonik sayıdır . H n'ye yaklaşmak için toplamı basitçe bir integralle değiştirebiliriz: H nn + 1 1 1Hn=p=1n1/pHn. Böylece ölçeklemen(1+log(n+1))veya yaklaşıknlog(n+1) olur. Bu ölçeklendirme, problemin ölçeklendirmesiyle tam olarak eşleşmese de (aşağıdaki simülasyona bakın), neredeyse tam olarak birgünlükfaktörü ile ortadankalkar(2).Hn1n+11xdx=log(n+1)n(1+log(n+1))nlog(n+1)log(2)

Simülasyon ve teori

Kırmızı daireler: Ortalama 10k koşu üzerinde işlemin simülasyonundan elde edilen veri noktaları. Yeşil: . Mavi: n günlüğü ( n + 1 ) .nlog2(n+1)nlog(n+1)


@ Joe: İyi iş çıkardın! Artık faktörünün boşlukların yaratılmasından nasıl geldiğini titizlikle göstermek ilginç olurdu . ln2
András Salamon

@ András: Yapılması gereken sağlam bir yaklaşım olup olmadığı konusunda gerçekten iyi bir his yok. @ Peter'ın aşağıya doğru kayması olan demet oluşturma fikri, bunların herhangi bir kutuda eşit olarak oluşma olasılığını varsayarak doğru ifadeyi vermesi gerektiği gibi görünüyor.
Joe Fitzsimons

@Joe: En üstteki top, vakaların yaklaşık 1 / 3'ünde izole kalacak. En iyi 3 topu düşünün. Ortadaki ilk önce seçilirse (bu 3'ten), üçüncü olana katılır. Bu ikisi, o andan itibaren, üst topun iki katı daha hızlı hareket edecek. Onlar ve üst top arasındaki mesafe çok taraflı bir rastgele yürüyüştür ve üst topun yakalanma olasılığı küçük (ish) bir sabitle sınırlıdır (kaba tahmin% 15). Ama iyi haber şu ki, en iyi log n topları gerçekten önemli değil. N \ log n adımlarında diğer her şey temizlenirse, yalnızca ek n \ log n adımları ekler.
Matthias

İşte iki parsel. Hem bölü adım sayısını göstermek her şeye kadar, ama log n topları temizlenir. Birincisi için, sistemden düşen toplar hala seçilebilir ( András'ın önerdiği gibi): tinyurl.com/2wg7a9y . İkincisi için, sistemden ayrılan toplar artık seçilmiyor : tinyurl.com/33b63pq . Gördüğünüz gibi, ilk sürecin verebileceği sınırlar muhtemelen çok zayıf. Belki sistemdeki top sayısını her zaman yarıya indirdiğimiz aşamaları (Peter'ın bir yerde yazdığı gibi) dikkate alarak ayarlanabilir. nlogn
Matthias

@Matthias: Peter'ın sezgisinin doğru olduğunu varsayarak beklenen süreyi analiz etmek yol bloğu değildir (en azından benim bakış açımdan). Bana göre bu sezginin aslında ne olduğuna dair adil bir yansıma olduğunu kanıtlamakla birlikte, bunun iyi bir yaklaşım olduğundan şüpheleniyorum.
Joe Fitzsimons

9

Düzenleme: Bu cevap (şimdilik) teoremleri ispatlamak için dağınık sürecini göstermek için olduğu gibi bırakıyorum, yayımlanan makalelerin dışında bırakılan bir şey. Buradaki temel sezgi, topun her tarafını süpürdüğü için üst topa odaklanmak için yeterli olmasıdır. Lütfen yorumlara (özellikle @Michael boşlukların oluşabileceğine işaret ederek) ve @ Joe'nun hataların nasıl tanımlandığı ve düzeltildiği konusundaki daha sonraki cevabına bakın. Özellikle Joe'nun formüllerin mantıklı olup olmadığını iki kez kontrol etmek için deneyleri kullanmasını seviyorum.


n(1+π2/6)n

b1b2bnb1=nb2n1bini+1b1b2bn1,2,,n). Bunlar birbiri ardına ayrı olaylar olarak görülebilir. Beklenen adım sayısı

n+p=1nk=0k+1n(npn)k=n+p=1n11npk=1k(npn)k=n+p=1n11npn(np)/p2=n+np=1n11/p2(1+π2/6)n.


3
@Andras @Joe: Kutsal schmoley. Bu sitedeki soruları soran herkes sorularını cevapladığınız kadar ciddiye alırsa, bu internetteki en kötü url olurdu.
Aaron Sterling

1
@ András: İfadenizi anlamaya çalışıyorum "bir dizi top, bir alt çizgi içeriyorsa tüm kutuları tam olarak temizleyecektir ...". Belki bir şeyi yanlış anladım, ama dört topumuz olduğunu söylüyorum. Dizi 3,4,3,2,4 ise, sonraki gereksiniminizi karşılıyor gibi görünüyor, ancak tüm kutular temizlenmemiştir.
Michael

1
@ András: Makul bir üst sınır göstermek istiyorsanız, topların işlemden kaybolduğu ve artık toplanmadığı gerçeğini kullanmalısınız. Aksi takdirde, en üstteki top her zaman sadece 1 / n olasılıkla seçilir ve bu topun tüm zaman boyunca izole kalması için iyi bir şans (belki de 1/2'den biraz daha az) vardır. Bu top için n ^ 2 adımına ihtiyacınız olacak.
Matthias

1
@Michael: Sanırım hatayı tespit ettiniz. Yanlışlıkla üst topun bir boşluk olsa bile aşağı doğru hareket edeceğini varsayıyorum.
András Salamon

2
O(n)O(nlogn)n/2logn
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.