Rastgele oluşturulmuş bir ikili arama ağacının logaritmik yüksekliğine sahip olduğunun kanıtı

Nasıl bir rasgele inşa beklenen yüksekliği kanıtlamak do ikili arama ağacına sahip düğümler olan ? CLRS Algoritmalara Giriş'te (bölüm 12.4) bir kanıt var , ama anlamıyorum. $n$ $O(\log n)$

— user1675999
kaynak

Hangi soru? Ne örneği? Lütfen tüm ayrıntıları düzenleyin ve verin.

— Ran G.

Lütfen kısaltmalar kullanmaktan kaçının (BST gibi) ve çoğumuzda CLRS kitabı bulunmadığını varsayın. Teoremi buraya kopyalayabilir ve anlamadığınız şeyin ne olduğunu açıklayabilirseniz, daha fazla cevap alırsınız.

— Ran G.

Bu, ikili arama ağacının nasıl oluşturulduğuna bağlı olacaktır . (Sonuç olmasa bile, kanıt olacaktır.) Daha fazla ayrıntı yararlı olacaktır.

— Peter Shor

Önce bunu sezgisel olarak düşünelim. En iyi senaryoda, ağaç mükemmel bir şekilde dengelenir; en kötü senaryoda, ağaç tamamen dengesizdir:

Yükseklik dengeli ikili arama ağacı En kötü durum ikili arama ağacı

Kök düğümü başlayarak , bu sol ağacın izleyen her derinlikte iki kat fazla düğümü vardır, böylece ağaç düğüm ve bir yükseklik (bu durumda 3). Biraz matematikle , yani yükseklik. Tamamen dengesiz ağaç için ağacın yüksekliği basitçe . Yani sınırlarımız var. $p$ $n=\sum_{i=0}^{h}2^i =2^{h+1}-1$ $h$ $n\le2^{h+1}-1\rightarrow h\le\lceil\log_2(n+1)-1\rceil\le\lfloor log_2 n\rfloor$ $O(\log n)$ $n-1\rightarrow O(n)$

sıralı bir listesinden dengeli bir ağaç orta düğümü kök düğümümüz olarak seçerdik. Bunun yerine rastgele bir ağaç inşa halinde, herhangi düğümler eşit olasılıkla alınmayı ve bizim ağacın yüksekliği: İkili bir arama ağacında, sol alt ağacın yalnızca kök düğümden daha az anahtar içermesi gerektiğini biliyoruz. Bu nedenle, öğesini rastgele seçersek, sol alt ağacın öğeleri ve sağ alt ağacın öğeleri vardır, bu yüzden daha kompakt: $\{ 1,2,\dots,n\}$ $n$

h e i g h t_{t r e e} = 1 + max (h e i g h t_{l e f t s u b t r e e}, h e i g h t_{r i g h t s u b t r e e})

$height_{tree}=1+\max (height_{left\space subtree}, height_{right\space subtree})$

i^{t h}

$i^{th}$

i - 1

$i-1$

n - i

$n-i$

h_{n} = 1 + max (h_{i - 1}, h_{n - i})

$h_n=1+\max (h_{i-1},h_{n-i})$ . Oradan, eğer her bir elemanın eşit şekilde seçilmesi muhtemelse, beklenen değerin tüm vakaların ortalamasıdır (ağırlıklı bir ortalamadan ziyade). Bu nedenle:

E [h_{n}] = \frac{1}{n} \sum_{i = 1}^{n} [1 + max (h_{i - 1}, h_{n - i})]

$\operatorname{E}[h_n]=\frac{1}{n}\sum_{i=1}^{n}[1+\max (h_{i-1},h_{n-i})]$

Fark ettiğinizden eminim, CLRS'in bunu nasıl kanıtladığından biraz saptım, çünkü CLRS, başlatılmamışlar için rahatsız edici olan nispeten yaygın iki kanıt tekniği kullanıyor. Birincisi, bulmak istediğimiz şeyin (veya bu durumda yükseklik) üslerini (veya logaritmalarını) kullanmaktır, bu da matematiğin daha temiz çalışmasını sağlar; ikincisi (burada görmezden geleceğim) gösterge işlevlerini kullanmaktır. CLRS üstel yüksekliği olarak tanımlar , dolayısıyla benzer yineleme . $Y_n=2^{h_n}$ $Y_n=2\times\max (Y_{i-1},Y_{n-i})$

Bağımsızlık varsayalım (bir elemanın her bir çiziminin (mevcut elemanların dışında) bir alt ağacın kökü olduğu varsayılırsa, önceki tüm çekimlerden bağımsız olarak) şu ilişki var: iki adımda attım: (1) dışında bir sabit olduğu ve özelliklerinden biri ve (2) aynı zamanda sabit olduğu ve beklenen değerlerin özelliklerinden biri . Şimdi yerini alacağız

E [Y_{n}] = Σ_{ben = 1}^{n} \frac{1}{n} E [2 x maksimum (Y_{ben - 1}, Y_{n - ben})] = \frac{2}{n} Σ_{ben = 1}^{n} E [maksimum (Y_{ben - 1}, Y_{n - ben})]

$\operatorname{E}[Y_n]=\sum_{i=1}^{n}\frac{1}{n}\operatorname{E}[2\times\max (Y_{i-1},Y_{n-i})]=\frac{2}{n}\sum_{i=1}^{n}\operatorname{E}[\max (Y_{i-1},Y_{n-i})]$

\frac{1}{n}

$\frac{1}{n}$

\sum_{i} c i = c \sum_{i} i

$\sum_i ci=c\sum_i i$

E [a x] = a E [x]

$\operatorname{E}[ax]=a\operatorname{E}[x]$

max

$\max$ Aksi takdirde sadeleştirmek zordur, çünkü daha büyük bir şeyle çalışır. Negatif olmayan için tartışırsak , : , o zaman: öyle ki son adım , ve ve tüm yolu , ve , yani her terim

X

$X$

Y

$Y$

E [max (X, Y)] \leq E [max (X, Y) + min (X, Y)] = E [X] + E [Y]

$\operatorname{E}[\max(X,Y)]\le\operatorname{E}[\max(X,Y)+\min(X,Y)]=\operatorname{E}[X]+\operatorname{E}[Y]$

E [Y_{n}] \leq \frac{2}{n} Σ_{ben = 1}^{n} (E [Y_{ben - 1}] + E [Y_{n - ben}]) = \frac{2}{n} Σ_{ben = 0}^{n - 1} 2 E [Y_{ben}]

$\operatorname{E}[Y_n]\le\frac{2}{n}\sum_{i=1}^{n}(\operatorname{E}[Y_{i-1}]+\operatorname{E}[Y_{n-i}])=\frac{2}{n}\sum_{i=0}^{n-1}2\operatorname{E}[Y_{i}]$

i = 1

$i=1$

Y_{i - 1} = Y_{0}

$Y_{i-1}=Y_{0}$

Y_{n - i} = Y_{n - 1}

$Y_{n-i}=Y_{n-1}$

i = n

$i=n$

Y_{i - 1} = Y_{n - 1}

$Y_{i-1}=Y_{n-1}$

Y_{n - i} = Y_{0}

$Y_{n-i}=Y_{0}$

Y_{0}

$Y_0$ to ifadesi iki kez görünür, böylece toplamın tamamını benzer bir değiştirebiliriz. İyi haber şu ki, yineleme ; Kötü haber şu ki, başladığımız yerden çok daha ileri değiliz.

Y_{n - 1}

$Y_{n-1}$

E [Y_{n}] \leq \frac{4}{n} \sum_{i = 0}^{n - 1} E [Y_{i}]

$\operatorname{E}[Y_n]\le\frac{4}{n}\sum_{i=0}^{n-1}\operatorname{E}[Y_{i}]$

Bu noktada CLRS, indüksiyon kanıtı olan ... matematiksel deneyim repertuarından çıkarır. kanıtlamak için kullanıcıya bıraktıkları kimliğini içerir . ilgili önemli olan, en büyük teriminin ve üstel yükseklik kullandığımızı . Belki birisi bu özel binomun neden seçildiğini yorumlayacaktır. Ancak genel fikir nüksümüzün yukarısından bazı sabit için ifadesi ile bağlanmaktır . $\operatorname{E}[Y_n]\le\frac{1}{4}\binom{n+3}{3}$ $\sum_{i=0}^{n-1}\binom{i+3}{3}=\binom{n+3}{4}$ $n^3$ $Y_n=2^{h_n}$ $h_n=\log_2n^3=3\log_2n\rightarrow O(\log n)$ $n^k$ $k$

Tek bir astar ile sonuçlandırmak için:

2^{E [X_{n}]} \leq E [Y_{n}] \leq \frac{4}{n} Σ_{ben = 0}^{n - 1} E [Y_{ben}] \leq \frac{1}{4} (\binom{n + 3}{3}) = \frac{(n + 3) (n + 2) (n + 1)}{24} \to E [h_{n}] = Ö (günlük n)

$2^{\operatorname{E}[X_n]}\le \operatorname{E}[Y_n]\le \frac{4}{n}\sum_{i=0}^{n-1}\operatorname{E}[Y_i]\le\frac{1}{4}\binom{n+3}{3}=\frac{(n+3)(n+2)(n+1)}{24}\rightarrow \operatorname{E}[h_n]=O(\log n)$

— Merbs
kaynak

VAY. TEŞEKKÜRLER !!!! Beklenen değeri bilmememe rağmen, bu tür bir anlam ifade ediyor. Algoritmalar yapmadan önce gizli bir matematik kursu yapmadım. Eğer biraz şüphem varsa, daha fazla yorum göndereceğim. Teşekkürler Merbs.

— user1675999

ancak üstel yükseklik neden seçilen binomdan daha az veya ona eşittir? Hala neden farklı en büyük terime sahip başka bir binom seçemiyoruz ve tam olarak aynı matematiği yapamıyoruz ... muhtemelen aptalım ama nedenini anlayamıyorum ... ve bu noktaya kadar mükemmel mantıklı, o zaman sadece bir şey tamamen mavi dışına çekmek zorunda kaldı ve hiçbir açıklama ile bize bunun doğru olduğunu kanıtlıyor ...

— Zeks

@Zeks Yani, daha büyük terimlere sahip diğer binomları seçebiliriz. Terim hala polinom ( n^k) ise, sonuç aynıdır çünkü kbig-O notasyonuna bırakılır (3 yolu düşürülür). Ancak üstel ( e^n) bir şeyle değiştirsek, hala doğru bir üst sınır olurdu , sadece sıkı bir tane değil . Beklenen yüksekliğin en az logaritmik olduğunu biliyoruz, bu yüzden en çok logaritmik olduğunu belirlemek onu sıkılaştırıyor.

— Merbs

@DavidNathan Endişenizi anlamıyorum - 1 / n'nin bir sabit olduğundan veya toplamın dışına taşınabileceğinden şüphe duyuyor musunuz? Sabit 2 gibi, kalan kanıtları basitleştirmek için büyük ölçüde açıklama amacıyla çıkarılmıştır.

— Merbs