Bir dizinin diğerinin sıralı bir sürümü olup olmadığını kontrol etmek için deterministik doğrusal zaman algoritması

Aşağıdaki sorunu düşünün:

Giriş: uzunluğunda iki ve dizisi , burada sıralanmış düzendedir. $A$ $B$ $n$ $B$

Sorgu: do ve (kendi çokluğu ile) aynı öğeleri içerir? $A$ $B$

Bu sorun için en hızlı deterministik algoritma nedir ?
Bunları sıralamaktan daha hızlı çözülebilir mi? Bu problem deterministik lineer zamanda çözülebilir mi?

algorithms reference-request sorting

— Albert Hendriks
kaynak

FWIW olasılıklı yaklaşım, sıradan bağımsız bir hash fonksiyonu ile hash etmektir. Carter ve Wegman bu makaledeki orijinal makalelerden birini ( sciencedirect.com/science/article/pii/0022000081900337 ) yazdılar , ancak o makalenin alıntılarında belirleyici bir algoritma (şimdiye kadar) öneren bir şey görmedim.

— KWillets

Alıntı yaptığınız açıklama sadece teorik ilgi alanı olan Turing makine modeli hakkında. Algoritmalar genellikle RAM modeline göre analiz edilir.

— Yuval Filmus

ah, o zaman aradığım model bu. Soruyu ayarladım.

— Albert Hendriks

Neden sadece dizideki öğeleri toplayıp toplamı karşılaştırmıyorsunuz? Başlığınıza gelince, lineerdir ve 'bir dizi diğerinin sıralı versiyonu mu? '. Turing makinesi modeli değil, pratik bir çözüm olduğunun farkındayım.

— atayenel

@AlbertHendriks Bir Turing makinesindeki

içindeki bir diziyi sıralayamazsınız (büyük olasılıkla) . SAT üzerindeki bazı düşük sınırlar (örn. Cs.cmu.edu/~ryanw/automated-lbs.pdf ) aslında RAM makinesi için, yanıltıcı önceki yorumum için üzgünüm.

O (n \log n)

$O(n\log n)$

— Yuval Filmus

Yanıtlar:

Hesaplama modelinizi belirtmediniz, bu yüzden karşılaştırma modelini kabul edeceğim.

dizisinin listesinden alındığı özel durumu düşünün Bir deyişle, inci elemanı ya da bir ya da . $B$

{1, 2} x {3, 4} x \dots x {2 n - 1, 2 n} .

$\{1,2\} \times \{3,4\} \times \cdots \times \{2n-1,2n\}.$

i

$i$

2 i - 1

$2i-1$

2 i

$2i$

I İstem algoritma sonucuna eğer ve algoritma her öğe karşılaştırıldığında ki, aynı elemanları içeren muadili için . Gerçekten, algoritmanın ve aynı elemanları içerdiğini ancak ilk elemanını asla muadili ile karşılaştırmadığını varsayalım . İlk öğeyi değiştirirsek, cevap farklı olsa bile algoritma tamamen aynı şekilde devam eder. Bu, algoritmanın ilk elemanı (ve herhangi bir elemanı) muadili ile karşılaştırması gerektiğini gösterir . $A$ $B$ $B$ $A$ $A$ $B$ $B$ $A$ $A$

Bu, ve aynı öğeleri içeriyorsa, bunu doğruladıktan sonra algoritma sıralanmış sırasını bilir . Bu yüzden en azından olmalı farklı yapraklar, ve bu yüzden zaman alır . $A$ $B$ $A$ $n!$ $\Omega(n\log n)$

— Yuval Filmus
kaynak

Bunun genel olarak

olduğunu ima ederdim , ama görünüşe göre karşılaştırma modeli bundan farklıdır.

P = Ω (n \log n)

$P = \Omega(n\log n)$

— Albert Hendriks

@ AlbertHendriks, sıralama için n lg n alt sınırını göstermek için kullanılan aynı modeldir. Bu, yapabileceğiniz tek işlemin karşılaştırma olduğu anlamına gelir, o zaman daha iyisini yapamazsınız. Sanırım bu sorunuzu cevaplıyor.

— Kaveh

[Cntd] Sıralama için bile daha güçlü sınırlarımız yok! ve n lg n'den daha hızlı sıralama yapabiliyorsanız sorunu n lg n'den daha hızlı çözmek için kullanabilirsiniz.

— Kaveh

@AlbertHendriks, tamsayıları sıralamak için doğrusal zaman algoritmalarını biliyor musunuz? CLRS'de arayın. Davanız, doğrusal zamanda sıralayabileceğimiz durumlardan biri olabilir.

— Kaveh

Tamsayılar

sıralanabilir (bkz. Nada.kth.se/~snilsson/fast-sorting ) veya beklenen zamanda

O (n \log \log n)

$O(n\log\log n)$

(ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=1181890 adresinebakın) veya kelime boyutu yeterince büyükse doğrusal zamanda bile (bkz. LNCS 8503, s. 26ff).

O (n \sqrt{\log \log n})

$O(n\sqrt{\log\log n})$

— Yuval Filmus

Bu cevap farklı bir hesaplama modelini ele almaktadır: birim maliyetli RAM modeli. Bu modelde, makine kelimeleri boyutuna sahiptir ve üzerlerindeki işlemler zaman alır. Ayrıca, her dizi öğesinin bir makine kelimesine sığdığını (ve dolayısıyla en fazla büyüklükte olduğunu) basitliği varsayıyoruz . $O(\log n)$ $O(1)$ $n^{O(1)}$

Biz doğrusal bir zaman inşa edecek randomize tek taraflı hata ile algoritma olup olmadığını İki dizinin belirlenmesi daha zor sorun için (algoritma bu durumda olmasa bile aynı unsurları içerdiği iki diziler ilan etme) ve aynı elementleri içerir. (Hiçbirinin sıralanmasını gerektirmiyoruz.) Algoritmamız en fazla olasılıkla hata verecektir . $a_1,\ldots,a_n$ $b_1,\ldots,b_n$ $1/n$

Buradaki fikir, dizilerin aynı öğeleri içermesi durumunda şu kimliğe sahip olmasıdır: Bu polinomları tam olarak hesaplamak çok fazla zaman alacaktır. Bunun yerine, rastgele bir asal ve rastgele bir seçer ve

\prod_{i = 1}^{n} (x - a_{i}) = \prod_{i = 1}^{n} (x - b_{i}) .

$\prod_{i=1}^n (x-a_i) = \prod_{i=1}^n (x-b_i).$

p

$p$

x_{0}

$x_0$

Diziler eşitse, test her zaman geçecektir, bu yüzden dizilerin farklı olduğu durumlara konsantre olalım. Özellikle, bazı

katsayısısıfır değildir. Bu yana

büyüklük

, bu katsayı büyüklüğe sahip

\prod_{i = 1}^{n} (x_{0} - a_{i}) \equiv \prod_{i = 1}^{n} (x_{0} - b_{i}) (\mod p) .

$\prod_{i=1}^n (x_0-a_i) \equiv \prod_{i=1}^n (x_0-b_i) \pmod{p}.$

\prod_{i = 1}^{n} (x - a_{i}) - \prod_{i = 1}^{n} (x - b_{i})

$\prod_{i=1}^n (x-a_i) - \prod_{i=1}^n (x-b_i)$

a_{i}, b_{i}

$a_i,b_i$

n^{O (1)}

$n^{O(1)}$

en az vardır, ve bu yüzden

boyutu ana faktörler

. Biz en azından bir dizi seçerseniz o Bu araçlar

asal

boyutunun en az

(söz hakkından), sonra rastgele bir asal için

bu setin o olasılık en azından bir araya gelecek

2^{n} n^{O (n)} = n^{O (n)}

$2^n n^{O(n)} = n^{O(n)}$

O (n)

$O(n)$

Ω (n)

$\Omega(n)$

n^{2}

$n^2$

p

$p$

n^{2}

$n^2$

p

$p$

1 - 1 / n

$1-1/n$

Rastgele bir

modulo

buna

olasılığı ile tanık olacaktır(çünkü en fazla

derecesinde bir polinomen fazla

köke sahip olduğundan).

\prod_{i = 1}^{n} (x - a_{i}) - \prod_{i = 1}^{n} (x - b_{i}) ≢ 0 (\mod p) .

$\prod_{i=1}^n (x-a_i) - \prod_{i=1}^n (x-b_i) \not\equiv 0 \pmod{p}.$

x_{0}

$x_0$

p

$p$

1 - n / p \geq 1 - 1 / n

$1-n/p \geq 1-1/n$

n

$n$

n

$n$

Sonuç olarak, en az farklı primer seti ve rastgele modulo arasında kabaca boyutunda rastgele bir seçersek , diziler aynı öğeleri içermediğinde testimiz başarısız olur olasılık . Testi çalışma süresi alır bu yana makinesi sürekli bir söz sayıda içine sığar. $p$ $n^2$ $n^2$ $x_0$ $p$ $1-O(1/n)$ $O(n)$ $p$

Polinom zaman asallık test kullanılarak ve boyut asal yoğunluğu itibaren aşağı yukarı olduğu , bir rastgele birincil seçebilir zamanında . Rastgele bir modulo seçimi çeşitli şekillerde uygulanabilir ve bizim durumumuzda tamamen tekdüze bir rastgele ihtiyacımız olmadığından daha kolay hale getirilir . $n^2$ $\Omega(1/\log n)$ $p$ $(\log n)^{O(1)}$ $x_0$ $p$ $x_0$

Sonuç olarak, zaman içinde bizim algoritma çalışır her zaman çıkışlar EVET, diziler HAYIR olasılık ile aynı elementleri ve çıkışları içeriyorsa diziler aynı unsurları ihtiva etmemesi. Herhangi bir sabit için hata olasılığını artırabiliriz . $O(n)$ $1-O(1/n)$ $1-O(1/n^C)$ $C$

— Yuval Filmus
kaynak

Bu algoritma randomize edilmiş olsa da, diğer cevapların bazılarında fikirlerin gerçekte nasıl çalışacağını açıklar. Ayrıca hashtable yaklaşıma göre bir avantajı vardır: yerinde.

— Yuval Filmus

Ben OP bir karma tablo kullanarak beklenen doğrusal zaman algoritması gibi değildi olasılıklı algoritmaları sevmiyorum düşünüyorum.

— Kaveh

Kaveh haklısın. Ancak elbette bu çözüm de ilginç ve saklanması gerekiyor, olasılık algoritmaları için durumu çözüyor. Ayrıca, aradığım modeli kullandığını düşünüyorum.

— Albert Hendriks

Sadece O (1 / n) notasyonunun doğru olup olmadığını merak ediyorum. Elbette ne demek istediğini biliyorum, ama bence big-O'nun tanımına göre bu O (1) 'e eşittir.

— Albert Hendriks

C / n

$C/n$

n

$n$

O (1)

$O(1)$

-3

başka bir algoritma önereceğim (veya en azından böyle bir algoritmanın şeması)

Şema, değerlerin (" tamsayılar " olduğu varsayılır ) arasında (dar?) Bir aralıkta olduğunu varsayar. $[min,max]$

$O(n)$ minmax
Çıkar minhem dizilerden tüm değerlerden (burada bir dizi sıralı düzende zaten olması dikkate alınmaz, muhtemelen bu geliştirilebilir)
$1$ $c > 1$
max-min $O((max-min)n)$

Yukarıdaki algoritma şemasının birçok pratik durumda (deterministik) oldukça hızlı olabileceğini unutmayın .

Yukarıdaki algoritma şeması, " hareketli kütleler " kullanan bir doğrusal-zaman sıralama algoritmasında bir varyasyondur . " Hareketli kütleler " sıralama algoritmasının arkasındaki fiziksel sezgi şudur:

Her bir öğenin değerinin gerçekte kütle büyüklüğünü temsil ettiğini varsayın ve tüm öğeleri bir satırda düzenlediğinizi ve aynı hızlanma kuvvetini uyguladığınızı hayal edin.

Daha sonra her bir madde kütlesiyle ilgili bir mesafeye, daha büyük daha az mesafe ve tersi yönde hareket edecektir. Sonra sıralanan öğeleri almak için sadece seyahat mesafesine göre ters sırayla öğeleri toplamak.

$max-min$

Bu bağlamda, yukarıdaki algoritma sayısal tabanlı sıralama algoritmalarına benzer (örn. Radix-sort , counting-sort )

Bu algoritmanın fazla bir şey ifade etmeyebileceği düşünülebilir, ancak en az bir şey gösterir. " Temel " olarak, fiziksel düzeyde, rasgele sayıların sıralanması, öğe sayısında doğrusal-zaman işlemidir.

— Nikos M.
kaynak

Maddeleri gidilen mesafenin tersine toplamak açısından, bu, uygulama seviyesindeki karşılaştırmalar anlamına gelmez ve bu noktada "mesafeleri" sıralamanız gerekmez mi?

— JustAnotherSoul