Schönhage-Strassen algoritmasında iç halka nasıl seçilir?

Schönhage – Strassen tamsayı çarpma algoritmasını uygulamaya çalışıyorum, ancak yinelemeli adımda bir tökezleyen bloğa çarptı.

Benim bir değerim var $x$ ile bit ve hesaplamak istiyorum . Başlangıçta fikir almaya olduğunu düşündüm öyle ki , split içine ile her adet bit modül çalışırken, SSA en konvolüsyonunu uygulamak , değer başına bit kapasiteli bir halka , daha sonra parçaları tekrar bir araya getirin. Bununla birlikte, evrişim çıkışı bitten biraz daha fazladır (yani $n$ $x^2 \pmod {2^n+1}$ $k$ $4^k \geq 2n$ $x$ $2^k$ $2^{k-1}$ $2^{2^k}+1$ $2^k$ $2n$ $>2^k$ Her çıkış değerinin birkaç ürünün toplamı olması nedeniyle halkanın kapasitesinden daha fazla olan çıkış değeri başına bit sayısı), bu işe yaramaz. Ben 2 dolgu ekstra bir faktör eklemek zorunda kaldı.

Dolgudaki 2 ekstra faktör karmaşıklığı bozar. Yinelemeli adımımı çok pahalı yapıyor. Bunun yerine, bir $F(n) = n \lg n + \sqrt{n} F(2 \sqrt{n}) = \Theta(n \; \lg n \; \lg \lg n)$ algoritması, bir sona bir $F(n) = n \lg n + \sqrt{n} F(4 \sqrt{n}) = \Theta(n \lg^2 n)$ algoritması ile.

Vikipedi ile bağlantılı birkaç referans okudum, ancak hepsi bu sorunun nasıl çözüldüğüne dair ayrıntılar üzerinde parlak görünüyor. Örneğin, gücü olmayan bir $2^{p 2^k} + 1$ için modulo çalıştırarak ekstra dolgu yükünü önleyebilirim ... ama sonra sadece güç olmayan- -2 faktör kaldı ve parça sayısını iki katına çıkarmadan Cooley-Tukey'i uygulayamaz. Ayrıca, çarpımsal bir ters modülo sahip olmayabilir . Yani hala zorla kabul edilen 2 faktör var. $p$ $p$ $2^p+1$

Asimptotik karmaşıklığı üflemeden özyinelemeli adımda kullanılacak halkayı nasıl seçerim?

Veya sözde kod biçiminde:

multiply_in_ring(a, b, n):
  ...
  // vvv                          vvv //
  // vvv HOW DOES THIS PART WORK? vvv //
  // vvv                          vvv //
  let inner_ring = convolution_ring_for_values_of_size(n);
  // ^^^                          ^^^ //
  // ^^^ HOW DOES THIS PART WORK? ^^^ //
  // ^^^                          ^^^ //

  let input_bits_per_piece = ceil(n / inner_ring.order);
  let piecesA = a.splitIntoNPiecesOfSize(inner_ring.order, input_bits_per_piece);
  let piecesB = b.splitIntoNPiecesOfSize(inner_ring.order, input_bits_per_piece);

  let piecesC = inner_ring.negacyclic_convolution(piecesA, piecesB);
  ...

ds.algorithms

— Craig Gidney
kaynak

Lütfen aynı soruyu birden fazla sitede yayınlamayın . Her topluluğun, kimsenin vaktini boşa harcamadan dürüstçe cevap vermesi gerekir. İki kopyadan birini silmenizi öneririm.

— DW

@DW Tamamlandı. Ben cs bir hafta boyunca herhangi bir cevap vermedi sonra çapraz posta, bu site için çok zor olduğunu düşündüm. Açıkça herhangi bir cevap geri bağlantı olacaktı.

— Craig Gidney

Anlıyorum. Gelecekte ortaya çıkarsa, yayınınızı her zaman moderatörlerin dikkatini çekmek için işaretleyebilir ve taşınmasını isteyebilirsiniz ve sizin için CSTheory'ye taşıyabiliriz. Anlayışınız için teşekkür ederiz!

— DW

Algoritmanın formunun modulo sayılarını çalıştıran bir sürümü var : A. Schönhage. Polinomların karmaşık katsayılarla sayısal çoğaltılması ve bölünmesi için asimptotik olarak hızlı algoritmalar. EUROCAM '82'de: Avrupa Bilgisayar Cebir Konferansı, Öğr. Notlar Comp. Sci. 144, 3-15. iai.uni-bonn.de/~schoe/publi39.dvi

2^{ν 2^{n}}

$2^{\nu2^n}$

— Markus Bläser

IIRC, şimdi silinmiş CS sorusu üzerinde kısmi bir kendi cevabınız vardı. Bunu kaybetmek utanç verici görünüyor. Buraya buraya ekleyebilir misiniz (soruda, sorunun zaten yanıtlanmış olarak işaretlenmemesi için)?

— Peter Taylor

Bu cevap, Markus'un yorumlarda bağladığı "Karmaşık katsayılara sahip polinomların sayısal muitipi ve bölünmesi için asimptotik olarak hızlı algoritmalar" makalesinden alınmıştır .

Bir bitlik sayının karesini almak istiyorsunuz , modulo . İşte yapmanız gerekenler: $n$ $2^n + 1$

ve karşılayan ve bulun . $p$ $s$ $n = (p-1) 2^s$ $s \leq p \leq 2s$
biti bölmek için parça sayısını ve parça boyutları için karşılık gelen parametreleri seçin: $2^m$ $n$

$\begin{aligned} m & = ⌊ s / 2 ⌋ + 1 \\ s_{2} & = ⌈ s / 2 ⌉ + 1 \\ p_{2} & = ⌈ p / 2 ⌉ + 1 \end{aligned}$ $\begin{align} m &= \lfloor s/2 \rfloor + 1 \\s_2 &= \lceil s/2 \rceil + 1 \\ p_2 &= \lceil p/2 \rceil + 1 \end{align}$
ve değişmezini karşılamaya devam ettiğini unutmayın . Ayrıca , bu nedenle girişin olduğuna dikkat edin . $s_2$ $p_2$ $s_2 \leq p_2 \leq 2 s_2$ $2^m 2^{s_2} p_2 \geq 2n + m + 1$
Her zamanki gibi, parçalar ve geri kalanı üzerinde FFT tabanlı negasiklik konveksiyon gerçekleştirin.

İşte bu kapsayıcı fikir: logaritmik dolgu faktörü . Şimdi karmaşıklık analizi için. FFT alacak yapacak işi ve biz üzerinde konum recursing büyüklükte parçalara , şimdi biz nüks ilişki wrt ile son derece kaba matematik yapabilirsiniz : $p$ $n m$ $2^m$ $(p_2-1) 2^{s_2}$ $s$

\begin{aligned} F (s) & (\leq) (p - 1) 2^{s} m + 2^{m} F (⌈ s / 2 ⌉ + 1) \\ (\leq) 2 s 2^{s} (⌊ s / 2 ⌋ + 1) + 2^{⌊ s / 2 ⌋ + 1} F (⌈ s / 2 ⌉ + 1) \\ (\leq) s^{2} 2^{s} + 2 \cdot 2^{s / 2} F (s / 2 + 1) \\ (\leq) s^{2} 2^{s} + 4 (s / 2)^{2} 2^{s} + 16 (s / 4)^{2} 2^{s} + . . . \\ (\leq) 2^{s} s^{2} \lg (s) \\ (\leq) \frac{n}{\lg n} {(\lg \frac{n}{\lg n})}^{2} \lg \lg \frac{n}{\lg n} \\ (\leq) \frac{n}{\lg n} (\lg^{2} n) \lg \lg n \\ (\leq) n (\lg n) \lg \lg n \end{aligned}

$\begin{align} F(s) &(\leq)\; (p-1)2^sm + 2^m F(\lceil s/2\rceil+1) \\ &(\leq)\; 2s2^s (\lfloor s/2\rfloor+1) + 2^{\lfloor s/2\rfloor+1} F(\lceil s/2\rceil+1) \\ &(\leq)\; s^2 2^s + 2 \cdot 2^{s/2} F(s/2+1) \\ &(\leq)\; s^2 2^s + 4 (s/2)^2 2^s + 16(s/4)^2 2^s + ... \\ &(\leq)\; 2^s s^2 \lg(s) \\ &(\leq)\; \frac{n}{\lg n} \left(\lg \frac{n}{\lg n}\right)^2 \lg \lg \frac{n}{\lg n} \\ &(\leq)\; \frac{n}{\lg n} (\lg^2 n) \lg \lg n \\ &(\leq)\; n \;(\lg n) \lg \lg n \end{align}$

Bu adımlarda oldukça fazla aldatmış olmama rağmen, bu doğru görünüyor.

'Hile' , temel maliyette yerine ile sonuçlandığımız gibi görünüyor . Sorunda şikayetçi olduğum gibi, yinelemeli seviye başına iki çarpma hala iki çarpım var, ama şimdi yarıya bölünmesi çift temettü ödüyor, bu yüzden her şey işe yarıyor. Sonra, sonunda biz ekstra faktör iptal (aslında bir faktör olan ) yapım sayesinde için logaritmik büyük göreli başlangıçta. $s^2$ $s$ $s$ $s$ $\log n$ $p$ $s$

— Craig Gidney
kaynak