Bir MediaWiki'yi çevrimdışı kullanım için nasıl dökebilirim?


16

Haftada bir MediaWiki sitesinin çevrimdışı sürümünü oluşturabilmek istiyorum.

DumpHTML tüm makale ve medya dosyalarını döker olarak uzatma aslında ne istiyorum, ama ben çöplükte gidemez yüzden, bu terk tüm makalelerin herhangi indeksini göremez.

MediaWiki XML dökümü özelliği hakkında okuma , ben bu dosyaları görüntülemek için bir program kullanmak ya da belki de html dönüştürmek mümkün olacağını merak ediyorum?

Veya bir MediaWiki sitesinin çevrimdışı sürümünü oluşturmanın başka yolları var mı?


Gerçekten bir endekse mi ihtiyacınız var? Sadece başlayın Main Pageve oradan bağlantıları takip edin.
Ilmari Karonen

İşte Cam Webb'in bir MediaWiki sitesinin statik sürümünü oluşturma talimatları . İşte benimkiler , kimseye yardım etmeleri durumunda. Her ikisi de statik sonuca bağlantılar verir ( benimki burada ).
Michael Allan

Yanıtlar:


8

Siteyi HTML dosyaları olarak kaydedecek bir web tarayıcı aracı kullanabilirsiniz. Tüm bağlantılar dönüştürülür, böylece ana sayfayı açabilir, diyelim ve daha sonra bağlantıları tıklayıp tüm siteye gidebilirsiniz.

Bu araçların bir kısmı vardır. Kullandığım wget komut satırı tabanlı ve seçenekleri binlerce, böylece çok kolay değil. Ancak oldukça güçlü.

Örneğin, kendi mediawiki sitemi dökümü için kullandığım komut satırı. Her seçeneği kendiniz kullanmadan önce anlamanız önerilir:

"c:\program files\wget\wget" -k -p -r -R '*Special*' -R '*Help*' -E http://example.com/wiki

10

Sen alabilir -pages-articles.xml.bz2gelen Wikimedia siteyi döker ve onları işlemek WikiTaxi (sol üst köşede indirme). Wikitaxi Alma aracı, .taxidosyadan (Wikipedia için yaklaşık 15Gb) bir .bz2dosya oluşturur. Bu dosya, makaleler arasında arama yapmak için WikiTaxi programı tarafından kullanılacaktır. Deneyim, tarayıcı deneyimine çok benzer.

Ya da zaten işlenmiş dökümleri ( dosyalar) sağladığı için kurulumu daha hızlı olan Kiwix'i kullanabilirsiniz .zim. Yorum, kiwix için diğer MediaWiki sitelerini almak için belirtildiği mwofflinergibi, özel farklılıkları olabileceğinden herkesle çalışmayabilir, ancak karşılaştığım tek varyanttır.

Wikimedia materyallerini almak wgetiyi bir uygulama değildir. Çok fazla kişi bunu yaparsa, istekleri ile siteleri sel olabilir.


Görüntüleri çevrimdışı olarak da istediğiniz dava için daha sonra düzenleyin:

XOWA Projesi

Yaklaşık 30 saat içinde indirilecek Vikipedi'nin (resimler dahil) tam HTML biçimlendirmesinin eksiksiz bir aynasını istiyorsanız, şunu kullanmalısınız:

Vikipedi Vikipedi'de çok fazla veri var. 20.0+ GB metin içeren 13.9+ milyon sayfa ve 3.7+ milyon küçük resim var.

XOWA :

Tüm bunları bilgisayarınızda ayarlamak hızlı bir işlem olmayacaktır ... İçe aktarmanın kendisi metin sürümü için 80 GB disk alanı ve beş saat işlem süresi gerektirecektir. Görüntüleri de istiyorsanız, sayılar 100 GB disk alanına ve 30 saatlik işlem süresine yükselir. Ancak, işiniz bittiğinde, 128GB SD karta sığabilecek resimlerle birlikte eksiksiz, yakın zamanda İngilizce Wikipedia kopyasına sahip olacaksınız.

Ancak çevrimdışı sürüm, çevrimiçi sürüme çok benzer, fotoğraflar vb . İçerir : (Aşağıdaki makaleyi tamamen çevrimdışı olarak test ettim) resim açıklamasını buraya girin


Yukarıdakilerin hiçbiri geçerli değilse daha sonra düzenleme yapın:

Wiki, Wikimedia'nın bir parçası değilse veya bir dökümü yoksa, github'da API'sini kullanarak o wiki'yi indiren bir proje vardır:

WikiTeam - Vikipedi'den Vikipedi'ye en küçük wikileri arşivliyoruz


1
Özel bir mediawiki kurulumunun boşaltılması durumunda, XOWA bunu yapabilme yeteneğine sahiptir (bazı sorunlar olabilir), xowa.org/home/wiki/App/Wiki_types/Wikia.com makalesini takip etmek oldukça yararlıdır. Kiwix'in özel wikilerle kullanımı henüz test edilmemiştir ( wiki'yi github.com/kiwix/mwoffliner veya önce başka bir araçla boşaltmanız gerekir )
yürüyen merdiven
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.