Özel sayfalar olmadan bir wikiden toplu indirme sayfaları


2

Zaman zaman web üzerinde, defterimde çevrimdışı kullanım için gereken bazı belgeleri buluyorum. Genelde küfür edip bütün siteyi ele geçiririm.

Ancak birçok proje şimdi wikilere geçiyor ve bu da her bir sürümü ve her "beni düzenle" bağlantısını indirdiğim anlamına geliyor.

Wget'ta herhangi bir araç veya yapılandırma var mı? Örneğin, yalnızca sorgu dizesi olmayan veya belirli bir regexp eşleştiren dosyaları indirebilir miyim?

Alkış,

Bu arada: wget, site içindeki bağlantıları yerel meslektaşlarına çeviren çok kullanışlı -k anahtarına sahiptir. Bu başka bir gereklilik olurdu. Örnek: http://example.com sayfalarını alma. Ardından, "/ ..." veya " http://example.com/ ..." 'a olan tüm bağlantıların indirilen eşle eşleşecek şekilde dönüştürülmesi gerekir.

Yanıtlar:


1

Wget man sayfasından:

-R retlist - reddetme listesi

Kabul etmek veya reddetmek için virgülle ayrılmış dosya adı soneklerinin veya kalıplarının listelerini belirleyin. Joker karakterlerden herhangi biri *,?, [Veya], bir liste veya yeniden listeleme öğesinde görünüyorsa, sonek yerine bir kalıp olarak değerlendirileceğini unutmayın.

Bu tam olarak ihtiyacınız olana benziyor.

Not: wiki sunucusundaki yükü azaltmak için, -w ve --random-wait bayraklarına bakmak isteyebilirsiniz.


Güzel, bu seçeneği görmedim. Teşekkürler.
Boldewyn

0

Bunların çoğu kaşlarını çattı ve Wikipedia etkin bir şekilde robots.txt koduyla kapattı. Http://en.wikipedia.org/wiki/Özel:Export’a sadık kalıyorum


Sunucu için oldukça stresli olduğunu biliyorum ama bu sadece gerekli dosyaları indirmek istediğim sebeplerden biri. Her neyse, bazı projeler sayfalarını wiki sayfalarından başka bir biçimde teslim etmiyor.
Boldewyn
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.