Bir web sayfasındaki tüm PDF linklerini indirin? [kapalı]


Yanıtlar:


36

Wget'ı kullanabilir ve böyle bir komutu çalıştırabilirsiniz:

wget --recursive --level=1 --no-directories --no-host-directories --accept pdf http://example.com

Veya kısa seçeneklerle:

wget -r -l 1 -nd -nH -A pdf http://example.com

GÜNCELLEME: Kullanım: Güncellemenizin Windows 7 çalıştıran diyor yana Windows için wget bir gelen cmdistemi.

GÜNCELLEME 2: Grafiksel bir çözüm için - diğer dosyalar da elde edildiğinden fazla overkill olsa da DownThemAll


tavsiyen için teşekkür ederim kevin, wget iyi görünüyor, yine de bir 'grafik' yazılımı tercih ederim, komut satırı olmayan. :)
iAsk

2
Bu ilk .html sayfasını bile reddeder. Hiç test edildi mi?
dan3,

Soru tüm PDF linklerini indirmeyi istiyor, bu yüzden evet, ilk .html sayfası yoksayılacak.
Kevin Worthington,

Power Shell kullanarak Windows 7'de de aynı şeyi yapma olasılığı var mı?
Benedikt Buchert

1
Ayrıca uzaktaki sunucuyu zorlamamak için dosya indirme işlemleri arasında en az birkaç saniyelik bir gecikme atmanızı öneririm. e, g, wget için, bir bayrak ekleyin-w 5
KJH

6
  1. Tarayıcınızda, CTRL+ SHIFT+ tuşlarına basın Jve

    var pdflinks = []; Array.prototype.map. call (document.querySelectorAll ("a [href $ = \". pdf \ "]"), işlevi (e, i) {if ((pdflinks || []). indexOf (e.href) == - 1) {pdflinks.push (e.href);}}); console.log (pdflinks.join (""));

    Bu konsolda dönecektir:

    " /superuser/tagged/somepdf1.pdf " " /superuser/tagged/somepdf2.pdf " " /superuser/tagged/somepdf3.pdf "

  2. Şimdi wgetkomut satırı seçenekleriyle kullanmawget url1 url2 ...

Bunu kopyalayıp yapıştırın, bir konsol açın açın wgetpano içeriğinizi eklemek için farenin sağ tuşuna basın ve enter tuşuna basın.

Bir indirme dosyası kullanmak için "\ n" ile satırları birleştirin ve parametreyi aşağıdaki gibi kullanın. wget -i mydownload.txt

Diğer çoğu (GUI) indirme programlarının da boşluklarla ayrılmış bir URL listesiyle çağrılmayı kabul ettiğini unutmayın.

Bu yardımcı olur umarım. Genelde böyle yapıyorum. Grafiksel bir UI ile herhangi bir uzantıdan daha hızlı ve daha esnek, öğrenmem ve aşina olmam gerekiyor.


1
Daha da iyisi, console.log('"' + pdflinks.join('" "') + '"')- aksi takdirde alıntı yapılan URL'leri
alamazsınız

1

Tarayıcıda kalmak istiyorsanız, tam da bu amaçla bir web uzantısı yazdım - bilimsel makale PDF'lerini düzgün biçimde biçimlendirilmiş başlıklar ile kaydetme yeteneği eklemeye çalışıyorum, ancak hepsini indirmek istiyorsanız bunun için.

Deniyor Tab Kaydet ve Chrome web mağazasında burada . Hepsini yalnızca sekmelerde açarsanız, URL listesini bile girmeniz gerekmez (ancak çok sayıda dosya için bu işlemi bir bilgisayarı yavaşlatabilir, bu yüzden kendinize ekleme seçeneğini ekledim).


0

Son zamanlarda bunun için uGet'i (Windows'ta) kullandım. Bir GUI'ye sahiptir ve indirmek istediğiniz dosyaları filtreleyebilirsiniz.

Tüm bunları hatırlamaya çalışırken kurtarır


0

Google Chrome'da, aşağıdaki gibi uzantıları kullanmak mümkündür:

  • Master indirin

    Bu uzantı ile tüm resim, video, pdf, doc ve ziyaret ettiğiniz web sayfasına bağlı herhangi bir dosyayı indirebilirsiniz.


0

Google

Google arama sonuçlarını temel alan web sitesinden PDF bağlantıları indirmenize izin veren az sayıda Python aracı vardır.

Örneğin

Not: Bahsedilen her iki komut dosyasının da sahibiyim.

Her ikisi de xgooglePython kütüphanesini uyguluyor . Bu kütüphanenin çatalı pkrumins/xgooglesürümüne dayanıyor .


İlgili: Linux komut satırından bir web araması .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.