Html dosyalarını indirmek için wget kullandım, dosyadaki görüntüler nerede saklanıyor?


15

Firefox çok yavaş yükleniyordu, bu yüzden wgetHTML dosyalarını kaydetmek için kullanmaya karar verdim.

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Dosyalar ana klasöre kaydedildi.Ancak resimlerin nerede saklandığını bilmiyorum Anki.

Peki görüntüler nerede saklanıyor?


Bu makalede , seçenekler ve bunların nasıl faydalı olduğu açıklanmaktadır.
Wilf

Yanıtlar:


34

Burada --page-requisites( -pkısaca) kullanmayı tercih ediyorum, -rçünkü sayfanın göstermesi gereken her şeyi indiriyor, ancak başka sayfa yok ve ne tür dosyalar istediğimi düşünmek zorunda değilim.

Aslında genellikle böyle bir şey kullanıyorum

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Bu şu anlama gelir:

  • -E: .htmlBir HTML dosyasıysa ancak bitmiyor .htmlveya benzeri değilse dosya adına ekleyin
  • -H: Diğer ana bilgisayarlardan da dosya indirin
  • -k: İndirdikten sonra içindeki herhangi bir bağlantıyı dönüştürün, böylece indirilen dosyaları işaret edin
  • -p: Düzgün çevrimdışı görüntüleme için sayfanın ihtiyaç duyduğu her şeyi indirin

Ben aramaya geldim -Hve hakkında bilgi edinmek için mutlu olduğunu -Eve -kçok. Teşekkürler!
Charles Clayton

2

-r parametresini kullanmak, wget'in resimleriniz dahil tüm klasörü indirmesini sağlamalıdır.

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

2

Görüntü dosyalarını ayrı ayrı indirme

Bence bu komut seni başlatabilir.

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Görüntülerin kaydedileceği konumu ve istediğiniz dosya türlerini belirlemenizi sağlar. Belki görüntüleri bu şekilde indirmek daha kolaydır.

Kaynak :

-r özyinelemeli erişim sağlar. Daha fazla bilgi için Yinelemeli İndirme bölümüne bakın.

-P, tüm dosyaların ve dizinlerin kaydedileceği dizin önekini ayarlar.

-A yalnızca belirli dosya türlerini almak için bir beyaz liste ayarlar. Dizeler ve desenler kabul edilir ve her ikisi de virgülle ayrılmış bir listede kullanılabilir (yukarıda görüldüğü gibi). Daha fazla bilgi için bkz. Dosya Türleri.

Görüntü dosyalarını klasörünüzden kopyalama

Web sitesinin PNG resim dosyaları kullandığını fark ettim. Bunları klasörünüzden kopyalayabilirsiniz. Bu, web sayfasını sakladığınız klasörde çalıştırılmalıdır.

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;

1

Wget, sayfanın HTML dosyasındaki resimler URL olarak yazıldığından, sayfadaki resimleri değil, sayfanın HTML dosyasını indirir. İstediğinizi yapmak için, -R(özyinelemeli), -Agörüntü dosyası soneklerine sahip --no-parentseçeneği, yükselmemesi için --levelseçeneğini ve seçeneğini kullanın 1.

özellikle wget -R -A .jpg,.png,.gif --no-parent --level <url>

Daha da iyisi, çoğu tarayıcıda sayfaları çevrimdışı görüntüleme için kaydetme yöntemleri vardır .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.