Wget kullanarak TÜM Klasörleri, Alt Klasörleri ve Dosyaları İndirin


21

Wget kullanıyorum ve bir sorunla karşılaştım. Site içinde birkaç klasör ve alt klasörleri olan bir sitem var. Her klasör ve alt klasördeki tüm içeriği indirmem gerekiyor. Wget kullanarak çeşitli yöntemler denedim ve tamamlanma kontrol, klasörlerde görebildiğim tüm bir "dizin" dosyası. Dizin dosyasına tıklayabilirim ve beni dosyalara götürür, ancak gerçek dosyalara ihtiyacım var.

kimse Wget için gözden kaçan bir komut var mı, ya da tüm bu bilgileri almak için kullanabileceğiniz başka bir program var mı?

site örneği:

www.mysite.com/Pictures/ Resimler DIr içinde, birkaç klasör var .....

www.mysite.com/Pictures/Accounting/

www.mysite.com/Resimler/Managers/Kuzey Amerika / Kaliforniya / JoeUser.jpg

Tüm dosyalara, klasörlere vb. İhtiyacım var .....


1
wgetÖzellikle özyinelemeli olarak kullanmak için belgeleri okudunuz mu?
Musa

Ayrıca burada dokümantasyonda alakalı görünen bir makale var .
Musa

Yanıtlar:


38

Bunu denemediğinizi varsayalım:

wget -r - ebeveyn yok http://www.mysite.com/Pictures/

veya "index.html" dosyalarını indirmeden içeriği almak için:

wget -r --no-parent --reject "index.html *" http://www.mysite.com/Pictures/

Başvuru: İçinde rasgele dosyalar bulunan bir dizini yinelemeli olarak almak için wget kullanma


1
Teşekkürler, bu komutu birkaç kez çalıştırdım, ama komutun sonuna kadar bitmesine izin vermedim. Yan izlendim ve komutun gerçekten bitmesine izin verdim ve önce TÜM Klasörleri kopyaladı, sonra geri döndü ve TÜM dosyaları klasöre kopyaladı.
Horrid Henry

sadece size göstermek için gider, eğer sabır olsaydı, bu 2 hafta önce yapmış olurdu .... LOL. :) Tekrar teşekkürler.
Horrid Henry

@Horrid Henry, Tebrikler!
Felix Imafidon

Benzer komutu kullanıyorum ama sadece index.html dosyası alıyorum!
shenkwen

20

kullanırım wget -rkpN -e robots=off http://www.example.com/

-r özyinelemeli anlamına gelir

-kbağlantıları dönüştürmek anlamına gelir. Dolayısıyla, web sayfasındaki bağlantılar example.com/bla yerine localhost olacaktır

-p tüm web sayfası kaynaklarını almak anlamına gelir böylece web sitesi düzgün çalışması için görüntü ve javascript dosyaları elde.

-N yerel dosyalar uzak web sitesindeki dosyalardan daha yeniyse bunları atlayın.

-erobots=offçalışmak için orada olması gereken bir bayrak seçeneğidir .

robots=off robotlar dosyasını yoksay anlamına gelir.

Ben de -cbu komutu vardı bu yüzden onlar bağlantı koptu eğer ben komutu yeniden çalıştırmak zaman kaldığı yerden devam edecek. İle -Niyi gideceğini düşündüm-c


Parametre ayarlarının ne yaptığını açıklamak için cevabınıza birkaç cümle ekleyebilir misiniz?
fixer1234

afedersiniz. emin onları şimdi ekle
Tim Jonas

Cevabımı güncelledim
Tim Jonas

Teşekkürler. Peki -c komut örneğinizin bir parçası olmalı mı yoksa eksik bir indirme işleminden sonra isteğe bağlı mı eklenmeli? Ayrıca, -e öyle ki komut .wgetrc içinde olabilecek herhangi bir önceliğe sahip olur? Ve bu -r için bir yazım hatası mı (özyinelemeli veya tekrarlamalı)?
fixer1234

Evet doğru. Evet -e.wgetrc'nin bir parçasıymış gibi komutu yürütecek, orada robots=offolmadan çalışmamış gibi ekledim .
Tim Jonas

1

wget -m -A * -pk -e robots = off www.mysite.com/ bu, tüm dosya türlerini yerel olarak indirir ve html dosyasından işaret eder
ve robotlar dosyasını yoksayar

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.