Www.website.com/XYZ altındaki bağlantıları taramak ve yalnızca www.website.com/ABC altındaki bağlantıları indirmek istiyorum.
İstediğim dosyaları almak için aşağıdaki wget komutunu kullanıyorum:
wget -I ABC -r -e robots=off --wait 0.25 http://www.website.com/XYZ
Wget 1.13.4 kullandığımda bu mükemmel çalışıyor. Ama sorun wget 1.11 olan bir sunucuda bu komutu kullanmak zorunda ve aynı komutu kullandığınızda, gibi ek etki alanları indirerek sona erer:
www.website.de
www.website.it
...
Bu sorunu nasıl önleyebilirim? Kullanmayı denedim
--exclude domains=www.website.de,www.website.it
ancak bu alan adlarını indirmeye devam etti.
Ayrıca --no-parent
, istediğim dosyalar daha üst düzeyde olduğu için kullanamayacağımı da unutmayın (website.com/XYZ altındaki bağlantıları tarayarak website.com/ABC altındaki dosyaları istiyorum).
İpucu var mı?
wget
varsayılan olarak ana bilgisayarları geçmemelidir ve özyinelemeli bir wget yaparken ana bilgisayarları çaprazlamak için -H
/ --span-hosts
seçeneğine ihtiyacınız vardır . "www.website.com", "www.website.de" adresinden tamamen farklı bir barındırıcıdır.
-H
her zaman orijinal ana bilgisayarın dışında geri çekilmeleri gerekiyordu. Yardımcı -D www.website.com
olur mu?