Bir web sitesini özyinelemeli olarak taramak ve yalnızca belirli türdeki resimleri indirmek için nasıl uyarırsınız?
Bir siteyi taramak ve sadece Jpeg resimleri indirmek için bunu kullanmayı denedim:
wget --no-parent --wait=10 --limit-rate=100K --recursive --accept=jpg,jpeg --no-directories http://somedomain/images/page1.html
Ancak, page1.html, resimlere doğrudan bağlantıları olan yüzlerce alt sayfaya bağlantı içeriyor olsa da, "subpage13.html dosyasının reddedilmesi gerektiği için kaldırılması" gibi şeyler bildirir ve hiçbiri doğrudan bağlantılı olmadığından hiçbir resmi indirmez Başlangıç sayfasından.
Bunun benim --accept'inizin hem tarama hem de içeriği filtrelemeye yönlendirdiği için kullanıldığını varsayıyorum, oysa ben sadece içeriğin indirilmesini yönlendirmek için kullanıyorum. Wget'in tüm bağlantıları nasıl tarayacağını, ancak yalnızca * .jpeg gibi belirli uzantılara sahip dosyaları nasıl indirebilirim?
EDIT: Ayrıca, bazı sayfalar dinamiktir ve bir CGI betiği (örn. İmg.cgi? Fo9s0f989wefw90e) aracılığıyla oluşturulur. Kabul listeme cgi eklesem bile (örn. --Accept = jpg, jpeg, html, cgi) bunlar her zaman reddedilir. Bunun etrafında bir yol var mı?