HTTP'de gerçekten bir dizin kavramı yoktur. İlk üç ( http://example.com/
) dışındaki eğik çizgilerin ..
göreceli URL’lerde belirtilenler dışında özel bir anlamı yoktur . Dolayısıyla, sunucu belirli bir formatta yoksa, “tüm dosyaları belirtilen dizinde indirmenin” yolu yoktur.
Sitenin tamamını indirmek istiyorsanız, en iyi tercihiniz ana sayfadaki tüm bağlantıları tekrarlı bir şekilde geçmek. Curl yapamaz, ama wget yapabilir. Web sitesi çok dinamik değilse bu işe yarar (özellikle, wget Javascript koduyla oluşturulan bağlantıları görmez). İle başlayın wget -r http://example.com/
ve daha alakalı seçenekler (özyineleme derinliği, hariç tutma listeleri vb.) İçin wget el kitabındaki “Özyinelemeli Alma Seçenekleri” ve “Özyinelemeli Kabul Et / Reddet Seçenekleri” kısmına bakın.
Web sitesi otomatik indirmeleri engellemeye çalışırsa, kullanıcı aracısı dizesini ( -U Mozilla
) değiştirmeniz ve görmezden gelmeniz robots.txt
(boş bir dosya oluşturup wget'ın sunucudan indirmeyi denememesi için seçeneği example.com/robots.txt
kullanmanız gerekebilir -nc
).