Örneğin www.example.com
, bir blog yansıtmaya çalışıyorum wget
.
Wget aşağıdaki seçeneklerle kullanıyorum (kabuk değişkenleri doğru şekilde değiştirildi):
wget -m -p -H -k -E -np \
-w 1 \
--random-wait \
--restrict-file-names=windows \
-P $folder \
-Q${quota}m \
-t 3 \
--referer=$url \
-U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' \
-e robots=off \
-D $domains
-- $url
Blog, diğer alanlarda bulunan resimler içeriyor.
Ben belirtmiş olsa da -p
(indirme sayfası varlıklarını bağlantılı) seçeneğini ben açıkça her etki alanını belirlemek sürece bu görüntüler karşıdan yüklenirken değil -D
seçeneği.
Bu -D
seçeneği atlarsam, wget dışarıdaki her bağlantıyı takip www.example.com
eder ve tüm interneti indirir.
Aynı etki alanında ikamet ediyor olsun ya da olmasın, her etki alanını açıkça belirtmek zorunda kalmadan, wget
yalnızca altındaki her bağlantıyı takip etmek www.example.com
ve her sayfanın gerekli varlıklarını indirmek mümkün müdür ?
-D $domains
hem de -H
. Bu olmadan -H
alan adınızda kalmalı, ancak farklı bir alan adında olsalar bile doğrudan sayfa öğelerini almalısınız.
wget -N -E -H -k -K -p
İlk olarak kullandım ve eksik bağlantılı görüntüleri almak için bir komut dosyası buldum .