Bir siteyi HTTP üzerinden kopyalamam gerekiyor. Görüntüleri, HTML, CSS ve JavaScript'i indirmem ve dosya sisteminde düzenlemem gerekiyor.
Bunu nasıl yapacağını bilen var mı?
Bir siteyi HTTP üzerinden kopyalamam gerekiyor. Görüntüleri, HTML, CSS ve JavaScript'i indirmem ve dosya sisteminde düzenlemem gerekiyor.
Bunu nasıl yapacağını bilen var mı?
Yanıtlar:
wget -erobots=off --no-parent --wait=3 --limit-rate=20K -r -p -U "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)" -A htm,html,css,js,json,gif,jpeg,jpg,bmp http://example.com
Bu konsolda çalışır.
bu, bir siteyi kapar, istekler arasında 3 saniye bekler, indirme hızını sınırlandırır, böylece siteyi öldürmez ve sitenin sizi bir tarayıcı gibi görünmesini sağlayacak şekilde gizler bir sülük önleme mekanizması kullanarak.
Not -A
İndirmek istediğiniz dosya türlerinin bir listesini gösterir parametreyi.
-D domain1.com,domain2.com
Başka bir sunucu kullanıyorsanız, indirmek istediğiniz bir dizi etki alanını belirtmek için başka bir etiket de kullanabilirsiniz . Dosyaları alamazsanız, tüm durumlar için bunu otomatikleştirmenin güvenli bir yolu yoktur.
wget
Linux'a önceden yüklenmiştir, ancak diğer Unix sistemleri için önemsiz bir şekilde derlenebilir veya Windows için kolayca indirilebilir: GNUwin32 WGET
Bunu iyilik için ve kötülük için kullanmayın.
İyi, Ücretsiz Çözüm: HTTrack
HTTrack ücretsiz (GPL, libre / free yazılımı) ve kullanımı kolay bir çevrimdışı tarayıcı aracıdır.
Bir World Wide Web sitesini İnternet'ten yerel bir dizine indirmenize, tekrarlayan bir şekilde tüm dizinleri oluşturmanıza, HTML, resimler ve diğer dosyaları sunucudan bilgisayarınıza indirmenize izin verir. HTTrack, orijinal sitenin göreceli bağlantı yapısını düzenler. Tarayıcınızdaki "yansıtılmış" web sitesinin bir sayfasını açmanız yeterlidir; siteyi çevrimiçi izliyormuşsunuz gibi, bağlantıdan bağlantıya gözatabilirsiniz. HTTrack, yansıtılmış bir siteyi de güncelleyebilir ve kesintili indirme işlemine devam edebilir. HTTrack tamamen yapılandırılabilir ve entegre bir yardım sistemine sahiptir.
Linux sistemlerinde 'wget' bunu hemen hemen yapar.
Aynı zamanda, diğer cevapların birçoğunun bahsettiği gibi başka platformlara da taşınmıştır.
Açıkçası WGet birkaç kez bahsedildi. Bulduğum en iyi kullanıcı arayüzü
Çevresinde WGet için başka kullanıcı arayüzleri var, bazıları ise en kötü kullanıcı sorusu için aday.
Çoğu platform için geçerli olan wget - kullanmanız gerekir. curl, wget'ın en güçlü yönlerinden biri olan dokümanları yinelemeli olarak istemeyecektir.
Linux: (genellikle dağıtıma dahil edilir) http://www.gnu.org/software/wget/
Windows: http://gnuwin32.sourceforge.net/packages/wget.htm
Mac: http: //www.geekology. co.za/blog/2009/02/macports-compile-and-install-open-source-software-on-mac-os-x/
LÜTFEN web sitesine girmediğinizden emin olun - istekler arasında uygun gecikmeler ayarlayın ve sitenin hizmet şartları dahilinde olduğundan emin olun.
-Adam
Aslında, GWLlosa'nın gönderisine yazdığım yorumdan sonra, GnuWin32'nin kurulu olduğunu hatırladım ve Windows wget bağlantı noktası içerdiğinden eminim.
http://sourceforge.net/projects/gnuwin32/
GnuWin32 provides Win32-versions of GNU tools,
or tools with a similar open source licence.
The ports are native ports, that is they rely
only on libraries provided with any 32-bits
MS-Windows operating system, such as
MS-Windows 95 / 98 / 2000 / NT / XP
Bunu birkaç yıl önce kullandım ve iyi çalıştı. Sadece Windows. Adware olmak için kullanılır, ancak görünüşe göre artık:
wget --random-wait -r -p -e robots=off -U "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)" --limit-rate=20k -b http://www.example.com
-p
: parametresi, wget'a görüntüler dahil tüm dosyaları eklemesini söyler.-e robots=off
: siteleri robots.txt kurallarını yoksay-U "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)"
: kullanıcı aracısı dizesi--random-wait
: kara listeye almaktan kaçının--limit-rate=20k
: dosyaları indirme oranını sınırlar.-b
: oturumu kapattıktan sonra wget devam ediyor.
-c
(veya --continue
) seçeneği ekliyorum ve işlemi yeniden başlatmam gerekiyor.
IDM site kapmak en iyi çözüm olduğunu düşünüyorum , ayrıca Teleport pro
Free Download Manager , tüm web sitelerini de indirebilir.
Sadece Windows düşünüyorum.