Archive.org'da belirli bir web sitesine ait tüm dosyaları almak istiyorum. Sebepler şunları içerebilir:
- Asıl yazar kendi web sitesini arşivlemedi ve şu an çevrimdışı, ondan herkese açık önbellek yapmak istiyorum
- Bazı web sitelerinin asıl yazarıyım ve bazı içerikleri kaybettim. Kurtarmak istiyorum
- ...
Bunu nasıl yaparım ?
Archive.org geri dönüş makinesinin çok özel olduğunu göz önüne alarak: web sayfası bağlantıları arşive değil, artık orada bulunmayacak bir web sayfasına işaret ediyor. JavaScript, bağlantıları güncellemek için istemci tarafı kullanılır, ancak özyinelemeli bir wget gibi bir numara işe yaramaz.
gem install wayback_machine_downloader
. Parametre olarak almak istediğiniz web sitesinin temel url'si ile wayback_machine_downloader komutunu çalıştırın:wayback_machine_downloader http://example.com
Daha fazla bilgi: github.com/hartator/wayback_machine_downloader