Yanıtlar:
Sayfalarımıza Robot Erişimi Hakkında Bilgiye Göre :
Sitemize Robot erişimi, her şey başarısız olduğunda, son kaynak olarak bırakılmalıdır. Ayrıca, Gutenberg Projesi web sitesinin telif hakkı olduğunu unutmayın.
Ancak, umut var :
Daha İyi Alternatifler
- Project Gutenberg web sitesinin çevrimdışı bir sürümünü edinin.
- Tüm Gutenberg ebook dosyalarını edinin.
- Project Gutenberg katalog verilerini alın.
Ve:
[...] Tüm e-Kitaplarımızı, sıkıştırılmış dosyalarda, robotunuzu http://www.gutenberg.org/robot/harvest adresinde bularak alabilirsiniz.
[...] Zip dosyalarını açmak, 70.000 dosya daha üretecek.
Bu, aşağıdakileri kullanarak tüm dosyaların nasıl alınacağına bir örnektir
wget
:wget -w 2 -m http://www.gutenberg.org/robot/harvest
[...] Yalnızca bazı dosya türlerini isterseniz:
wget -w 2 -m http://www.gutenberg.org/robot/harvest?filetypes[]=txt
[...] Yalnızca belirli bir dilde dosyalar istiyorsanız:
wget -w 2 -m http://www.gutenberg.org/robot/harvest?langs[]=de
Öyleyse şunu itiraf ederim:
wget -w 2 -m http://www.gutenberg.org/robot/harvest?filetypes[]=txt&langs[]=en
--level=0
. Ancak iptal etmenize ve yeniden başlatmanıza izin vermeniz daha iyi olur sanırım: dene --level 9999 --no-clobber
, sahip olduğunuz dosyaları atlayacak (hala diskte aynı klasörde olduğunuzu varsayarak).
--input-file
manuel içinde .
-c
Seçenek kullanmıştım ama yine de. offset=xxx
Yansıtılacak URL’yi verdim ancak yine de ilk sayfadan indiriliyor.
Sen indirebilirsiniz İngiliz kitapların tamamını Gutenberg koleksiyonunu ve diğer dillerin son derece sıkıştırılır ve daha sonra açılabilir tek ZIM dosyasında kiwix hem masaüstü ve Android'de. İngilizce kitaplar 40 GB.
Seçilen cevap doğru olsa da, potansiyel olarak iki soruna neden olur:
wget
komut başarısız olur, harici bir yansıtmadan dosyaları indirirken yinelemeli kontrolleri başarısız olur.Aşağıdaki çözüm bu sorunları düzeltir:
wget -H -w 2 -m http://www.gutenberg.org/robot/harvest?filetypes[]=txt&langs[]=en \
--referer="http://www.google.com" \
--user-agent="Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.6" \
--header="Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5" \
--header="Accept-Language: en-us,en;q=0.5" \
--header="Accept-Encoding: gzip,deflate" \
--header="Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" \
--header="Keep-Alive: 300"
Yönlendiriciyi ve kullanıcı aracısı dizelerini biraz rasgelelik sağlamak için değiştirmek isteyebilirsiniz.
ftp://mirrors.pglaf.org/mirrors/gutenberg-iso , birkaç iyi seçeneğe sahip.
ftp://mirrors.pglaf.org/mirrors/gutenberg-iso/pgdvd042010.iso , ihtiyaçlarınız için yeterli olması gereken 8GB bir dosyadır.
Burada daha fazla bilgi var:
https://www.gutenberg.org/wiki/Gutenberg:The_CD_and_DVD_Project#Downloading_Via_FTP , FTP ve BitTorrent dahil, arşivi indirmek için tüm seçenekleri sunar.
Diğer bir seçenek ise http://pgiso.pglaf.org/ adresindeki harika araç .
Neden tüm aşırı karmaşık ve yukarıda gösterilen programlama becerilerinizi ve bilginizi tüm bu eylemleri birbirine bağlayan ve "Tıkladığınızda bir dil seçeneği sekmesiyle" Tüm Geçerli Kitapları İndir "yazan basit bir düğme oluşturmak için kullanmıyorsunuz?
Siteye gelen kullanıcıların çoğunun e-kitap koleksiyoncuları olduğundan ve ilgilendikleri konularla ilgili kitapların 1 veya 2 kitap için el ile indirilmesinden eminim. Ancak elle daha büyük bir koleksiyon yapmak çok zor. Bununla birlikte, araştırma için ihtiyaç duyuyorlarsa veya basit bir şekilde, bilgisayarlarında devasa bir dijital kitap kütüphanesine sahip olmak isterler. Çoğu kişi kapalıdır ve bunu yapmak için bir Bilgisayar Sihirbazı olması gerektiğinin farkına vardıklarında siteden uzaklaşırlar. Dolayısıyla, "Tüm Güncel Kitapları İndir" butonu siteye projeye ve kullanıcılarına fayda sağlayacak ve kesinlikle üretecektir. siteye daha fazla ziyaretçi. Böylece herkes mutlu olur.