«scrapy» etiketlenmiş sorular

3
Başsız Tarayıcı ve kazıma - çözümler [kapalı]
Kapalı. Bu soru Yığın Taşması yönergelerine uygun değil . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Soruyu Yığın Taşması için konuyla ilgili olacak şekilde güncelleyin . 5 yıl önce kapalı . Tarayıcı otomatik test takımları ve kazıma yeteneğine sahip başsız tarayıcı platformları için olası çözümlerin listesini yapmaya …

23
Mac OS X 10.9'a Lxml yüklenemiyor
Lxml'i kurmak istiyorum, böylece Scrapy'yi yükleyebilirim. Bugün Mac'imi güncellediğimde lxml'i yeniden yüklememe izin vermedi, aşağıdaki hatayı alıyorum: In file included from src/lxml/lxml.etree.c:314: /private/tmp/pip_build_root/lxml/src/lxml/includes/etree_defs.h:9:10: fatal error: 'libxml/xmlversion.h' file not found #include "libxml/xmlversion.h" ^ 1 error generated. error: command 'cc' failed with exit status 1 Demlemek için libxml2 ve libxslt'i yüklemeyi denedim, …
234 python  xcode  macos  scrapy  lxml 

18
OSX 10.11'e (El Capitan) (Sistem Bütünlüğü Koruması) Scrapy kurulumu sırasında “OSError: [Errno 1] İşleme izin verilmiyor”
Pip ile OSX 10.11 (El Capitan) Scrapy Python çerçevesini yüklemeye çalışıyorum. Yükleme komut dosyası gerekli modülleri indirir ve bir noktada aşağıdaki hatayı döndürür: OSError: [Errno 1] Operation not permitted: '/tmp/pip-nIfswi-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/six-1.4.1-py2.7.egg-info' Ben komut ile OSX 10.11 rootless özelliğini devre dışı bırakmaya çalıştım: sudo nvram boot-args="rootless=0";sudo reboot ancak makine yeniden başlatıldığında da …

8
Scrapy, AJAX kullanan web sitelerindeki dinamik içeriği kazımak için kullanılabilir mi?
Son zamanlarda Python öğreniyorum ve elimi bir web kazıyıcı inşa etmeye daldım. Hiç fantezi bir şey değil; tek amacı, verileri bir bahis web sitesinden çıkarmak ve bu verilerin Excel'e konmasını sağlamaktır. Sorunların çoğu çözülebilir ve etrafta iyi bir karışıklık yaşıyorum. Ancak bir konuda büyük bir engelle karşılaşıyorum. Bir site at …


17
Toplama: SSL: http://en.wikipedia.org için CERTIFICATE_VERIFY_FAILED hatası
'Python ile Web Kazıma' kodunun alıştırması yapıyorum ve şu sertifika sorununu yaşıyorum: from urllib.request import urlopen from bs4 import BeautifulSoup import re pages = set() def getLinks(pageUrl): global pages html = urlopen("http://en.wikipedia.org"+pageUrl) bsObj = BeautifulSoup(html) for link in bsObj.findAll("a", href=re.compile("^(/wiki/)")): if 'href' in link.attrs: if link.attrs['href'] not in pages: #We …


10
Scrapy projelerinde hata ayıklamak için PyCharm nasıl kullanılır?
Python 2.7 ile Scrapy 0.20 üzerinde çalışıyorum. PyCharm'ın iyi bir Python hata ayıklayıcısına sahip olduğunu buldum. Scrapy örümceklerimi bunu kullanarak test etmek istiyorum. Bunu nasıl yapacağını bilen var mı lütfen? Ne denedim Aslında örümceği bir senaryo olarak çalıştırmayı denedim. Sonuç olarak, o senaryoyu ben oluşturdum. Daha sonra Scrapy projemi PyCharm'a …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.