Son zamanlarda Python öğreniyorum ve elimi bir web kazıyıcı inşa etmeye daldım. Hiç fantezi bir şey değil; tek amacı, verileri bir bahis web sitesinden çıkarmak ve bu verilerin Excel'e konmasını sağlamaktır.
Sorunların çoğu çözülebilir ve etrafta iyi bir karışıklık yaşıyorum. Ancak bir konuda büyük bir engelle karşılaşıyorum. Bir site at tablosu yüklüyorsa ve mevcut bahis fiyatlarını listeliyorsa, bu bilgi herhangi bir kaynak dosyasında bulunmaz. İpucu, bu verilerin bazen canlı olması ve sayıların bazı uzak sunuculardan açıkça güncellenmesi. Bilgisayarımdaki HTML, sunucularının ihtiyacım olan tüm ilginç verileri ilettiği bir deliğe sahip.
Dinamik web içeriği ile ilgili deneyimim düşük, bu yüzden bu şey kafamı dolaşmakta sorun yaşıyorum.
Java veya Javascript'in bir anahtar olduğunu düşünüyorum, bu sık sık ortaya çıkıyor.
Kazıyıcı basitçe bir oran karşılaştırma motorudur. Bazı sitelerin API'leri var ama bunu yapanlar için buna ihtiyacım var. Python 2.7 ile terapi kütüphanesini kullanıyorum
Bu soru çok açık uçlu ise özür dilerim. Kısacası sorum şu: Bu dinamik veriyi kullanabilmem için scrapy nasıl kullanılabilir? Bu bahis oranları verilerini gerçek zamanlı olarak kazıyabilmem için?
Firefox
gibi bazı uzantıları deneyin ve ajax isteği kullanan bir sayfa yükleyin. Scrapy, ajax isteklerini otomatik olarak tanımlamaz, uygun ajax URL'sini manuel olarak aramanız ve ardından bununla istekte bulunmanız gerekir. httpFox
liveHttpHeaders