Wget man sayfası tarafından atıfta bulunulan “otomatik alım programlarını” engellemek için “2001 makalesi” nedir?


11

wgetAdam sayfası için bölüm altında, bu devletler --random-waitparametre:

    Some web sites may perform log analysis to identify retrieval
    programs such as Wget by looking for statistically significant
    similarities in the time between requests. [...]

    A 2001 article in a publication devoted to development on a popular
    consumer platform provided code to perform this analysis on the
    fly.  Its author suggested blocking at the class C address level to
    ensure automated retrieval programs were blocked despite changing
    DHCP-supplied addresses.

Bu makalenin bir kopyasını okumak için almak istiyorum ve makaleyi belirlemek için Internet üzerinde birçok arama denedim. Ancak, bu aramalarda bulabildiğim tek şey wgetfarklı web sitelerinde barındırılan kılavuz sayfası ; ve bu konuyla hiçbir ilgisi olmayan başka araştırma makaleleri.

Hangi makaleye yönlendirildiğini ve nereden bir kopya alabileceğimi bilen var mı?


Wget posta listesini inceliyordum
7171u

Yanıtlar:


15

Doğrudan bir cevap olmasa da git blameve git logbu bölümün 2c41d783'tehniksic Hrvoje Niksic olduğu ortaya çıkan bir komutan tarafından tanıtıldığını ortaya çıkarın. Onun e-posta adresi wget ChangeLogdosyasında bulunabilir (Açık nedenlerden dolayı burada yayınlamayacağım). Ona doğrudan sormanızı öneririm, çünkü daha uygun bir cevap vermek için en iyisi olabilir. Bu sırada, ona sayfayı güncellemeyi düşünüp düşünmeyeceğini sormayı düşünebilirsiniz. ;)


4

Bence bu yazı olabilir:

Temel SAS kullanarak web günlüklerinden anlamlı veriler oluşturma

C sınıfı aralıkların engellenmesini tartışan bir paragraf var:

IP adresi bileşenlerine ayrıldıktan sonra IP adreslerinin aralıklarının filtrelenmesi basittir. Bir B sınıfı filtre ilk iki oktete karşı yapılır, örneğin 168.126.xx.xx. Bu, yukarıdaki kod örneğinde Onetwo değişkenidir. C Sınıfı aralıklar, tüm sunucuları hedefledikleri ve dört sekizliden üçünü kullandıkları için daha yaygın olarak kullanılır, örneğin 168.126.56.xx. Yukarıdaki kod örneğinde, Usrhost'un web günlüğünün TCP / IP adres değeri olduğu üç alan.

Ve wgetkullanıcı aracısı dize tabanlı engellemede bir söz :

Kullanıcı aracısı dizesi tanımlaması için tercih ettiğimiz yöntem, dizin deseni eşleştirme işlevini kullanır. Örneğin:

if index(lowcase(agentstr), 'keynote') or
index(lowcase(agentstr), 'sureseeker') or
index(lowcase(agentstr), 'wget') or

Bu, Google'ın 2001 yılı için "günlük analizi aracı" nın beşinci sonucuydu .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.