Robots.txt ile dizinin tamamına nasıl izin vermezim?


19

Şu anda üzerinde çalıştığım bir alışveriş sepeti ve başka bir alışveriş yapan iki sitem var. Her ikisi de aynı alan adı altında olduğundan, örneğin

http://example.com/first_url 
http://example.com/second_url 

Her iki URL'nin altında tonlarca sayfa var

http://example.com/first_url/product1
http://example.com/first_url/product2 
http://example.com/first_url/product3

http://example.com/second_url/product1
http://example.com/second_url/product2 
http://example.com/second_url/product3

Nasıl ana URL engelleyebilirim /first_urlve /second_urlçok ve tüm alt sayfaları ve alt dizinleri? Böyle bir şey düşünüyordum ama bunun işe yarayıp yaramadığını ve doğru sözdizimi olup olmadığını bilmiyorum

Disallow: /first_url/*/
Disallow: /second_url/*/

1
Ben senin sözdizim doğru olduğunu düşünüyorum ama ekstra hakkında emin değilim

Yanıtlar:



-1

Bunu varsayılan olarak kullanabilirsiniz robots.txt:

User-agent: *
Disallow: first_url/*
Disallow: second_url/*

Yıldız, bu kategorideki her şeye izin verilmemesini sağlayacaktır. Hatta belirli bir URL'yi yazarak o kategorideki belirli bir şeye izin vermeyebilirsiniz.


4
Bu, başlangıçtaki eğik çizgiyi kaçırmanız dışında kabul edilen cevaptan farklı değildir. Robots.txt dosyasındaki kurallara izin verme, eğik çizgi ile başlamalıdır. Tüm örnekler bu şekilde belgeleniyor
Stephen Ostermiller
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.