Bir site için aşağıdaki robots.txt dosyasını kullanıyorum: Hedef, googlebot ve bingbot'un sayfa dışındaki siteye erişmesine izin vermek ve /bedven/bedrijf/*
diğer tüm botların siteyi taramasını engellemektir.
User-agent: googlebot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: google
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bingbot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bing
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: *
Disallow: /
Son kural User-agent: * Disallow: /
tüm botların sitedeki her sayfayı taramasına izin vermiyor mu?
robots.txt
her halükarda tamamen görmezden gelebilir
robots.txt
veya en azından Disallow: /
kuralı sıkıntısı yoktur . Kişisel web siteniz zemine çakılıyorsa, bir bot programcısı sunucunun 256 kbit'lik bir bağlantının yanlış ucunda bir Raspberry Pi olabileceğini düşünmediğinden, bunun gibi bir battaniye dışlama yararlıdır.