Bir site için aşağıdaki robots.txt dosyasını kullanıyorum: Hedef, googlebot ve bingbot'un sayfa dışındaki siteye erişmesine izin vermek ve /bedven/bedrijf/*diğer tüm botların siteyi taramasını engellemektir.
User-agent: googlebot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: google
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bingbot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bing
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: *
Disallow: /
Son kural User-agent: * Disallow: /tüm botların sitedeki her sayfayı taramasına izin vermiyor mu?
robots.txther halükarda tamamen görmezden gelebilir
robots.txtveya en azından Disallow: /kuralı sıkıntısı yoktur . Kişisel web siteniz zemine çakılıyorsa, bir bot programcısı sunucunun 256 kbit'lik bir bağlantının yanlış ucunda bir Raspberry Pi olabileceğini düşünmediğinden, bunun gibi bir battaniye dışlama yararlıdır.