PDF dosyanızın (veya HTML olmayan herhangi bir dosyanın) arama sonuçlarında listelenmesini önlemek için tek yol HTTP X-Robots-Tag
yanıt başlığını kullanmaktır , örneğin:
X-Robots-Tag: noindex
Bunu, sitenin kök .htaccess dosyasına veya httpd.conf dosyasına aşağıdaki snippet'i ekleyerek yapabilirsiniz:
<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex, nofollow"
</Files>
Yukarıdakilerin çalışması için söz konusu dosyanın HTTP başlıklarını değiştirebilmeniz gerektiğini unutmayın. Böylece, örneğin GitHub Sayfalarında bunu yapamayabilirsiniz .
Ayrıca unutmayınız robots.txt gelmez değil arama sonuçlarında yer almasının sayfanızı engeller.
Yaptığı şey botun sayfanızı taramasını engellemek, ancak üçüncü bir taraf kendi web sitesinden PDF dosyanızı bağlarsa, sayfanız yine de listelenecek.
Botun robots.txt kullanarak sayfanızı taramasını engellerseniz , X-Robots-Tag: noindex
yanıt etiketini görme şansınız olmaz . Bu nedenle, başlığı kullanıyorsanız , hiçbir zaman robots.txt dosyasındaki bir sayfaya asla izin X-Robots-Tag
vermeyin. Daha fazla bilgi Google Geliştiriciler'de bulunabilir: Robots Meta Tag .