PDF dosyanızın (veya HTML olmayan herhangi bir dosyanın) arama sonuçlarında listelenmesini önlemek için tek yol HTTP X-Robots-Tagyanıt başlığını kullanmaktır , örneğin:
X-Robots-Tag: noindex
Bunu, sitenin kök .htaccess dosyasına veya httpd.conf dosyasına aşağıdaki snippet'i ekleyerek yapabilirsiniz:
<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex, nofollow"
</Files>
Yukarıdakilerin çalışması için söz konusu dosyanın HTTP başlıklarını değiştirebilmeniz gerektiğini unutmayın. Böylece, örneğin GitHub Sayfalarında bunu yapamayabilirsiniz .
Ayrıca unutmayınız robots.txt gelmez değil arama sonuçlarında yer almasının sayfanızı engeller.
Yaptığı şey botun sayfanızı taramasını engellemek, ancak üçüncü bir taraf kendi web sitesinden PDF dosyanızı bağlarsa, sayfanız yine de listelenecek.
Botun robots.txt kullanarak sayfanızı taramasını engellerseniz , X-Robots-Tag: noindexyanıt etiketini görme şansınız olmaz . Bu nedenle, başlığı kullanıyorsanız , hiçbir zaman robots.txt dosyasındaki bir sayfaya asla izin X-Robots-Tagvermeyin. Daha fazla bilgi Google Geliştiriciler'de bulunabilir: Robots Meta Tag .