Bunun oldukça eski bir soru olduğunu ve oldukça iyi cevapları olduğunu anlıyorum. Ama işte tamlık adına iki sentim.
Resmi belgelere göre , robotların sitenize erişmesi için tam erişime izin vermenin dört yolu vardır.
Temiz:
@Unor tarafından belirtildiği gibi izin verilmeyen segmentli bir genel eşleştirici belirtin. Yani /robots.txt
böyle görünüyorsun.
User-agent: *
Disallow:
Hack:
/robots.txt
İçinde içerik olmayan bir dosya oluşturun . Her tür için herkese izin veren varsayılan Bots
.
Umrumda değil yolu:
Hep birlikte yaratmayın /robots.txt
. Yukarıdaki ikisi ile tam olarak aynı sonuçları vermelidir.
Çirkin:
Gönderen Meta etiketleri için robotlar dokümantasyon , Sen izin sitenizdeki tüm sayfalarınızda aşağıdaki meta etiketi kullanabilirsiniz Bots
bu sayfaların dizine gerekiyordu değildir, know.
<META NAME="ROBOTS" CONTENT="NOINDEX">
Bunun sitenizin tamamına uygulanabilmesi için, bu meta etiketi tüm sayfalarınıza eklemeniz gerekecektir. Ve bu etiket kesinlikle sayfanızın HEAD
etiketinin altına yerleştirilmelidir . Bu meta etiket hakkında daha fazla bilgiyi burada bulabilirsiniz .