Minimum geçerli robots.txt dosyası nedir?


14

Web sunucumun access.log dosyasında çok fazla 404 hatası görmekten hoşlanmıyorum . Tarayıcılar bir robots.txt dosyası açmaya çalıştıklarından ancak bulamadıklarından bu hataları alıyorum . Bu yüzden günlük dosyamda 404 hatalarının görünmesini engelleyecek basit bir robots.txt dosyası yerleştirmek istiyorum .

Sitedeki her şeyin taranmasına izin verecek minimum geçerli bir robots.txt dosyası nedir?

Yanıtlar:


17

Belirtildiği gibi burada , adlı bir metin dosyası oluşturun robots.txt web sunucunun en üst düzey dizininde. Boş bırakabilir veya ekleyebilirsiniz:

User-agent: *
Disallow:

Robotların her şeyi taramasını istiyorsanız . Değilse, daha fazla örnek için yukarıdaki bağlantıya bakın.


Neden yalnızca "İzin Ver: *" yerine "İzin verme:" ifadesini eklemelisiniz?
Athoxx

2
@Patrik "Allow", önceki "Disallow" yönergelerini geçersiz kılmak içindir. "Disallow" yoksa anlamsızdır. Dürüst olmak gerekirse en iyi çözüm boş bir dosyadır.
DisgruntledGoat

2
Ah, anlıyorum. Ayrıca boş bir dosyanın en iyisi olduğunu kabul ediyorum.
Athoxx

2
@PatrikAlienus Çünkü "Allow" robots.txt belirtiminde değil.
user11153 06

1
@ user11153: Ha? 1997 İnternet Taslağı belirtiminin "3.2.2 İzin Ver ve İzin Verme satırları" bölümü Web Robotları Denetimi için Bir Yöntem ?
David Cary

2

En iyi minimal robots.txt, tamamen boş bir dosyadır.

Boş Disallowveya Allow: *yalnızca işe yaramaz olmaları nedeniyle gereksiz değildir, ancak gereksiz karmaşıklık ekler.

Dosyanın tamamen boş olmasını istemiyorsanız veya dosyayı daha okunabilir hale getirmek istiyorsanız, #karakterle başlayan bir yorum ekleyin # blank file allows all. Tarayıcılar, ile başlayan satırları yok sayar #.


0

Bunu söyleyebilirim;

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Google'ın her şeyi taramasına izin verir, ancak Google'ın aadminn panelinizi taramasına izin vermez. Bu sizin için ideal bir durum.


2
Bir şeyleri kaçırıyor olabilirim, ama askerin Wordpress kullandıklarını söylediğini sanmıyorum.
Maximillian Laumeister
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.