Google robots.txt dosyasını önbelleğe alıyor mu?


17

Bir hafta önce sitelerimden birine bir robots.txt dosyası ekledim , bu da Googlebot'un belirli URL'leri almaya çalışmasını engellemişti. Ancak, bu hafta sonu Googlebot’un tam olarak bu URL’leri yüklediğini görebiliyorum.

Google robots.txt dosyasını önbelleğe alıyor mu ve öyleyse almalı mı?

Yanıtlar:


13

Sitenizi Google Search Console'a (önceden Google Web Yöneticisi Araçları) kaydettirmenizi önemle tavsiye ederim . Site yapılandırması altında, robots.txt dosyanızın en son ne zaman indirildiğini bildiren bir tarayıcı erişimi bölümü vardır . Araç ayrıca, tarayıcıların sitenizi nasıl gördüğüne, neyin engellenip neyin çalışmadığına ve Google'daki sorgularda nerede göründüğüne ilişkin çok fazla ayrıntı sağlar.

Söyleyebileceğim kadarıyla Google robots.txt dosyasını sık sık indiriyor . Google Search Console sitesi, URL'leri dizinden özel olarak kaldırmanıza da izin verir, böylece şimdi engellemekte olduğunuz URL'leri kaldırabilirsiniz.


2
Web yöneticisi araçlarını kontrol ettim: robots.txt dosyası geçerli ve en son googlebot tarafından bu sayfalara yapılan son ziyaretten 17 saat önce getirildi. Bunun Google'ın ağı üzerinden yayılma sorunu olduğundan şüpheleniyorum - sonunda tüm googlebot sunucuları robots.txt talimatlarını yakalayacak.
Quog

Google botu, Search Console'da raporların bildirildiği sıklıkta robots.txt dosyasını kullanmıyor. Bir güncelleme yaptığımdan bu yana dört hafta geçti ve Google bot hala kötü bir robots.txt kullanıyor - ve trafik ve sıralamamızı yok ediyor.
Kurumsal Geek

3

Sebat. Robots.txt dosyasından meta noindex, nofollow dizinine geçtim. Meta'nın çalışması için robots.txt dosyasındaki engellenen adreslerin engellemesinin kaldırılması gerekiyordu.

Bunu acımasızca robots.txt dosyasını silerek (ve google'ın web yöneticisinde silerek) yaptım.

Web yöneticisi aracında (engellenen sayfa sayısı) görüldüğü gibi robots.txt kaldırma işleminin tamamlanması 10 hafta sürdü ve bu toplu iş yalnızca son 2 hafta içinde google tarafından kaldırıldı.


Seninle aynı fikirde olmaya meyilliyim. Bir hata yaptık ve robots.txt dosyasını yanlış güncelledik. Google önbelleğe aldı ve hatayı düzelttikten dört hafta sonra kullanıyor ve yeni bir robots.txt ile değiştirdi. Google Web Yöneticisi Araçları'nda manuel olarak bir yenileme isteği gönderdim ve ... hiçbir şey. Bu, trafik ve sıralama kaybına yol açtığı için gerçekten kötü. :(
Kurumsal Geek

2

Evet, Google açık bir şekilde robots.txt dosyasını bir ölçüde önbelleğe alacaktır - bir sayfaya her bakmak istediğinde indirmeyecektir. Ne kadar süreyle önbelleğe aldığını bilmiyorum. Ancak, uzun bir Expires üstbilgisi kümeniz varsa, Googlebot dosyayı kontrol etmek için çok daha uzun süre bırakabilir.

Başka bir sorun yanlış yapılandırılmış bir dosya olabilir. Danivovich'in önerdiği Web Yöneticisi Araçları'nda bir robots.txt denetleyicisi var. Hangi tür sayfaların engellendiğini ve hangilerinin iyi olduğunu söyleyecektir.


Bu yanıtla ilgili açıklamaya bakın webmasters.stackexchange.com/questions/2272/…
Quog

2
@Quog: Bu son videoya bakın: youtube.com/watch?v=I2giR-WKUfY Matt Cutts, robots.txt dosyasının günde bir kez veya yaklaşık her 100 istekte bir indirildiğini gösterir.
DisgruntledGoat

2

Google'ın Dokümantasyonu genellikle robots.txt dosyasını bir gün boyunca önbelleğe alacaklarını , ancak yenilemeye çalışırken hata alırlarsa daha uzun süre kullanabileceğini belirtir .

Bir robots.txt isteği genellikle bir güne kadar önbelleğe alınır, ancak önbelleğe alınan sürümün yenilenmesinin mümkün olmadığı durumlarda (örneğin, zaman aşımları veya 5xx hataları nedeniyle) önbelleğe alınabilir. Önbelleklenen yanıt farklı tarayıcılar tarafından paylaşılabilir. Google, maksimum yaşta Cache-Control HTTP başlıklarına dayanarak önbellek ömrünü uzatabilir veya azaltabilir.



1

Kullanıcıların erişebildikleri önbellekte görebildiğim kadarıyla, yapmanız gereken şey robots.txt dosyanızın URL'sini bir Google Arama'ya yazmak ve ardından küçük yeşil açılır oku tıklayıp 'önbelleğe alınmış' seçeneğini tıklamaktır (aşağıdaki resme bakın) bu size Googles sunucularından bu sayfanın en son sürümünü verecektir.

resim açıklamasını buraya girin


-2

Google'ın URL kaldırma aracını kullanarak kaldırılmasını isteyebilirsiniz .


Bu soruya cevap vermiyor.
MrWhite

neden cevap vermiyorsun?
KOZASHI SOUZA

Soru özellikle robots.txt, URL'lerin önbelleğe alınması ve taranmasıyla ilgili. Bunun sonuçlarından biri URL'lerin dizine eklenmemiş olması olabilir, ancak soru bu değildir. (Google'ın URL kaldırma aracı da yalnızca "geçici" bir düzeltmedir, kalıcı hale getirmek için yapmanız gereken başka adımlar da vardır.)
MrWhite
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.