Google'ı robots.txt'imi kontrol etmesini isteyebilir miyim?


11

Bu sorudaki cevapları okudum, ancak yine de sorumu açık bırakıyorlar: Google robots.txt'yi önbelleğe alıyor mu?

Google Web Yöneticisi Araçları'nda robots.txt dosyamın yeniden indirilmesini başlatmanın bir yolunu bulamadım .

Bazı hatalar nedeniyle, robots.txt dosyamın yerine:

User-agent: *
Disallow: /

Ve şimdi tüm içeriğim Google arama sonuçlarından kaldırıldı.

Açıkçası, bunu mümkün olan en kısa sürede düzeltmekle ilgileniyorum. Robots.txt dosyasını zaten değiştirdim , ancak Google'ın önbelleğe alınmış sürümü güncellemesinin bir yolunu bulamıyorum.

resim açıklamasını buraya girin


1
Sadece robots.txt tüm sayfalarınızı izin vermeme genellikle gerektiğini değil yeterli tamamen sürece başka siteler hala onlara bağlantı olarak, Google'ın sonuçlarından bunları kaldırmak için.
Ilmari Karonen

Hmm bu biraz zor. ZenCart URL'leri robots.txt web tarayıcı botunu karıştırıyor gibi görünüyor ve siz farkına varmadan, engellenmesini istemediğiniz URL'leri engellediniz. Deneyimlerim, robots.txt olmadan daha iyi durumda olmanız, ancak sadece temiz bir web sitesi tutmanızdır. Geçerli URL'lerin bu robots.txt hatası engellemesi nedeniyle birçok web sıralamasında yer kaybettim. ZenCart dinamik URL'ler kullandığından, engellenmesini beklemediğiniz URL'lerin engellenmesiyle sonuçlanan robots.txt web tarayıcısını karıştırıyor gibi görünüyor. Bunun

Yanıtlar:


10

İstediğiniz zaman robots.txt dosyanızı yeniden indirmelerini sağlayamazsınız. Google yeniden tarar ve siteniz için uygun olduğunu düşündüklerinde yeni verileri kullanır. Güncelleme dosyanızın bulunması ve sayfalarınızın yeniden taranması ve yeniden dizine eklenmesi uzun sürmesini beklememem için düzenli olarak tarama eğilimindedirler. Sayfalarınız yeniden taranmadan yeni robots.txt dosyasının bulunmasının biraz zaman alabileceğini ve bunların Google'ın arama sonuçlarında yeniden görünmesinin daha fazla zaman alabileceğini unutmayın.


1
Onlara göre her gün kontrol ediyorlar, ancak yoğun siteler için muhtemelen daha sık kontrol ediyorlar. Bkz. Webmasters.stackexchange.com/a/32949/17430 .
studgeek

1

www.satyabrata.com16 Haziran'da yeni web sitemi başlattığımda da aynı sorunla karşılaştım .

Bir vardı Disallow: /benim de robots.txt aynen Oliver gibi,. Google Web Yöneticisi Araçları'nda engellenen URL'ler hakkında bir uyarı mesajı da vardı.

Sorun dün 18 Haziran'da çözüldü. Aşağıdakileri yaptım. Hangi adımın işe yaradığından emin değilim.

  1. Sağlık -> Google Gibi Getir: robots.txt ve ana sayfa. Ardından dizine gönderin.
  2. Ayarlar -> Tercih edilen alan adı: Görünen URL www.satyabrata.com
  3. Optimizasyon -> Site Haritaları: XML site haritası eklendi.

Engellenen URL'lerle ilgili uyarı mesajı artık kaldırıldı ve Google Web Yöneticisi Araçları'nda indirilmiş yeni bir robots.txt dosyası gösteriliyor.

Şu anda Google'da dizine eklenmiş yalnızca iki sayfam var, ana sayfa ve robots.txt . Web sitesinde 10 sayfam var. Umarım geri kalanlar yakında endekslenir.


0

Görüntülerin ayrı bir CNAME sunucusuna taşındığı ve görüntüler klasörüne izin verilmeyen bir sorun yaşadım. Temizlememin yolu, Web Yöneticisi Araçları'nda web sayfasını Google aracı olarak okumak için robots.txt dosyasının alınmasıydı. Bana robots.txt dosyasını alıp okuduğunu söyledikten sonra gönderdim. Bu, Google'ın robots.txt dosyasını okuduğunu ancak resim klasörüne izin vermek için değiştirilen kurallara uyacak şekilde örümcek oluşturduğunu bildirdiği görüntüleri taramak için üç aylık bir ambargo kırdı. Bir hafta içinde görüntüler tekrar dizine ekleniyordu.

Denemeye değer olabilir. Google'ın zaman zaman takıldıkları ve dosyayı tekrar okuyamadıkları bilinmektedir.


Gönderdikten yaklaşık 6 saat sonra dosyayı yeniden okuyorlar. Şimdiye kadar her şey normale döndü.
Der Hochstapler

Whew! O zaman tekrar yola çıkın!
Fiasco Labs

Robots.txt getirmesi için web yöneticisi araçlarını sormaya çalıştım, robots.txt tarafından reddedildiğinden şikayet etti :). Görünüşe göre tam bir blok yapan robots.txt dosyanız varsa bu hile çalışmaz.
studgeek

Aynı burada ... robots.txt tarafından robots.txt tarafından reddedildi! Hah!
Kasapo

Öyleyse, eğer kökü inkar ederseniz, sanırım SOL'sunuz. Benim durumumda, reddedilen bir alt klasördü, bu yüzden gerçekten çalışan mekanizmalar aracılığıyla robots.txt dosyasını tekrar okumak zorunda kaldı.
Fiasco Labs


-1

Benim durumumda sorun afraid.org adlı ücretsiz bir DNS hizmeti kullanıyordum.

(ücretsiz alan adım sona erdi .us.to)

Bir TLD'ye geçtikten sonra çalışmaya başladı.


DNS'nin veya ücretsiz siteye sahip olmanın robots.txt ile ne yapacağını veya Google'a yeniden getirmesini söylemediğini görmüyorum.
Stephen Ostermiller

@StephenOstermiller: Ben de görmüyorum, ama gerçek şu ki bu benim durumuma yardımcı oldu.
Stefan Monov

Google'ın robots.txt dosyanızı kontrol etmesine yardımcı oldu mu?
Stephen Ostermiller

@StephenOstermiller: Evet.
Stefan Monov
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.