«robots.txt» etiketlenmiş sorular

Robots.txt, Web sitesi sahipleri tarafından siteleri hakkında web robotlarına talimat vermek için kullanılan bir metin dosyasıdır. Temel olarak robotlara sitenin hangi bölümlerinin açık ve hangi bölümlerin kapalı olduğunu söyler. Buna Robotlar Dışlama Protokolü denir.

4
Her web sitesinde almam gereken dosyalar
Her web sitesinde bulunması gereken dosyaların bir listesini istiyorum. Buradaki fikir çoğu tarayıcıyı ve botu memnun etmek ve kayıtlardaki 404 mesajın sayısını azaltmaktır. Şimdiye kadar aşağıdaki dosyaları var: /favicon.ico /robots.txt /sitemap.xml /apple-touch-icon-72x72-precomposed.png /apple-touch-icon-72x72.png /apple-touch-icon-precomposed.png /apple-touch-icon.png Sık sık talep edilen ve her web sitesinde bulunması gereken başka dosyalar var mı?




2
Robots.txt ile dizinin tamamına nasıl izin vermezim?
Şu anda üzerinde çalıştığım bir alışveriş sepeti ve başka bir alışveriş yapan iki sitem var. Her ikisi de aynı alan adı altında olduğundan, örneğin http://example.com/first_url http://example.com/second_url Her iki URL'nin altında tonlarca sayfa var http://example.com/first_url/product1 http://example.com/first_url/product2 http://example.com/first_url/product3 http://example.com/second_url/product1 http://example.com/second_url/product2 http://example.com/second_url/product3 Nasıl ana URL engelleyebilirim /first_urlve /second_urlçok ve tüm alt sayfaları ve …
19 seo  robots.txt 

2
Google arama sonuçları neden robots.txt dosyasında izin verilmeyen sayfalar içeriyor?
Sitemde arama motorlarını uzak tutmak istediğim bazı sayfalar var, bu yüzden dosyamda şu şekilde izin vermedim robots.txt: User-Agent: * Disallow: /email Yine de kısa bir süre önce Google'ın bazen arama sonuçlarında bu sayfalara bağlantılar döndürdüğünü fark ettim. Bu neden oluyor ve nasıl durdurabilirim? Arka fon: Birkaç yıl önce, bir akrabamın …


3
Robots.txt bir sunucunun alt dizininde olabilir mi?
Arama motoru web tarayıcılarından gizlemek istediğiniz bir alt dizin var. Bunu yapmanın bir yolu robots.txtsunucunun kök dizininde (standart yol) bir kullanmaktır. Ancak, web sitesi URL'sini bilen ve bazı temel web bilgisine sahip olan herkes robots.txt içeriğine erişebilir ve izin verilmeyen dizinleri tespit edebilir. Bundan kaçınmanın bir yolunu düşündüm, ama işe …

4
Site saldırıya uğradı, + ile başlayan tüm URL'leri Google'dan kaldırmanız gerekiyor, robots.txt kullanılsın mı?
robots.txtGooglebotların dizine eklemeyi durdurması için bu tür URL'lerin nasıl engelleneceğini lütfen bize bildirir misiniz ? http://www.example.com/+rt6s4ayv1e/d112587/ia0g64491218q Web sitem saldırıya uğradı, ancak hacker Google'da 5000 URL'yi dizine ekledi ve şimdi /+yukarıdaki bağlantıdan başlayarak rastgele oluşturulan bağlantılarda 404 hatası alıyorum . Bu URL'leri Google Web Yöneticisi Araçları'ndan manuel olarak kaldırmanın dışında hızlı …

3
Minimum geçerli robots.txt dosyası nedir?
Web sunucumun access.log dosyasında çok fazla 404 hatası görmekten hoşlanmıyorum . Tarayıcılar bir robots.txt dosyası açmaya çalıştıklarından ancak bulamadıklarından bu hataları alıyorum . Bu yüzden günlük dosyamda 404 hatalarının görünmesini engelleyecek basit bir robots.txt dosyası yerleştirmek istiyorum . Sitedeki her şeyin taranmasına izin verecek minimum geçerli bir robots.txt dosyası nedir?
14 robots.txt 

3
Robots.txt - CSS izin veriyor veya izin vermiyor
Robots.txt dosyasında CSS ve şablonlara izin veriliyor mu? Herhangi bir soruna neden olmalı mı? Joomla'da, robots.txt dosyasında CSS ve şablonlara izin verilmiyor . Lütfen yaklaşan web sitelerim için CSS robotlarına, şablonlara vb. İzin vermeme konusunda bir çözüm bulmama yardımcı olun.
12 css  robots.txt 

3
Robots.txt: Hiçbir yere bağlı olmayan bir sayfaya izin vermem gerekir mi?
Web sitemde kullanıcının yalnızca URL'sini verirsem ziyaret edebilmesini istediğim bazı sayfalar var. Tek sayfaları robots.txtiçeri almazsam, bu sayfalara bakan herkes tarafından görülebilir. Sorum şu: Onları herhangi bir yerden veya en azından dizine eklenmiş bir sayfadan bağlamazsam, tarayıcılar tarafından yine de bir şekilde erişilebilir mi?
12 robots.txt 

2
Bir siteye hangi botların girmesine gerçekten değer?
Bir dizi bot yazdıktan ve bir siteyi taramak için meydana gelen çok sayıda rastgele bot gördükten sonra, bir web yöneticisi olarak merak ediyorum, hangi botların bir siteye gerçekten izin vermeye değer? İlk düşüncem, botların siteye girmesinin potansiyel olarak siteye gerçek trafik getirebileceğidir. Bir siteye gerçek trafik gönderdiği bilinmeyen botlara izin …


2
Google Web Yöneticisi Araçları bana robotların site haritasına erişimi engellediğini söylüyor
Bu benim robots.txt dosyam : User-agent: * Disallow: /wp-admin/ Disallow: /wp-includes/ Sitemap: http://www.example.org/sitemap.xml.gz Ancak Google Web Yöneticisi Araçları, robotların site haritasına erişimi engellediğini söylüyor: Site Haritanıza erişmeye çalışırken bir hatayla karşılaştık. Lütfen Site Haritanızın yönergelerimize uyduğundan ve sağladığınız yerden erişilebildiğinden emin olun ve ardından yeniden gönderin: URL, robots.txt tarafından kısıtlandı …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.