«robots.txt» etiketlenmiş sorular

Robots.txt, Web sitesi sahipleri tarafından siteleri hakkında web robotlarına talimat vermek için kullanılan bir metin dosyasıdır. Temel olarak robotlara sitenin hangi bölümlerinin açık ve hangi bölümlerin kapalı olduğunu söyler. Buna Robotlar Dışlama Protokolü denir.

5
Google'ı robots.txt'imi kontrol etmesini isteyebilir miyim?
Bu sorudaki cevapları okudum, ancak yine de sorumu açık bırakıyorlar: Google robots.txt'yi önbelleğe alıyor mu? Google Web Yöneticisi Araçları'nda robots.txt dosyamın yeniden indirilmesini başlatmanın bir yolunu bulamadım . Bazı hatalar nedeniyle, robots.txt dosyamın yerine: User-agent: * Disallow: / Ve şimdi tüm içeriğim Google arama sonuçlarından kaldırıldı. Açıkçası, bunu mümkün olan …

3
Google Önizleme Robots.txt dosyasına uyuyor mu?
Çünkü kesinlikle öyle görünüyor. Sitelerim için resim dizinine izin vermiyoruz ve önizlemelerin tümü, sitenin sakat görünmesini sağlayan eksik resimler. Bu durumda ve sadece önizleme botunun robots.txt kullanarak görüntülere erişmesine izin vermenin bir yolu var mı? DÜZENLEME: Görünüşe göre, önizlemeler hem normal Google Bot hem de Web Yöneticisi Merkezi Blogunda belirtildiği …

1
Kullanıcı aracılarını robots.txt dosyasında birleştirin
Kullanıcı aracıları birlikte listelenebilir ve bunları bir robots.txt dosyasında olduğu gibi ortak kuralları izleyebilir mi? User-agent: Googlebot User-agent: ia_archiver #Alexa User-agent: BingPreview #Microsoft User-agent: bingbot #Microsoft User-agent: MSNBot #Microsoft User-agent: Slurp #Yahoo User-agent: Ask Jeeves/Teoma #Ask Disallow: /adm30_buds/


1
Robots.txt dosyasındaki “Noindex:” nasıl çalışır?
Ben karşılaştım bu makalede bugün SEO haber. Görünüşe göre robots.txt dosyasındakiNoindex: standart Disallow:direktiflere ek olarak direktifleri de kullanabilirsiniz . Disallow: /page-one.html Noindex: /page-two.html Arama motorlarının birinci sayfayı taramasını ve ikinci sayfayı dizine eklemelerini önleyecek gibi görünüyor. Bu robots.txt yönergesi Google ve diğer arama motorları tarafından destekleniyor mu? Çalışıyor mu? Belgelenmiş …

2
Yalnızca Google ve Bing botlarının bir siteyi taramasına izin ver
Bir site için aşağıdaki robots.txt dosyasını kullanıyorum: Hedef, googlebot ve bingbot'un sayfa dışındaki siteye erişmesine izin vermek ve /bedven/bedrijf/*diğer tüm botların siteyi taramasını engellemektir. User-agent: googlebot Disallow: /bedven/bedrijf/* Crawl-delay: 10 User-agent: google Disallow: /bedven/bedrijf/* Crawl-delay: 10 User-agent: bingbot Disallow: /bedven/bedrijf/* Crawl-delay: 10 User-agent: bing Disallow: /bedven/bedrijf/* Crawl-delay: 10 User-agent: * …

3
Yalnızca alt alan adına izin vermemek için robots.txt dosyasını nasıl kullanabilirim?
Kodum taban birkaç ortamlarda (canlı, evreleme, dev) ve alt alanları (arasında paylaştırılır staging.example, dev.examplevs.) ve sadece iki taranmak izin (yani. Alınmalıdır www.exampleve example). Normalde değiştirir /robots.txtve eklerdim Disallow: /, ancak paylaşılan kod tabanı nedeniyle /robots.txttüm (alt) etki alanlarını etkilemeden değiştiremem . Bu konuda nasıl bir fikrin var mı?

6
Archive.org bot'a nasıl düzgün (dis) izin verilir? İşler değişti, eğer öyleyse?
Çoğunlukla arama motorları tarafından dizine eklenmesini istemediğim bir web sitem var, ancak archive.org'da sonsuza kadar korumak istiyorum. Yani benim robots.txtbununla başlıyorum: User-agent: * Disallow: / Bugün, archive.org'a göre robots.txtbotlarına izin vermek için aşağıdakileri eklemeliyim : User-agent: ia_archiver Disallow: Ancak, birkaç yıl önce belirttiklerini zaten yapmıştım, en azından aşağıdakileri ekledim: User-agent: …

10
Botların Web Sunucumu Öldürmesini Durdurmam Gerekiyor
Hosting hesabımdaki bazı web sitelerimde EXTREME bot sorunları yaşıyorum. Botlar, tüm hosting hesabım için CPU kaynaklarının% 98'inden ve bant genişliğimin% 99'undan fazlasını kullanıyor. Bu botlar, sitelerim için saatte 1 GB'tan fazla trafik üretiyor . Tüm bu siteler için gerçek insan trafiği ayda 100 MB'den azdır . Bu botları engellemek için …

1
Wordpress arşiv sayfalarını arama motorlarından engellemeli miyim?
Yazılarım ve arşivler /sample-post/için WordPress ve URL'ler kullanıyorum /yyyy/mm/. Google siteyi tamamen dizine ekledi. Arşivler şu anda tam yayınları görüntülediğinden, Google'ın tüm yayınları içerdiği ve yinelenen içerik olacağı için arşiv sayfalarını dizine eklemesine izin vermemeliyim diye düşündüm. Böylece robots.txt dosyam şunları içerir: Disallow: /2009/ Disallow: /2010/ Disallow: /2011/ Disallow: /2012/ …

4
Alan adı tarafından reddedilen robotlar hala arama sonuçlarında listeleniyor
Dolayısıyla, arama yapmayan tüm sitelerimize bir robots.txt dosyası uyguladık ( bir web sitesini gerçek zamanlı Google arama sonuçlarından nasıl hariç tutabilirim? Veya başka bir benzer soru). Bununla birlikte, arama terimleri yeterince spesifikse alan adının kendisi sonuçlar aracılığıyla bulunabilir. Bunun bir örneğini burada bulabilirsiniz . Bağlantıdan görebileceğiniz gibi, alanın kendisi bulunabilir …
9 seo  robots.txt 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.