Göreli bir site haritası URL'si bir robots.txt dosyasında kullanılabilir mi?


191

Robots.txt dosyasında site haritası dosyası için aşağıdaki göreli URL'yi yazabilir miyim?

sitemap: /sitemap.ashx

Veya site haritası dosyası için tam (mutlak) URL'yi kullanmak zorunda mıyım, örneğin:

sitemap: http://subdomain.domain.com/sitemap.ashx

Neden merak ediyorum:

  • Kullanıcıların accountname.domain.com adresinde blog yazmasına olanak tanıyan yeni bir blog hizmetim (www.domain.com) var.
  • Joker karakterler kullanıyorum, bu nedenle tüm alt alanlar (hesaplar) "blog.domain.com" u gösteriyor.

Blog.domain.com'da, arama motorlarının site haritasını bulmasına izin vermek için robots.txt dosyasını koydum. Ancak, joker karakterler nedeniyle, tüm kullanıcı hesabı aynı robots.txt dosyasını paylaşır.Bu yüzden ikinci alternatifi kullanamıyorum. Ve şimdilik txt dosyaları için url yeniden yazma özelliğini kullanamıyorum. (Sanırım IIS'nin sonraki sürümleri bunu yapabilir mi?)

Yanıtlar:


318

Sitemaps.org adresindeki resmi belgelere göre tam bir URL olması gerekir:

Site Haritasının konumunu bir robots.txt dosyası kullanarak belirleyebilirsiniz. Bunu yapmak için site haritasına tam URL'yi içeren aşağıdaki satırı eklemeniz yeterlidir :

Sitemap: http://www.example.com/sitemap.xml

31
@ Unor örneğinin şunları içerdiğini lütfen unutmayın: Büyük harf S ile site haritası. Robots.txt büyük / küçük harfe duyarlı olduğundan bu önemlidir.
BodgeIT

19
Ve davanın konuyla ilgili, robotstxt.org belirtir dosya ismini vermek robots.txtsermaye R. olmadan
khargoosh

site https yüklüyorsa, http ile belirtilen Site Haritası URL'si. Bu iyi mi? Ya da site haritası URL'sini protokole göre yerleştirmek zorunda mıyız?
Şems

4
@Shams: Site haritanızda listelenen URL'ler, site haritası dosyasıyla aynı protokolü ve aynı ana bilgisayarı kullanmalıdır. Siteniz altında kullanılabilir durumdaysa http ve https , sen sadece (kanonik varyant ile) bir site haritası sunmalıdır .
unor

2

Google tarayıcıları yeterince akıllı değildir, göreli URL'leri tarayamazlar, bu nedenle daha iyi taranabilirlik ve dizine eklenebilirlik için her zaman mutlak URL'lerin kullanılması önerilir.

Bu nedenle, bu varyasyonu kullanamazsınız

> sitemap: /sitemap.xml

Önerilen sözdizimi:

Sitemap: https://www.yourdomain.com/sitemap.xml

Not:

  • "Site Haritası" ndaki ilk harfi büyük yazmayı unutmayın
  • "Site Haritası" ndan sonra yer bırakmayı unutmayın:

-2

İyi teknik ve mantıklı soru sevgili dostum. Robots.txt dosyasında hayır, site haritasının göreli URL'siyle gidemezsiniz; site haritasının tam URL'siyle gitmeniz gerekir.

"Site haritası: https://www.example.com/sitemap_index.xml "

Yukarıdaki URL'de iki nokta üst üste işaret verir. Deepak'ı da desteklemeyi seviyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.