Bir yazının veya makalenin yayınlanma tarihinin <lastmod>
(diğerlerinin önerdiği gibi) bir XML site haritasına veya bu konu için Son Değiştirilmiş HTTP üstbilgisine dayalı olduğundan şüpheliyim . XML Site Haritası yalnızca tavsiye niteliğindedir, yetkili değildir. Belgenin son değiştirilme tarihi muhtemelen bir makalenin (orijinal) yayınlanma tarihiyle aynı değildir. Ve sayfanın üst kısmındaki yorumumda belirttiğim gibi, bir belgenin son değiştirilme tarihi, tarama hızlarını önbelleğe almak ve belki de belirlemek için muhtemelen daha önemlidir . Dinamik olarak oluşturulan sayfaların Son Değiştirilmiş HTTP üstbilgisi genellikle gerçek tarih / saate çok yakındır (WordPress bloglarında olduğu gibi).
Bir RSS / Atom beslemesi ise bu belirli bilgi külçesini içerir. Gerçekten de, içerikte yayınlanma tarihini içermeyen Wordpress sitelerinde yayınlanma tarihi Google'ın arama sonuçlarında görünmeye devam eder. Ve anlayabildiğim kadarıyla, bu RSS Beslemesi'ndeki tarihle eşleşiyor.
EDIT # 1: Ancak, bir RSS beslemesi tüm sayfaları içermeyebilir. Çoğu durumda yalnızca en son veya en son güncellenen sayfaları içermelidir . Ancak Google'ın daha önce okuduklarını unutması için hiçbir neden yoktur ve bu sayfanın içeriğini değiştirmek, son değiştirilme tarihinden sonra değişmez.
RSS beslemesi yoksa, Google'ın sayfa içeriğini analiz edecek kadar zeki olduğunu düşünüyorum. Özellikle tarihler mikro biçimler yardımıyla 'anlamsal olarak' işaretlenirse . Google'ın aşağıdakileri içerdiği bir makale için yetkili yayınlanma tarihi olarak görmesi mükemmel bir şekilde mümkündür:
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
Google kesinlikle mikro biçimleri okumaktadır - hCard, hReview, vb.
Sadece eklemek için, Google'ın bunu önerecek yetkili bir şey bulamadığı sürece bir yayınlanma tarihi olacağını düşünmüyorum. Spekülatif veriler üzerinde bir 'yayınlama tarihi' çıkarmayacaktır, çünkü yanlış bir 'yayınlama tarihi' hiç kimseye fayda sağlamaz ve Google buna çok fazla sadık kalır!
Ve sadece kayıt için (@Tom aksini öneriyorsa :) Yazıların / makalelerin yayınlanma tarihinin görünür şekilde görüntülenmesi gerektiğini düşünüyorum. Birçoğu yok ve bu özellikle teknoloji konularını araştırırken okuyucu için sinir bozucu olabilir ve makalenin yarısını okuduktan sonra güncel olmadığını görüyorsunuz!
EDIT # 2: O zamandan beri , @mmdanziger'in cevabında detay verdiği benzer bir sıkıntı yaşadım. Eski sitelerimden birinde, her sayfanın üst kısmında ( JavaScript ile sayfaya yazılmıştır!) "Site Son Güncelleme Paz 17 Haziran 2012" (herhangi bir özel şekilde işaretlenmemiş) biçiminde metin var . Bu aynı tarih Google tarafından yakalandı ve şimdi SERPS görünür yanında birkaç (hepsi değil) sayfaları görünür olmuştur - bu kesinlikle sayfanın yayınlanma tarihi değildir. Google, sayfayı "son güncellenen ( entestring )" (JavaScript'i işledikten sonra !!) biçiminde bir dizeye çeviriyor gibi görünüyor . Bu sitenin RSS beslemesi yok. Sitenin bir Sitemap.xml dosyası var, ancak tarihler farklı.
Diğer sitelerde de benzer davranışlar fark ettim.