Google bir yayının yayınlanma tarihini nasıl tanır?


17

Google'da bir şey aradığımda bazen altındaki yazının / makalenin yayınlanma tarihini görüyorum. Ayrıca Wordpress destekli sitemde bulunan kendi makalemi de aradım ve Google da yayınlanma tarihini tanıyor.

Web sitemin kaynağını açtığımda, hiçbir özel etiket veya yayınlanma tarihini gösteren hiçbir şey görmüyorum. Sadece normal bir div içinde yazılır, SE'ye yayınlanma tarihi olduğunu söyleyecek özel bir etiket yoktur (sayfadaki diğer şeylerin başka tarihleri ​​de olabilir).

Google'a, DOM ağacında Wordpress yayınlanma tarihinin tam yeri sabit olarak kodlanmış mı yoksa bir şey mi eksik?

Kendi CMS'imle yeni bir web sitesi oluşturuyorum ve yayınlanmış tanınma tarihinin nasıl uygulanacağını öğrenmeye çalışıyorum.


2
Kesinlikle bir şey eksik: sadece HTML'ye baktınız, ancak bir sayfanın ne zaman değiştirildiğini söyleyen HTTP başlıkları da var. Makalenizin kalıcı bağlantısı için neler rapor ediyorlar? Google'ın bunu, sayfanın ne kadar değiştiğine ilişkin kendi kayıtları ile birlikte kullandığını tahmin ediyorum, ancak gerçek bir kanıtım yok - bu nedenle bir cevaptan ziyade yorum.
Peter Taylor

evet, benimki "kaba" bir denemeydi .. Başkalarının da önerdiği gibi HTML olmayan öğeleri / başlıkları ve site haritasını inceleyeceğim
Can Poyrazoğlu

@Peter Şüphesiz, HTTP üstbilgileri (özellikle Son Değiştirilmiş üstbilgi), SE'lerin kullandığı bir metriktir. Ancak, bir makalenin "yayınlanma tarihinin" belirlenmesinde önemli bir rol oynadığından şüpheliyim - en azından Google'ın yayınlanma tarihi olarak gösterdiği gibi değil. (Diğer SE'lerde "yayınlanma tarihi" gösterilmiyor mu?) Bir makalenin yayınlanma tarihi muhtemelen belgenin son değiştirilme tarihi değildir. Dinamik sitelerdeki çoğu sayfa (wordpress yayınları için bile) geçerli tarihe / saate yakın görünüyor. IMO Last-Modified üstbilgisi öncelikle önbellekleme için kullanılır.
MrWhite

Bence site haritası ile ilgisi var ..
Can Poyrazoğlu

HTTP son değiştirilen stackoverflow.com/questions/204010/… veya bazı yarı standart HTML meta verileri: stackoverflow.com/questions/4575967/… diğer olasılıklardır, ancak Google'ın bunları gerçekten kullanıp kullanmadığından emin değilim.
Ciro Santilli 事件 12: 中心 法轮功 六四 事件

Yanıtlar:


4

yayınlama verilerinizi Google, Yahoo ve MSN gibi büyük arama motorları aracılığıyla dizine eklemek için xml site haritası veya RSS feed sürümü üzerinden geçmelisiniz. Web siteniz için XML site haritası oluşturun ve dizine yönelik web yöneticisi araçlarına gönderin.


7

Google bunun doğru olmadığını bildiğinden , sayfaların bu kadar uzun süre dizine eklendiği ve aydan aya önemli ölçüde değiştiği için, ana sayfaların tümünün 4 yıl önce güncellenmiş olarak gösterilmesiyle ilgili bir sorun yaşadım . Gerçekten şaşkın, sonra sinirlenmiş, sonra tekrar şaşkın sonra nihayet sorunu buldum. Yasal şartlarımız "Son güncelleme: 30 Ekim 2007" ile gizli bir div'de sunuluyordu ve div neredeyse tüm sayfalarımıza yükleniyordu. (Çünkü kayıt açılır) Ben kaldırdım ve şimdi tarihi ya kaybolacak ya da daha makul bir şey düzeltilecek varsayalım.

Sitenin anlambilimini teknik detaylardan veya kendi indeksleme geçmişinden daha fazla kontrol ettikleri konusunda uyarıcı bir hikaye ve bir kanıt daha.


Sayfalarınızın son değiştirilme tarihini sayfanın başka bir yerine, RSS beslemesine veya XML site haritasına ekliyor musunuz?
MrWhite

Ben değilim, çünkü site bir haber sitesi değil ve bunu vurgulamamayı tercih ederim. İdeal olarak, ana sayfam için bir tarih olmazdı. Ayrıca, muhtemelen son modeli büyük bir tuz tanesi ile aldıklarını hayal ediyorum - eğer onlar olsaydım yapardım.
mmdanziger

7

Bir yazının veya makalenin yayınlanma tarihinin <lastmod>(diğerlerinin önerdiği gibi) bir XML site haritasına veya bu konu için Son Değiştirilmiş HTTP üstbilgisine dayalı olduğundan şüpheliyim . XML Site Haritası yalnızca tavsiye niteliğindedir, yetkili değildir. Belgenin son değiştirilme tarihi muhtemelen bir makalenin (orijinal) yayınlanma tarihiyle aynı değildir. Ve sayfanın üst kısmındaki yorumumda belirttiğim gibi, bir belgenin son değiştirilme tarihi, tarama hızlarını önbelleğe almak ve belki de belirlemek için muhtemelen daha önemlidir . Dinamik olarak oluşturulan sayfaların Son Değiştirilmiş HTTP üstbilgisi genellikle gerçek tarih / saate çok yakındır (WordPress bloglarında olduğu gibi).

Bir RSS / Atom beslemesi ise bu belirli bilgi külçesini içerir. Gerçekten de, içerikte yayınlanma tarihini içermeyen Wordpress sitelerinde yayınlanma tarihi Google'ın arama sonuçlarında görünmeye devam eder. Ve anlayabildiğim kadarıyla, bu RSS Beslemesi'ndeki tarihle eşleşiyor.

EDIT # 1: Ancak, bir RSS beslemesi tüm sayfaları içermeyebilir. Çoğu durumda yalnızca en son veya en son güncellenen sayfaları içermelidir . Ancak Google'ın daha önce okuduklarını unutması için hiçbir neden yoktur ve bu sayfanın içeriğini değiştirmek, son değiştirilme tarihinden sonra değişmez.

RSS beslemesi yoksa, Google'ın sayfa içeriğini analiz edecek kadar zeki olduğunu düşünüyorum. Özellikle tarihler mikro biçimler yardımıyla 'anlamsal olarak' işaretlenirse . Google'ın aşağıdakileri içerdiği bir makale için yetkili yayınlanma tarihi olarak görmesi mükemmel bir şekilde mümkündür:

<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>

Google kesinlikle mikro biçimleri okumaktadır - hCard, hReview, vb.

Sadece eklemek için, Google'ın bunu önerecek yetkili bir şey bulamadığı sürece bir yayınlanma tarihi olacağını düşünmüyorum. Spekülatif veriler üzerinde bir 'yayınlama tarihi' çıkarmayacaktır, çünkü yanlış bir 'yayınlama tarihi' hiç kimseye fayda sağlamaz ve Google buna çok fazla sadık kalır!

Ve sadece kayıt için (@Tom aksini öneriyorsa :) Yazıların / makalelerin yayınlanma tarihinin görünür şekilde görüntülenmesi gerektiğini düşünüyorum. Birçoğu yok ve bu özellikle teknoloji konularını araştırırken okuyucu için sinir bozucu olabilir ve makalenin yarısını okuduktan sonra güncel olmadığını görüyorsunuz!

EDIT # 2: O zamandan beri , @mmdanziger'in cevabında detay verdiği benzer bir sıkıntı yaşadım. Eski sitelerimden birinde, her sayfanın üst kısmında ( JavaScript ile sayfaya yazılmıştır!) "Site Son Güncelleme Paz 17 Haziran 2012" (herhangi bir özel şekilde işaretlenmemiş) biçiminde metin var . Bu aynı tarih Google tarafından yakalandı ve şimdi SERPS görünür yanında birkaç (hepsi değil) sayfaları görünür olmuştur - bu kesinlikle sayfanın yayınlanma tarihi değildir. Google, sayfayı "son güncellenen ( entestring )" (JavaScript'i işledikten sonra !!) biçiminde bir dizeye çeviriyor gibi görünüyor . Bu sitenin RSS beslemesi yok. Sitenin bir Sitemap.xml dosyası var, ancak tarihler farklı.

Diğer sitelerde de benzer davranışlar fark ettim.


Bundan doğru tarihi nasıl tanır? <div class="footer"> <div class="links"> April 24, 2011 | <a href=...Bu, yazımın yayınlanma tarihini ifade eden SADECE yer ve Google bunu buluyor ve arama sonucunda doğru bir şekilde gösteriyor
Can Poyrazoğlu

Çapada belirli bir şey var mı? Sonra tekrar, olmayabilir. Ayrıca bir RSS feed'iniz var mı (belgenin META etiketlerine bağlı)?
MrWhite

"Google tarihi nasıl belirler?" ama aynı şeyi fark ettim! Google, son değiştirilen başlık veya Sitemap.xml <lastmod> başlığı yerine sayfanın kendisinde bir dizi zaman bulmaya çalışır! Düşüncelerimi doğruladığınız için teşekkürler!
evilReiko

5

Sanırım Google, yayınlanmış tarihi tanımak için Site Haritası ve RSS özet akışını kullanıyor .. Standartlara göre bir xml site haritası oluşturarak CMS'nizde bu özelliği kullanabilirsiniz .

<lastmod>2011-08-18</lastmod>

2

Google'daki Jonh Mueller'e göre:

Hangi tarihin gösterileceğini veya birini göstermenin anlamlı olup olmadığını belirlemek için çeşitli sinyaller kullanırız; belirli bir özelliğe bağlı değildir.

John Mueller - Twitter

Ancak, Google'ın şu tarihlerde web sayfalarında tarihleri ​​aradığını görüyorum:

  • Sayfada açık görüşte, makine öğrenimini kullanma
  • Schema.org yapılandırılmış verileri, özellikle de veriler sayfada açıkça görülebiliyorsa

1

Bence akıllıca sayfada herhangi bir tarih arar ve kullandığınız ilgili tarih olduğuna emin olduğunda.

SERP tıklama yeteneği üzerinde olumsuz bir etkisi olabileceğini düşündüğüm için bazen biraz zor, sanırım yeni bir makale / gönderi ise geçici bir olumlu etki yaratabilir, ancak sitelerimin onsuz daha iyi olacağından eminim (Google arama yapanlar bu olmadan daha iyi olmayabilir!)

Google üzerinden kontrol etme seçeneği yoktur, yalnızca kendi yöntemlerinizle. Şunlardan birini yapabilirsiniz:

  • Google'ın keşfetmesini engellemek için tarihleri ​​dinamik olarak oluşturulmuş resimlerle değiştirin, ancak bu görsel hizalama / tutarlı yazı tipi görüntüleme / erişilebilirlik vb. Gibi diğer sorunlara yol açabilir.
  • Sayfalardaki tüm tarihleri ​​ayırın (bu, ilgili bilgileriniz varsa bir kaynağın yaşını keşfetmek istediklerinde ziyaretçiler / kullanıcılar için sinir bozucu olabilir).

Bu nedenlerden dolayı görmezden gelirim.


Tarihi kaldırmaya çalışmıyorum :) Yaptığım yeni bir siteye tarih özelliğini eklemeye çalışıyorum ..
Can Poyrazoğlu
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.