Bu sorunun cevabını şu şekilde araştırdım: sahip olduğum örnek olduğu için Google'ı kullanma, Google'ın oluşturma tarihlerini ve değiştirilme tarihlerini ve Google'ın tanıdığı tarih biçimlerini nasıl aldığı. Lütfen bu bilgilerin sadece birkaç sayfada bulunmadığını ve bazılarının doğrudan uygulanmadığı ve bir araya getirmediği birçok kaynaktan gelen verileri ortaya çıkarmak zorunda olduğumu anlayın. Bazı durumlarda, bilgi çeşitli kaynaklardan elde edilir ve her zaman alıntı yapılamaz.
Google sayfa tarihlerini bu sırayla arar; URL, başlık etiketi, gövde (içerik), meta etiketler, HTTP yanıt başlığı en azından Google arama cihazı söz konusu olduğunda. Diğer belgelerdeki diğer paragraflarda herhangi bir emir belgelenmemiştir, ancak liste tartışılmış ve listeyi onaylamış görünmektedir. Bunu düşünürseniz, bu bir arama motorunun alacağı sırayı yansıtır; bir - sayfanızı (bağlantı) keşfedin ve iki - meta etiketi (küçük ayrıntı) ve HTTP yanıt başlığı dışında sayfanızı yukarıdan aşağıya (başlık, gövde ve meta etiket) okuyun. Cihaz ile ilgili liste şu şekildedir:https://developers.google.com/search-appliance/documentation/68/admin_crawl/Preparing#docdaterule
Not: Başlangıç tarihi, sayfanın Google tarafından ilk istendiği tarihtir. Bir oluşturma tarihi bulunmadığında, başlangıç tarihi kullanılır.
1] Herhangi bir arama motoru bir HTTP GET isteği aracılığıyla bir kaynak isteyebilir ve web sunucusu, veri başlığındaki kaynakla birlikte yanıt başlığında son değiştirilme tarihini döndürür.
2] Herhangi bir arama motoru, bir HTTP HEAD isteği yoluyla bir kaynağın başlık bilgisini isteyebilir ve web sunucusu, veri paketi içinde kaynak olmadan yanıt başlığında değiştirilen tarihi döndürür.
3] Herhangi bir arama motoru, bir kaynağın belirli bir tarihten bu yana değiştirilip değiştirilmediğini, bir tarih ayarlanmışsa if HTTP-GET ile bir kaynak isteyerek isteyebilir. Kaynak ayarlanan tarihten bu yana değiştirildiyse, web sunucusu 200 Ok yanıtıyla yanıt verir ve kaynağı döndürür veya kaynak ayarlanan tarihten bu yana değiştirilmemişse, web sunucusu kaynağı döndürmeden 304 Değiştirilmedi ile yanıt verir .
Google, bant genişliğinden tasarruf etmek için 3. yöntemi kullanarak birçok istekte bulunur. Bunları web sunucusu günlük dosyalarınızda göreceksiniz.
Not: Bir içerik yönetim sisteminin (CMS) veya başka bir yazılımın bir yanıt üstbilgisinde uygun tarih verememesi mümkündür.
Bu tarih örnekleri Google cihazının dokümanlarından da gelir, ancak genel arama ile ilgili başka yerlerde de bulunur. Bu ayrıntıları cihaz belgelerinden aldım, çünkü kesilebilir ve başka yerlerde düzgün olmadığı bir liste olarak yapıştırılabilir.
4] Google, URL içinde bir tarih arar. Aşağıdaki biçimleri arar; YYYMMDDHH - YYYY - YYYYMM.
5] Google, başlık etiketinde bir tarih arar. Aşağıdaki biçimleri arar; YYYMMDDHH - YYYY - YYYYMM diğer biçimlerin tanınabileceğinden şüpheleniyorum. Aşağıya bakınız.
6] Google, gövde etiketi (içerik) içinde bir tarih arar. Aşağıdaki biçimleri arar; YYYMMDDHH - YYYYMMDD - YYYYMM - YYYY - DDMMYYYY - YYMMMDD - MMDDYYYY - YYMMDD - DDMMYY - MMDDYY diğer biçimlerin tanınabileceğinden şüpheleniyorum. Aşağıya bakınız.
Not: Google'ın özellikle ilk H1
etiketin hemen altındaki bir tarihi aradığı bilinmektedir . Bunun nedeni blogların genellikle bu konuma tarihler koymasıdır.
7] Google, bunun gibi bir meta etiket arar. <meta http-equiv="last-modified" content="YYYY-MM-DD@hh:mm:ss TMZ" />
Google'ın ayrıca aşağıdaki tarih biçimlerini tanıdığı söylenir.
YYYY-MD - YYYY.MD - YYYY / A / G - MD-YYYY - MDYYYY - A / G / YYYY - YY-AA-GG - YY.MM.DD - YY / AA / GG - WK, D MON, YR - WK, MON D, YR - D MON, YR - MON YYYY - MON D, YR - MON YY - YYYY-DM - YYYY.DM - YYYY / D / M - DM-YYYY - DMYYYY - D / M / YYYY - GG-AA-YY - AA-GG-YY - GG / AA / YY - AA / GG / YY - YYYYMMDDHH - YYYYMMDD - YYYYMM - YYYY - DDMMYYYY - MMDDYYYY - YYMMYD - GGMMYY - AAGGY
Bulduğum araştırma zaman sorununa cevap vermedi.
Atıfta bulunulan örnekler söz konusu olduğunda, sayfalar, yok sayılabilecek bir yayılma etiketi dahilinde tarih ipuçları vermez. SE yazılımı / web sunucusunun herhangi bir yanıt başlığında oluşturma ve değiştirilme tarihlerini döndürmesi mümkün değildir.
Google'ın bu tarihleri neden ve nasıl elde ettiği, asla çözülemeyecek iyi bir sorudur. Ancak aramaya devam edeceğim.