Bir URL'nin Google tarafından ilk kez dizine eklendiğini nasıl bulabilirim?


16

Belirli bir URL'nin Google tarafından ilk kez endekslendiğini nasıl öğrenebilirim? Bana ait olmayan rakiplerin URL'leri için bile çalışan bir çözümü tercih ederim.


1
Cevabın "hayır" olması oldukça olasıdır. Google bu bilgileri bile saklayamayabilir (neden böyle olmaları gerektiğine dair özel bir neden yoktur) ya da yapsalar bile üçüncü taraflara ifşa etmeyebilirler.
Ilmari Karonen

1
Diğerlerinin de belirttiği gibi, bu bilgiyi alamazsınız. Sunucu günlüklerine erişiminiz varsa, ilk kez ne zaman tarandığını görebilirsiniz, ancak bu bile o zaman dizine eklendiği anlamına gelmez.
John Mueller

Yanıtlar:


15

Bir URL'nin yaşını öğrenmek için www.example.com, istediğiniz URL'yi değiştirerek bu bağlantıyı takip edebilirsiniz :

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

Örneğin, Yığın Taşma Meta sitesi için Google'ın sonucu : resim açıklamasını buraya girin

Aksi takdirde, Wayback makinesi de iyi bir çözümdür, ancak deneyimimden daha az hassastır.


3
Google'ın bu özelliği İngilizce olarak da mevcut mu? Fransızca versiyona bağlandınız.
Stephen Ostermiller

1
@StephenOstermiller Sadece gelen tld değiştirmek .friçin .com.
MDMoore313

2
Cevabınız için @Zistoloen +1 ama sorgunuzda şüphe var. Söylediğiniz gibi örnek sorgunuzu kullanarak www.stackexchange.com'u aradım ama sonuç göstermiyor. Ben kaldırarak arandı wwwbugüne sonucunu gösteriyor bu zamanda da Dec 1, 2014URL yaşı olamaz çok yeni tarih olduğunu. Yanlış mı arama yapıyorum? ya da bir şey eksik?
Sathiya Kumar

2
Bu cevabı "çaldım" ve cevabımı daha iyi bir açıklama ile ekledim. Bu harika bir numara, Zistoloen.
Stephen Ostermiller

6
@Stephen & Zistoloen: Bu genellikle sayfanın Google tarafından ilk dizine eklendiği tarih değildir . Bazı testlere dayanarak, bu yöntemle gösterilen tarih sayfanın içeriğinden alınmıştır (Google, "yayınlandığı" veya "son değiştirildiği tarih" tarihine benzeyen bir şey gördüğünü düşünüyorsa veya tarih, Google'ın sayfada en son (önemli?) bir değişikliği gözlemlediği tarihe göre içerikte bulunur. Tabii ki, sayfa ilk yayınlandıktan sonra hiç değiştirilmediyse, bu yayınlanma tarihi ile aynı olabilir , ancak bunun garantisi yoktur.
Ilmari Karonen

8

Zistoloen , Google'ın sayfanın içeriğini ilk kez dizine eklediği tarihi görüntülemesinin bir yolunu buldu. Cevabımı da ekliyorum çünkü daha açık bir şekilde açıklayabileceğimi düşünüyorum.

  1. Sonuç olarak istediğiniz sayfayı getiren bir şey için Google'da arama yapın
  2. "Arama Araçları" nı kullanın
  3. "Her zaman" açılır menüsünden "Özel Aralık ..." ı seçin
  4. 1/1/1900 - 1/1/2020 gibi geniş bir tarih aralığı koyun

Google daha sonra, arama sonucundaki sayfada bulunan içeriği keşfettiği tarihi gösterir.

ilk endeksli

Sayfa yeni içerikle güncellenirse, Google bu tarihi de günceller. Bu nedenle, "bu URL'yi ilk dizine eklenmiş" tarih yerine, "bu içeriği ilk dizine eklenmiş" tarihten daha fazlasıdır.


Bir sayfanın Google önbelleği, sayfanın en son ne zaman dizine eklendiğini gösterir. Sen edebilirsiniz Stack Exchange ana sayfası görüyoruz son endeksli bugün:

resim açıklamasını buraya girin


Başka bir seçenek de İnternet Arşivinin Wayback makinesini kullanmaktır . Bu size geçmişte bir sayfanın nasıl göründüğünü gösterir. Sayfaların ilk ne zaman yayınlandığını öğrenebilirsiniz. Hem Google hem de İnternet Arşivi tarar ve sayfayı ilk yayınlandıktan kısa bir süre sonra kullanır.


1
İlk seçeneğiniz tüm URL'ler için kesin sonuç verecek mi? Açıkladığınız gibi bing.com'u aradım ama ilk endeksli tarihini alamadımbing.com . Yanılıyorsam özür dilerim?
Sathiya Kumar

1
Sayfadaki içerik değişmediği sürece doğru gibi görünüyor. Sayfa elden geçirilirse Google bu tarihi sıfırlayabilir. Bir iç sayfa 1 Şubat 2001 olarak listelenmesine rağmen ana sayfam 1 Şubat 2002 olarak listeleniyor. Ana sayfa bu süre zarfında yeniden tasarlandı, ancak iç sayfa 2001'den bu yana önemli ölçüde değişmedi.
Stephen Ostermiller

@SathiyaKumar Bing.com bu yöntemi kullanarak benim için 19 Mart 2014 tarihini veriyor . Şey o notu Do not açıkçası google tarafından dizine (robots.txt yoluyla veya başka bir şekilde) bu yolla gösterilmeyecektir.
Thebluefish

4

Orada olmayabilir olmak kesinlikle bunu yapmak için herhangi bir yol bilmiyorum - keyfi bir web sayfası ilk Google tarafından dizine zaman öğrenmek için herhangi bir yol. Google'ın bu bilgileri depolamaması mümkündür, çünkü ihtiyaç duymaları için gerçek bir neden yoktur. Ayrıca, bu bilgileri saklasalar bile, bu bilgileri üçüncü tarafların erişimine sunmak için gerçekten özel bir nedenleri yoktur.

(Bu sizin kendi sayfanızsa ve eski web sunucusu erişim günlüklerinize erişiminiz varsa, kolaydır - Googlebot'tan o sayfaya yapılan ilk ziyaret için günlüklerde arama yapmanız yeterlidir.


Her durumda, yöntem yok cevaplarında Zistoloen ve Stephen Ostermiller'ın tarif değil , belirli bir URL ilk defa Google tarafından dizine zaman genellikle tarihi ortaya koyuyor. Bunun yerine, Google’ın URL’deki içeriğin yayınlandığını veya en son güncellendiğini düşündüğü tarihi gösterir ve genellikle Google'ın tarihleri ​​sayfa içeriğinden "koklamak" için az çok güvenilir girişimlerine dayanır.

Gelen bu video , Google'ın Matt Cutts bu tarihler seçilir nasıl kısaca dokunur. Kolaylık sağlamak için, videonun ilgili parçasını (yaklaşık 2:09 ila 2:22) aşağıda yazdım:

"... genellikle çıkarım yaptığımız ya da ilk gördüğümüzde, o sayfayı her taradığımızda ya da sayfada bir yerde bulabilirsek ve o tarihi ayıklayabilirsek, tarihi görürsünüz. bunu pasajın en başında göreceğim. "

Blog yayınları, wiki sayfaları veya Yığın Değişimi soruları gibi sayfalar çalıştıran sitenin otomatik olarak sayfanın kendisinde doğru bir oluşturma / değiştirme tarihi bildirdiği durumlarda, Google tarafından bildirilen tarihin eşleşmesi muhtemeldir. Bununla birlikte, diğer sayfa türleri için Google'ın tarih sniffer'ı daha fazla çalışmak zorundadır ve her zaman doğru olmaz (bu bağlamda "doğru" ne anlama gelebilir).

Özellikle, bu tarihler, iki nedenden ötürü bir sayfanın ne kadar süre önce dizine ekleneceğini belirlemek için temel olarak işe yaramaz :

  • Bir sayfa yakın zamanda değiştirildiyse ve değişiklik tarihi sayfada belirgin bir şekilde görüntüleniyorsa, değişiklik tamamen önemsiz olsa bile Google sayfayı sayfanın "tarihi" olarak alabilir.

    Örneğin, oldukça eski olan bu wiki sayfası ( 2003'te ilk kez endekslenen archive.org ) şu anda Google tarafından sayfanın altında gösterildiği gibi en son düzenlendiği tarih olan 10 Kasım 2014'ten itibaren tarihlendirilmektedir. O tarihte meydana gelen değişiklik? Sayfanın altından tek bir bağlantıyı kaldırmanız yeterli.

  • Tersine, Google, onları World Wide Web'in yayınlanmasından önce bile olsa, sayfada bulursa çok eski "yayın tarihlerini" kabul etmekten mutluluk duyar .

    Örneğin, eski bir programlama yarışmasındaki bu sayfa Google tarafından 15 Eylül 1986'ya tarihlendirilmiştir - aslında sayfada açıklanan etkinliğin tarihi. Benzer şekilde, 1970 yılında bir öğrenci grevini belgeleyen bu sayfa Google tarafından 10 Mayıs 1970'e (sayfadaki taranan belgelerden birinin tarihi) tarihlenir ve daha saçma bir şekilde bu Linux manuel sayfası Google tarafından 4 Kasım'a tarihlenir. , 1989 (sayfada kullanılan rastgele bir örnek tarih).

    Stephen ve Zistoloen tarafından açıklanan özel tarih aralığı aramasını kullanarak, ancak aralığın üst ucunu 6 Ağustos 1991 olarak ayarlayarak bu tür birçok örnek bulabilirsiniz .


Yanıtınızda ağırlıklı olarak Stephen ve Zistoloen'ın cevaplarına karşı çıktınız, ancak OP'nin "Bir URL Google tarafından ilk kez dizine eklendiğinde nasıl bulabilirim?" Sorusuna uygun bir cevap bulamıyorum. Cevabınızda !!
Sathiya Kumar

Orada olmayabilir olmak "yapamazsın" ya da "hiç kimse bilir" diye başka bir cevap. Ama haklısın, bunu cevabımda düzenleyeyim.
Ilmari Karonen

OP'nin asıl sorusunun cevabını düzenlemek ve eklemek için @llmariKaronen +1.
Sathiya Kumar
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.