Google önbelleğinden binlerce URL nasıl kaldırılır?


13

Google, web sitemden herkese açık olmaması gereken 1000 PDF önbelleğe aldı. Başlıklarımı güncelledim, ancak mevcut Hızlı Görünüm önbelleğini kaldırmam gerekiyor.

Google web yöneticisi aracı bunları tek tek kaldırmamı sağlıyor - ancak kaldırılacak dosya sayısı göz önüne alındığında bu açıkça pratik değil.

Herkes Google önbellekten PDF'leri toplu olarak nasıl kaldırabileceğimi biliyor mu? İdeal olarak "site: sitem.com * .pdf" ile eşleşen her şeyi kaldırmak için bir yol istiyorum


3
Hızlı google arama, google API kullanarak toplu kaldırmanın mümkün olmadığını gösterir, bağlantıları tek tek kaldıran kendi komut dosyanızı birlikte kaldırmanız gerekir

Yanıtlar:



2

Son zamanlarda siteme birkaç bin sahte sayfa ekleyen bir kesmek vardı.

Google Arama Konsolu'na (önceden Web Yöneticisi Araçları olarak adlandırılıyordu) düzeltilmiş bir site haritası gönderdim ve tüm bağlantıları 410'a çevirdim, ancak Google'ın çoğu hâlâ dizine eklenmişti.

Kullandığım Web Yöneticisi Araçları'nı - Toplu URL kaldırma Chrome Eklentisini otomatik kaldırılması için URL'ler göndermek için. Temel olarak URL'lerin listesini alan ve bunları sizin için birer birer gönderen bir komut dosyasıdır. Hepsini göndermek saatler alacaktır, ama en azından bunu kendiniz yapmak zorunda kalmayacaksınız. İşte nasıl kullanılacağı hakkında bir makale .

Verileri doğrudan Search Console'dan indirerek Google'ın dizine eklediği URL'lerin bir listesini alabilirsiniz. Durum> Dizin Kapsamı'na gidin ve geçerli sonuçları seçin, ardından aşağı kaydırın. Google'ın site haritanızda olmayan bir ton URL'yi dizine eklediğini göreceksiniz. İlk 1000 sonucu indirebilirsiniz. Görünüşe göre sadece ilk bin değil, hepsini almanın dolambaçlı bir yolu var, ancak excel'den API çağrılarını içeriyor. Her bin kişi arasında birkaç gün bekledim, çünkü yavaş yavaş endeksten düştüler.

Google Dizin Kapsamı Anlık Görüntüsü

Başka bir yol, bir WP eklentisinin bir site haritası oluşturması, ardından PDF'leri veya hedeflediğiniz her şeyi filtrelemesidir. Muhtemelen burada biraz manuel kopyalama / yapıştırma / silme yapmanız gerekecektir. Güvende olmak için, yaklaşık 2.700 spam URL listemde yavaşça ilerledim ve geçerli URL'leri sildim. Sadece 20 dakika sürdü.

Spam gibi bir şeyi kalıcı olarak tıklatmaya çalışmıyorsanız ve bunun yerine premium kaynakları gizlemeye çalışıyorsanız, robot kaynağı gibi bu kaynakların endekslenmesini önlemek için başka yöntemler kullanmalısınız. Ancak, Google'ın dinlemediği veya topu düşürdüğünüz ortaya çıkarsa, en azından şimdi sorunu düzeltebilir ve yalnızca birkaç gün içinde dizinden kaldırmasını sağlayabilirsiniz.

Özel durumumda, Google'ın neden bir zaman makinesi düğmesine sahip olmadığını, geri almayı veya sıfırlamadığını merak ediyorum. Fikir şu ki, Google'a sitenin birkaç gün önce saldırıya uğradığını söyleyebilirim, ancak siteyi onardık, bu nedenle tarama ve dizine ekleme işleminin son x gününü geri aldık. Ama bu çok kolay olurdu.


1

Eğer dosyalar "halka açık olmamalı" ise, halka açık internette olmalıdır. Dosyaları Google listelerinden kaldırabilirsiniz (robots.txt ve diğer yöntemler aracılığıyla), ancak dosyalar hala oradaysa herkes bunları indirebilir.

Onları bir tür kimlik doğrulamasının arkasında tutmalısınız. Örneğin, dosyaları genel web dizininin dışına taşıyın ve önce kullanıcının geçerli olup olmadığını kontrol eden bir komut dosyasından sunun.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.