Google'ın PDF belgelerimi dizine eklemesini nasıl sağlayabilirim?


14

Google'ın sitemizdeki PDF dosyalarını dizine eklemesinde sorun yaşıyoruz. Yaklaşık 50 PDF vardır ve 20 KB için iki meg altında küçük bir aralık vardır. Korunmuyorlar, anonim olarak okunabiliyorlar ve PDF Reader'ın içinde belgeyi arayabilirsiniz.

SiteMap.xml dosyasında listelenmiştir. Hatta IIS günlüklerine bakabilir ve Googlebot'un PDF dosyalarını okuduğunu görebilirim, ancak beşi hariç, arama sonuçlarına asla dahil edilmezler.

Filetye: pdf yaparsam, sadece beş PDF ortaya çıktı. Bir PDF'nin içinde olduğunu bildiğim metni ararsam, PDF'ler hiçbir zaman görünmez (dizine eklenen beş tanesi hariç).

45'in üzerinde PDF belgesinin neden site haritasında yer almasına ve Googlebot tarafından okunmasına rağmen dizine eklenmediğine dair bir fikri olan var mı?


Google için içerik türünü mü belirtiyorsunuz?
Chris Ballance

Yanıtlar:


4

tüm pdf'ler aynı yerde mi? Bir keresinde benim pdf-konumlardan biri robots.txt tarafından hariç tutulan bir klasör içinde sorun vardı. Site haritanızı doğrudan google-webmaster araç sitesine gönderin ve görünmeyen pdf'lerin mızmızlanmasıyla ilgili değerli bilgiler alabilirsiniz. benim durumumda google bana 'hey, bu 54 pdf belgesi site haritanızda ancak robots.txt kısıtlamaları nedeniyle bunları dizine ekleyemiyoruz' dedi. bu yüzden oldukça yardımcı oldu. ancak yorumcunun söylediklerine dikkat edin, bu bilgilerin görünmesi biraz zaman alabilir.

Google Web Yöneticisi Araçları: https://www.google.com/webmasters/tools


Google Web Yöneticisi Araçları'nın tüm bilgileri gerçek zamanlı olarak vermediğini ekleyeceğim. Yine de hala hayati bir kaynak.
Liam

Hayır, PDF'ler sitedeki çeşitli yerlerde bulunur. Kontrol ettim ve hiçbiri robots.txt tarafından engellenmiyor. Web Yöneticisi Araçları'nı kullanıyorum ve Site Haritaları gönderiyorum ve bunu yapmaya devam edeceğim. Geri bildiriminiz için teşekkürler. Jim

1

Başlangıçta içeriğinizi okumak ve dizinde görünmek için google arasında bir gecikme olabilir. Kısa bir süre önce bir siteyi yeniden başlattık ve lansmanda Google'a site haritaları gönderdik ve yeni sayfaların arama sonuçlarında görünmeye başlaması yaklaşık 3 hafta sürdü.

Bu PDF'leri ne kadar süre önce site haritanız aracılığıyla gönderdiniz?

(dizine eklenen beş kişi hariç)

PDF'leriniz dizine ekleniyor gibi görünüyor, ancak biraz zaman alıyor. Dizine eklenmemiş PDF'lerin oluşturulma biçiminde hiçbir fark olmadığı varsayılarak, bunun yalnızca dizinin güncellenmesi biraz zaman alıyor.

Hafif bir teğet olarak, kaydolmanızı önerdiğim kullanışlı bir araç Google Web Yöneticisi'dir - tarama hızını, sitenizle ilgili sorunları, site haritalarını ve sitenize isabet eden Googlebot'un bir gün içinde dizinini gösterir. IIS günlüklerinizde size zaman kazandırabilir.


Site haritamızı ilk göndermemizden bu yana yaklaşık dört hafta geçti. Sadece dün gece dört tane daha endekslediklerini fark ettim; belki de beklemeye devam etmem lazım :)

Siteyi yeniden başlattığınızda, yeni sayfaların arama sonuçlarında görünmeye başlaması 3 hafta sürdüyse, bu, 3 hafta boyunca aramanın sitenizde artık bulunmayan sayfalara sonuç döndürdüğü anlamına gelmedi mi? bu çok sayıda 'sayfa bulunamadı' koşuluyla sonuçlanmadı mı?

Bizim durumumuzda, yeniden başlatma yeni bir bölümün lansmanı ile birleşti, eski bağlantılar hala işlevini sürdürdü - 3 hafta yeni bölümün ortaya çıkmaya başladığı zamandı. Rastgele bekleme süresi biraz sinir bozucu olabilir!
ConroyP

0

PDF dosyalarınız OCR, metin seçilebilir ve aranabilir olacak şekilde taranıyor mu? Yoksa PDF dosyaları OCR olmadan taranıyor, bu durumda metin büyük bir görüntü olarak saklanacak mı? PDF tüm resimler ise Google'ın dizine ekleyebileceğini sanmıyorum (henüz). Yoksa Google sayfalarınızı şimdiye kadar mı buldu?


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.