Arama motorları PDF'leri tarıyor mu ve öyleyse bunları oluştururken uyulması gereken herhangi bir kural var mı?


22

Üzerinde çalıştığım web sitesinde birkaç yüz PDF var. Hiçbirinin bir aramada geri döndüğünü hiç görmemiştim ama doğrudan siteden bağlantısı var. Ayrıca, ürün belgeleri olduğundan, anahtar kelimelerle doludur.

Google’ın veya diğer arama motorlarının taramasını sağlamak için yapmamız gereken özel bir şey var mı?

PDF’lerin Google’ı daha çok sevmesine yardımcı olması için zor ve hızlı kurallar var mı? Örneğin, Adobe'nin oluşturma sırasında oluşturduğu bozuk PDF etiketlerini temizlemek için bunları ghostscript üzerinden çalıştırmalı mıyım?


Onların farkında olduklarından emin olmak için xml site haritanıza ekleyin.
artlung

Yanıtlar:


17

Google kesinlikle PDF dosyalarını endeksler ve filetype:pdfarama sorgunuza ekleyerek sadece PDF dosyalarını arayabilirsiniz ( örneğin ).

Kolayca endekslenebilmesi için PDF'yi optimize etmek için yapılacak temel şeyleri söyleyebilirim:

  • Anlamlı bir dosya adı verin
  • Tüm belge meta verileri özelliklerini tamamlayın (başlık, yazar, anahtar kelimeler vb.)
  • PDF'nizin gerçek metinlerden oluştuğundan ve taranmış resimlerden olmadığından emin olun
  • Bir HTML belgesinde olduğu gibi başlıkların doğru kullanımı ile iyi içeriğinizin olduğundan emin olun

Daha fazla ipucu için PDF Belgelerini Optimize Etme ve Arama Motorlarında PDF'leri Optimize Etme Hakkında On Bir İpuçları



@Christofian Teşekkürler - Bağlantıyı güncelledim. Herhangi bir 301 yönlendirmesi olmadan bağlantılarını yeniden adlandıran bir SEO şirketinin ironisini takdir etmek için okuyucuya bırakacağım!
Dan Diplo,

@DanDiplo, PDF dosyalarının SEO'su konusunda uygulanabilir olduğunda içeriğe bir bağlantı eklemenizi öneririm.
Anagio

1

Diğer arama motorları hakkında emin değilim, ancak Google’a gelince, ana kural onları robots.txt ile dışlamak değil.

Bu onların PDF aramasını desteklediğinin ilk duyurusuydu.


1

Tıpkı bir web sitesine uyumlu hale getirmek gibi, SEO'nuza zarar veremez, PDF'inizi erişilebilir hale getiremezsiniz. Adobe'nin yerleşik erişilebilirlik denetleyicisi mükemmel olmaktan uzak, ancak en azından bu alanları düzeltmek sizi işe başlatacak.

Muhtemelen her 4 ya da 5'e 5 dakika harcıyorum, çoğunlukla da çevrimiçi yaptığımız metin PDF. Sayfa sayısına ve bu sayfaların ne kadar karmaşık olduğuna bağlı olarak zaman eşit şekilde artar.

Düzenlemenizi yapmak için Adobe Acrobat Pro'nuz olduğunu varsayalım:

  • Erişilebilirlik Tam Denetimi'ni çalıştırın. (Hızlı kontrol benim için oldukça anlamsız)
  • Belge özelliklerinde meta bilgileri güncelleyin (anahtar kelimeler, konu, dil vb.)
  • Etiketlerin eklendiğinden emin olun
  • Metnin metin, resim, görüntü ve arka plan öğesi olarak etiketlendiğinden emin olun.
  • İşe yaramaz kabartmayı (dekorasyon veya tasarım gibi) arka plan olarak etiketleyin
  • Resimlere iyi metin ekleyin
  • Okuma sırasına göre metnin doğru sıralandığından emin olun.
  • İçerik araç çubuğunda, metnin kopyalanmadığından veya aşırı yanlış tercüme edilmediğinden emin olun.
  • Taranan sayfalarda OCR tarayıcıyı kullanın

Tablolar ve gerçekten garip Adobe hataları için daha gelişmiş düzenleme için, CommonLook adında bir eklenti kullanıyoruz. CommonLook işi halleder, ancak neredeyse Adobe araçlarından nefret ettiğim kadar nefret ediyorum.

Rötuş Okuma Sırası aracı, Etiketler araç çubuğu, Okuma Sırası araç çubuğu ve İçerik araç çubuğunu öğrenin. İşim web'e çıkmadan önce tam uyumlu belgeler gerektiriyor, ancak herkes bazı basit etiketleme ve belge özelliklerinden faydalanabilir.


Sitemizde geri dönüp tam 508 uyum sağlamak zorunda olduğumuz 5.000'in üzerinde PDF vardı. Öğrenmesi biraz zaman aldı, Adobe'nin antrenörünün herhangi bir yardımı olmadığını önerdi, ancak bir kez öğrendiğinizde onları gerçekten sıkıştırabilirsiniz.
MrChrister
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.