Birçok tarayıcı bir sayfayı bir PDF dosyasına tarayabilir.
Bu yapıldığında, PDF dosyası gerçekten sadece tek bir görüntü içeren bir kapsayıcı mıdır? Bu görüntü genellikle JPG görüntüsü, PDF görüntüsü veya özel bir biçim midir?
Birçok tarayıcı bir sayfayı bir PDF dosyasına tarayabilir.
Bu yapıldığında, PDF dosyası gerçekten sadece tek bir görüntü içeren bir kapsayıcı mıdır? Bu görüntü genellikle JPG görüntüsü, PDF görüntüsü veya özel bir biçim midir?
Yanıtlar:
Bu bağlantıya göre , hayır - PDF görüntüyü parçalara ayırır ve yeniden oluşturur - bazen JPEG veya JPEG2000 kodlamasını kullanarak.
Bir PDF dosyası genellikle bir görüntüyü görüntünün ham ikili verilerini içeren ayrı bir nesne (XObject) olarak depolar.
Bunun genellikle bir Tif veya Jpg veya Png görüntüsü anlamında bir resim olmadığını anlamak önemlidir - pikseller için ikili veri, resim için kullanılan renk aralığı, Resim hakkında bilgidir. PDF oluşturulduğunda resim parçalanır ve farklı PDF oluşturma araçları aynı resmi çok farklı şekillerde saklayabilir.
Bazen ham görüntü verileri sayfa için gereken boyuta ayarlanır ve bazen değildir - bu durumda çizildiğinde yukarı veya aşağı ölçeklenir - farklı PDF oluşturma araçları PDF dosyalarını çok farklı şekillerde oluşturur.
Gerçek piksel verileri sıkıştırılabilir ve sıkıştırma formatlarından biri (DCTDecode) bir JPEG'dekiyle aynıdır (JPX, Jpeg2000 ile aynıdır). Bu verileri kaydederseniz, bir JPEG dosyası olarak açılabilir, ancak renk alanı verilerini içermesi gerekebilir.
Bu görüntü daha sonra PDF içerik akışında çizilir ... Göze görüntü gibi görünen bazı şeyler de birden fazla görüntüden oluşabilir, hatta görüntülerden bile olmayabilir!
Bütün bunlar, bir PDF'den görüntü çıkarmak istediğinizde, görüntüyü tüm ham verilerden bir araya getirmeniz gerektiği anlamına gelir - tam bir görüntü dosyası olarak kaydedilmez, sadece kopyalayabilirsiniz.