Bir PDF dosyası yalnızca taranmış bir resim içeriyorsa, bu yalnızca bir PDF kabının içindeki bir JPG resmi midir?

Birçok tarayıcı bir sayfayı bir PDF dosyasına tarayabilir.

Bu yapıldığında, PDF dosyası gerçekten sadece tek bir görüntü içeren bir kapsayıcı mıdır? Bu görüntü genellikle JPG görüntüsü, PDF görüntüsü veya özel bir biçim midir?

— RockPaperLizard
kaynak

Tarayıcınızın JPEG üretmemesini umuyorum, çünkü bu taramalar için kullanabileceğiniz en kötü biçimdir, çünkü oluşturduğu eserler. Ama bu tarayıcı yazılımının bir parçası. … Doğru hatırlıyorsam, belirtilen sıkıştırmayı kullanan bir PDF görüntüsüdür. PDF'yi yorumlamaya çalıştığınızda, gerekli bilgilerin yanı sıra meta verileri de alırsınız.

— Max Wyss

@MaxWyss - JPG'nin eserler yaratmasına rağmen, JPG aslında çoğu zaman değerli bir takastır ve içeriği hala iletirken bir GIF / PNG'dan daha küçük boyutta oldukça kullanışlı belgeler oluşturabilir. Bu, sorunlara neden olabileceği için çok küçük font karakterlerine sahip bir elektronik tablo için kullanmayacağımı söyledi - dkriesel.com/en/blog/2013/…

— davidgo

Bu bağlantıya göre , hayır - PDF görüntüyü parçalara ayırır ve yeniden oluşturur - bazen JPEG veya JPEG2000 kodlamasını kullanarak.

Bir PDF dosyası genellikle bir görüntüyü görüntünün ham ikili verilerini içeren ayrı bir nesne (XObject) olarak depolar.

Bunun genellikle bir Tif veya Jpg veya Png görüntüsü anlamında bir resim olmadığını anlamak önemlidir - pikseller için ikili veri, resim için kullanılan renk aralığı, Resim hakkında bilgidir. PDF oluşturulduğunda resim parçalanır ve farklı PDF oluşturma araçları aynı resmi çok farklı şekillerde saklayabilir.

Bazen ham görüntü verileri sayfa için gereken boyuta ayarlanır ve bazen değildir - bu durumda çizildiğinde yukarı veya aşağı ölçeklenir - farklı PDF oluşturma araçları PDF dosyalarını çok farklı şekillerde oluşturur.

Gerçek piksel verileri sıkıştırılabilir ve sıkıştırma formatlarından biri (DCTDecode) bir JPEG'dekiyle aynıdır (JPX, Jpeg2000 ile aynıdır). Bu verileri kaydederseniz, bir JPEG dosyası olarak açılabilir, ancak renk alanı verilerini içermesi gerekebilir.

Bu görüntü daha sonra PDF içerik akışında çizilir ... Göze görüntü gibi görünen bazı şeyler de birden fazla görüntüden oluşabilir, hatta görüntülerden bile olmayabilir!

Bütün bunlar, bir PDF'den görüntü çıkarmak istediğinizde, görüntüyü tüm ham verilerden bir araya getirmeniz gerektiği anlamına gelir - tam bir görüntü dosyası olarak kaydedilmez, sadece kopyalayabilirsiniz.

— davidgo
kaynak

Tarayıcılar büyük olasılıkla JPEG2000 veya benzeri yerleşik bir cihaza sahip olmayacaktır. Bu yüzden düz JPEG olduğunu varsaymak nispeten güvenli. Ricoh MFP’imin yaptığı da bu.

— Daniel B,

Hangi araç jpeg2000 image sıkıştırma ile pdf dosyaları oluşturur?

— erik