Javascript hile mi? Scribd metni kopyalayıp yapıştırmayı nasıl zorlaştırıyor?

19

Son zamanlarda, scribd'nin kullanıcıların (ücretsiz kullanıcılar) sitelerinde barındırılan bir belgeye göz atmasını çok zorlaştırdığını gördüm. Bir dokümanın içinde arama yapabilir, aynı şeyi indirebilirsin.

Javascript kullanarak, talep üzerine sayfaları tarayıcıya yüklerler ve böylece tarayıcının "farklı kaydet" özelliği fazla yardımcı olmaz.

Şaşkınlığım için, metin kopyalarını panoya saçmalık bile kopyalayıp yapıştırarak gördüm! Neyin yanlış olduğunu kontrol etmek için tarayıcıda javascript'i kapattım ve aynı belgeyi tekrar yükledim. Voila, anlamsız gördüm. Ve böylece, scribd'deki javascript bir şekilde anlamsız metni çözüyor ve ardından tarayıcıda gösteriyor.

Şimdi sorum, JavaScript etkinleştirildikten ve metin tarayıcıda düzgün bir şekilde oluşturulduktan sonra bile, gidip seçtiğim metne karşılık gelen DOM nesnelerine bakarsam, yine de anlamsız metni görüyorum.

Şimdi, kafam karıştı. Metin kullanıcı için iyi görüntülenir, ancak DOM nesneleri hala anlamsızdır. Yani soru, DOM nesnelerinde anlamsızlığı koruyabilmek ve kod çözülmüş metni hala oluşturabilmek için site ne tür bir javascript kanca / kodu kullanıyor?

Çözülmüş metne erişebilmemin bir yolu var mı? Amacım kodu çözmek için algoritmayı tersine mühendislik yapmak değil, kodu çözülen metnin nerede saklandığını bulmak mı?

Örnek belge:

http://www.scribd.com/doc/143886351/OCP-Upgrade-to-Oracle-Database-12c-Student-Guide-vol-1-Exam-1Z0-060

Javascript'i açıp kapattığınızda ne olacağını görün!

javascript

— user2497064
kaynak

Bu biraz basit. Bir javascript pdf görüntüleyici oluşturdular. Mozilla, Firefox ile bir şeyler yaptı. PDF görüntüleyiciniz aslında içeriği görüntülemek için kullanılmadığından, görüntüleme deneyiminin neredeyse her yönünü kontrol edebilirler.

— Ramhound

15

Bak font-familyiçin span. Özel bir yazı tipi kullanırlar (bu durumda ff6).

Daha fazla PDF belgesinin doğru görüntülenmesi için bunu yapmaları gerekir. PDF belgelerinde olduğu gibi, belgedeki metnin standart bir karakter seti kullanması gerekmez. Yalnızca gömülü fonttaki gliflerle eşleşen bir koda sahip bir kod kullanmanız gerekir.

— Dan D.
kaynak

10

Görüntülenen metne "anlamsızlık" ya karşı bakarsanız, bazı harflerin aynı olduğunu, bazı harflerin ise ikame olduğunu görebilirsiniz. Örneğin, "Mltmrprfsm Jblbemr", "Enterprise Manager" dır. Yeterli metin verildiğinde, hızlı bir çeviri tablosu oluşturabilmeniz gerekir. Zaten, M'nin E , L -> N , T , R ve P'ye çevirdiğini biliyoruz , F -> R , vb. Biraz zaman, dedektiflik çalışması ve mütevazı programlama becerileri göz önüne alındığında, belgenin tamamı çevrilebilir.

Tabii ki, bir sonraki belgenin Dan D.'nin bahsettiğiff6 yazı tipini kullanacağına dair bir garanti yoktur , bu nedenle metni daha sonra kullanmak üzere kaydetmek istiyorsanız, yerel kullanım için bu yazı tipini yakalamak bir sonraki adımınız olmalıdır.

— MattDMo
kaynak

0

Tarayıcının kırpma aracını kullanarak bir ekran görüntüsü yakalamayı deneyebilir ve ardından metne dönüştürmek için hazır bulunan çevrimiçi ocr sitelerinden herhangi birini kullanabilirsiniz. Bu seni halletmeli.

— guy841185
kaynak