Evince'de pdf belgesinin kelime sayısının alınması


22

Ubuntu'nun varsayılan pdf görüntüleyicisi Evince'de görüntülediğim bir PDF belgesinin kelime sayısını alabilmemin bir yolu var mı? Belgeleri metin dosyalarına dönüştürebiliyorum ve sözcük sayımı terminalden alabiliyorum, ancak terminali kullanmak zorunda kalmadan hızlı bir şekilde onlara ulaşmayı çok isterim. Bunu yapabilen herhangi bir eklenti var mı, ya da zaten yerleşik mi ve sadece onu özlüyorum?

PS, Evince'nin Ubuntu'daki varsayılan PDF görüntüleyicisi olduğu için izleyicimi değiştirmemeyi tercih ediyorum ve birçoğu, Evince'nin de dahil olduğu çok iyi uygulamalar olduğundan, varsayılan uygulamaları kullanarak mümkün olduğunca çok şey yapmak istiyorum.

pdf  evince 

Yanıtlar:


31

Bunu komut satırı üzerinden yapabilirsiniz:

pdftotext filename.pdf - | tr -d '.' | wc -w

Teşekkürler, ama soruda söylediğim gibi, bu tür bir komut için komut satırını kullanmak zorunda kalmamayı tercih ederim.

4
@Chris Daha sonra sistemi ("<komut yukarıda>") evince koduna entegre etmeye çalışın.
Gödel

11

Zenity ve evince gerektiren hızlı bir bash betiği hakkında nasıl . Bir argüman olmadan çağrıldığında, size bir dosya seçebilmeniz için bir iletişim kutusu verir. Bir argümanla (veya söylenen diyalog kutusundan sonra) çağrıldığında, hem dosyayı evince açıp hem de kelime sayımı olan bir diyalog kutusu açacaktır.

Başka bir deyişle, aşağıdakileri bir metin dosyasına ( evince-word-count.shya da başka bir şey) bir dosyaya kopyalayın, yolunuzda bir yere kaydedin (örn. ~/bin/), Yürütülebilir hale getirin (Nautilus'un sağ tıklaması ve özellikleri veya ile chmod +x ~/bin/evince-word-count.sh)

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

Şimdi, nautilus'taki bazı PDF'lere sağ tıklayın, "Birlikte aç ..." ı seçin ve sonra evince-word-count.sh ile açın. Şimdi, bir PDF'yi açtığınızda, hem açılışta hem de size bir kelime sayımı verir.

alt metin


Bu dosyayı /home/$USER/.local/share/nautilus/scripts/ dizinine koyabilirsiniz, bu da Nautilus (Ubuntu vanilla file mananger) içinde sağ tıklatarak kullanılabilir.
Daniel Holm

10

Olaf Leidinger'in Evince e-posta listesindeki bir yanıtı:

Belge editörleri için bu tür bir özelliğin daha uygun olduğunu düşünüyorum, çünkü düz bir izleyici olarak belge hakkında daha fazla bilgiye sahipler ve kelimeleri saymak önemsiz. Bir PDF dosyasını örnek olarak alın. Metin olarak gördüğünüz aslında bir tür vektör grafik şekli olabilir. Metin PDF dosyasında yer alsa bile, gördüğünüz kelimeler birden çok "metin (y, x) konumunda çiz" - komutlarından - örneğin, umlautlar veya satır sonu durumunda olabilir. Yani tek bir kelime birden fazla kelime olarak sayılabilir. Bu nedenle, böyle bir özelliği güvenilir şekilde uygulamanın zor olabileceğini düşünüyorum. Ne demek istediğimi görmek için pdftotext'e bir göz atın.

2
Belgeyi tanımlamak için kullanılan dosya "kaynak kod" olarak kabul edilebilir ve Evince, kodu çalıştıran makinedir. Kaynak çıktısının ne olacağını belirlemek için kaynak kod editöründen (örneğin bir metin editörü) istemek haksız (ve imkansız), bu yüzden sadece çıktıya bakalım (örn. Evince / poppler'da görüntülenen resim / metin). Evince'deki uygulama, bildiri-agnostik bir metin editöründe makalelerimi "kodladığım" ve kaynağımı "çalıştırmak" için Evince'yi (Pandoc ve pdflatex aracılığıyla) kullandığım için benim için faydalı olacaktır. Ancak sonunda, neyin başardığından emin olabiliriz. Yorumlanan kodu düşünün.
user29020

4

Bunun mümkün olduğuna inanmıyorum (teknik olarak mümkün ama hayata geçirilmedi).

Evince'nin bir belge görüntüleyici olduğunu ve kelime sayımının bir editörde daha çok ihtiyaç duyulan bir özellik olduğunu hatırlamalısınız (evet, bunun her zaman böyle olmadığını biliyorum).

Evince geliştiricileri ile iletişim kurmak ve bu özelliği uygulamada herhangi bir ilgileri olup olmadığını sormak isteyebilirsiniz.


1
Teşekkürler. Onlarla iletişim kurdum ve kesin bir cevap alana kadar soruyu açık tutacağım.

Geri döndüğünüzde, kendi sorunuza etkili bir şekilde cevap vermekten çekinmeyin :)
8128

Evince kesinlikle bir "izleyici" değildir. Belge oluşturma ve görüntüleme ve düzenleme açıkça "düzenleme" ve sonra "görüntüleme" den daha büyük bir iş akışıdır. Soruyla ilgili: Evince şu anda seçme metni kopyalamaya izin veriyor. Bu kesinlikle bir "bakış açısı" rolü değil. Evince, sonuçta elde ettiğimiz kelime sayımı bulmak için harika bir konumdadır, çünkü aslında okuduklarımızın (ya da yayıncıya gönderdiklerinin) son “işleyicisiydi”. Zaten işlenmiş kelimeleri tanımlamanın bir yolu var (bir kelimeyi çift tıklamayı deneyin!). Evince'yi "Dosya-> Özellikler" kutusuna vermesini çok isterim. Bana zaten sayfa sayısını söyler (görüntülemeye göre).
user29020
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.