Microsoft Word'de Grep?


10

Microsoft Word'de Grep?

Bir kelime belgesinden belirli bir dizeyle tüm satırları çekmek istiyorum. Unix dünyasında ... grep bunu aksatmadan yapar. Windows benim için belirgin değil.

Yanıtlar:


10

Cygwin (veya bir Linux makinesine erişim) ile

antiword file.doc | grep "my phrase"

veya

catdoc file.doc | grep "my phrase"

Benzer bir şekilde grep için orada birçok komut satırı dosya formatı dönüştürücü vardır .

Tamamen Word'de çözüm Ctrl + F (Bul) ve ardından Tümünü Bul olabilir - ancak, MS Word'ün tüm sürümlerinde Tümünü Bul düğmesi olup olmadığından emin değilim .


2
Soru başlığını görünce "Ha! Güzel olurdu, değil mi" diye düşündüm. GNU programcılarını bir daha asla hafife almamalıyım.
Phoshi

catdocHer verdiğim .doc/ .docxdosyadaki segfaults'un en son sürümü antiwordbana verdiğim belgeyi "Word Belgesi değil" diyor. Başka seçenekleri biliyor musunuz?
detly

Kullandığım bir şey yok ... docx2txtDebian depolarında bulunan hızlı arama gösterileri işe yarayabilir. Ayrıca aynı amaç için kullanılabilecek OpenOffice / LibreOffice komut satırı biçimi dönüştürme yardımcı programı (unoconv) içine bakmak istiyorum.
chronos

3

Bunun ilkel geldiğini biliyorum, ancak dosyayı .txt olarak kaydetmenizi ve ardından beğeninize göre ayırmanızı engelleyen şey.


2
Bunu yapmak için yüzlerce kişiye sahip olmak.
tchrist

1

Word bağlamında "satır" ne demektir? Sayfa biçimlendirmesine herhangi bir şey yaparsanız değişen görüntülenen satır? Paragraf? Başka bir şey?

Biçimlendirmeyi ve diğer belirgin olmayan şeyleri değiştirmek de dahil olmak üzere, Word'ün bul ve değiştir işlevleriyle bir sürü şey yapabilirsiniz, ancak hepsi çevreleyen metinde değil, sadece bul metninin kendisinde hareket edecektir.


grep yine de bu normal ifadeyi seviyor!
Phoshi

1

Ücretsiz bir açık kaynak aracı olarak geliştirdiğim CRGREP'de MS belgeleri - Word, PowerPoint, Excel - için destek var. Ayrıca veritabanı tabloları, resimler, ses, arşivler, PDF ve bunların kombinasyonları gibi diğer şeyleri aramak zor. İyi eğlenceler.



0

Yorum yapmak için yeterli temsilcisi var ama herkes (olduğu gibi) iş parçacığı kovalayan bu yararlı bulabilirsiniz böylece docx sorun vs tartışılan görebilirsiniz.

Docx dosyaları için özel bir araca ihtiyacınız yoktur. docx sıkıştırılmış XML dosyalarıdır.

XML'yi ayıklamak ve çıkarmak için aşağıdakilere dayalı bir şey deneyin

unzip -p "*.docx" word/document.xml | sed -e 's/<[^>]\{1,\}>//g; s/[^[:print:]]\{1,\}//g'

dan komut satırı fu


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.