Bir Word belgesini LaTeX'e dönüştürmek için bir makro yazıyorum.
Bir şey hariç, her şey yolunda gider: Belge, işlevsel bir işaretleme elde etmek için karakter stillerini kullanarak, stil şablonlarını yoğun şekilde kullanır. Örneğin, metinde görünen tüm yazar adları "Yazar adı" karakter stilini kullanır. Tüm İngilizce olmayan kelimeler veya (ve bu zor olduğu yerde) ifadeler kendilerine uygulanan "Yabancı kelime" tarzı vardır.
"Yabancı kelime" tarzı örneğini ele alalım. LaTeX'e dönüştürmek için yapmanız gereken, kendilerine "Yabancı kelime" stili uygulanmış tüm karakterleri mümkün olduğunca hızlı bir şekilde araştıran, bu dizeyi alıp \ emph {\ içine sarılmış bir arama oluşturmak. 1} (eşleşen dizenin konumunu gösteren \ 1).
Microsoft'un çok mütevazı açıklamasını kullanarakJoker karakterin sözdiziminden "*" (tırnak işaretlerini siler) terimi ve uygulanmış bir "Yabancı kelime" stili için bir arama yapması beklenir, ama yapmaz. Yeterince açgözlü değil, sadece bireysel karakterleri bulmak. Aramaya sınırlayıcıları dahil ederek joker karakter aramalarını daha açgözlü hale getirebilirim --- "[] * []" kelimelerin tümünü bulur ---, ancak bu şu anki durumda başarısız olur, çünkü örneğin, "gibi bir terim" ad-hoc 'dan önce gelip sonra boşluk bırakılabilir, alanın kendisi kendisine uygulanan "Yabancı kelime" stiline sahip olmayacak ve bu nedenle arama dışında bırakılmayacaktır (potansiyel dize sınırlarının bir bolluğu olduğu gerçeği hariç): - yabancı cümle kelimesinden önce gelebilir ve ardından altı potansiyel tırnak işareti karakterinden biri olan iki nokta üst üste, noktalı virgül, boşluk,
Bu yüzden, esasen, kendisine uygulanan belirli bir stile sahip olabilecek en uzun kesintisiz dizeyle eşleşen Word için bir joker karakter arama ifadesi arıyorum.
OP'nin açıklamasını eklemek için barlop tarafından düzenlenmiştir.
Örnek olarak, alıntı yaptığım bu metni aşağıda bulabilirsiniz.
" Seigneuries dışında, aynı zamanda daha yüksek asil kavgalar da vardı, ancak günümüzde Québec'te seigneurial sisteme kadar geri izlenebilecek tek asalet unvanı , Le Moyne ailesinde ' Baron de Longueuil ' unvanı. "
Yukarıda alıntılanan metne bakın. Tüm italik kelimeler, kendilerine uygulanan "Yabancı kelime" tarzına sahiptir. "Baron de Longueil" söz konusu olduğunda, "Baron", "de" ve "Longueil" arasındaki boşlukları içerir. Bu üç italik terimin her birini sırasıyla bir dize olarak yakalayacak bir arama arıyorum.
Sonuç, "\ emph {seigneuries} 'ın dışında, bugünlerde Québec'te \ emph {seigneurial}' in başlığına geri dönebilen tek asalet unvanı olmasına rağmen, daha yüksek asalet ödülleri verildi. \ emph {Baron de Longueuil} ', Le Moyne ailesinde