«text-processing» etiketlenmiş sorular

Metnin programlar, komut dosyaları vb. Tarafından işlenmesi veya incelenmesi


2
Metin dosyaları çıkarmak için unix aracı?
Büyük bir tablo şeklinde noktalı virgülle ayrılmış metin alanlarından oluşan büyük bir dosya var. Sıralandı. Aynı metin alanlarından oluşan daha küçük bir dosyam var. Bir noktada, birisi bu dosyayı başkalarıyla birleştirdi ve daha sonra yukarıda açıklanan büyük dosyayı oluşturmak için bir sıralama yaptı. Küçük dosyanın satırlarını büyük olandan çıkarmak istiyorum …


8
Yeni dosya içeren dizeyi büyük dosyada değiştir
Herkes arama / dizeleri biraz bellek tasarruflu bir şekilde "ikili" için satır tabanlı olmayan bir araç biliyor mu? Bu soruya da bakın . Ben bunun gibi görünüyor benzer işlemek istiyorum bir + 2GB metin dosyası var: sed -e 's/>\n/>/g' Bu, a'dan sonra meydana gelen >ancak başka bir yerde olmayan tüm …

4
farklı dosyaların iki sütununu karşılaştırın ve eşleşiyorsa yazdırın
Solaris 10 kullanıyorum ve bu yüzden -f'yi içeren grep seçenekleri çalışmıyor. İki boru ile ayrılmış dosyam var: file1: abc|123|BNY|apple| cab|234|cyx|orange| def|kumar|pki|bird| dosya 2: abc|123| kumar|pki| cab|234 File1'in ilk iki sütununu file1 ile eşleştirmek istiyorsanız (ilk iki sütundaki file1'in tüm içeriğinde arama yapın) eşleşen file1 satırını yazdırırlar. Sonra dosya 2'nin ikinci …

2
İki desen arasında (ve dahil) çizgiler yazdırın
Hattın CKsonunda olan hatlardan açgözlülükle başlamak ve hat sonunda olduğunda açgözlülüğü durdurmak istiyorum D. Denedim grep "$CK" "$D" file..txtama işe yaramadı. Giriş: kkkkkkkkkkk jjjjjjjjjjjjjjjjjj gggggggggggg/CK JHGHHHHHHHH HJKHKKLKLLL JNBHBHJKJJLKKL JLKKKLLKJLKJ/D GGGGGGGGGGGGGG GGGGGGGGGGGGGG İstenen çıktı: gggggggggggg/CK JHGHHHHHHHH HJKHKKLKLLL JNBHBHJKJJLKKL JLKKKLLKJLKJ/D


1
Büyük bir çoklu GB metin dosyasındaki yinelenen satırlar nasıl kaldırılır?
Sorum bu soruya benzer, ancak birkaç farklı kısıtlamayla: Büyük bir \nayrılmış kelime listem var - her satıra bir kelime. Dosya boyutu 2 GB ile 10 GB arasında değişir. Yinelenen satırları kaldırmam gerekiyor. İşlem, kopyaların kaldırılması sırasında listeyi sıralayabilir, ancak gerekli değildir. Bölümde, yeni benzersiz sözcük listesini çıktı almak için yeterli …


4
Bir komutun çıktısını halka arabelleğe kaydetme
Stdout'ta çok fazla çıktı üreten uzun süren bir komutum var. Örneğin, yalnızca son üç günü veya son gibibiti (ortadaki kesme çizgilerinden kaçınarak) ve mümkünse 20 MiB'den büyük olmayan dosya parçalarında tutabilmek istiyorum. Her dosya yığını bir sayısal sonek veya zaman damgası ile adlandırılıyor. Gibi bir şey: my-cmd | magic-command --output-file-template=my-cmd-%t …

3
awk + print line yalnızca ilk alan Linux1 dizesiyle başlarsa
Linux1 ile ilk alanın başlaması durumunda satır nasıl yazdırılır Örneğin: echo Linux1_ver2 12542 kernel-update | awk '{if ($1 ~ Linux1 ) print $0;}' hedef satır yazdırmak, ilk alan Linux1 ile başlar çizgi örneği: Linux1-new 36352 Version:true Linux1-1625543 9847 Linux1:16254 8467563 açıklama - boşluk veya SEKME ilk dosyalamadan önce olabilir


5
Sed komutunu kullanmadan dize nasıl bulunur ve değiştirilir?
Hepimizin bildiği gibi, sedörnek bulmak 'a' için, dize bulmak ve değiştirmek için büyük ölçüde etkilidir ve 'b' için değiştirin: sed 's/a/b/g'. Bunu yerine başka komut veya kabuk komut dosyası ile yapmak mümkün mü sed? Bu, sedkomutu olmayan TV için kırpılmış bir linux sistemleri içindir . Bu yüzden bunun yerine diğer …

3
kafa ekstra karakterler yiyor
Aşağıdaki kabuk komutunun giriş akışının yalnızca tek satırlarını yazdırması bekleniyordu: echo -e "aaa\nbbb\nccc\nddd\n" | (while true; do head -n 1; head -n 1 >/dev/null; done) Ama bunun yerine sadece ilk satırı yazdırır: aaa. Aynı şey -c( --bytes) seçeneğiyle kullanıldığında gerçekleşmez : echo 12345678901234567890 | (while true; do head -c 5; …

5
Çok sayıda dosyayı birleştirme
± 10.000 dosyam ( res.1- res.10000) hepsi bir sütun ve eşit sayıda satırdan oluşuyor. İstediğim, özünde basit; tüm dosyaları yeni bir dosyada sütun olarak birleştirin final.res. Kullanmayı denedim: paste res.* Bu sonuç, dosyaların bir kısmı için daha çalışmak görünse de bütün sette gerçekleştirilen Ancak (bu aşağıdaki hata veriyor: Too many …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.