Metin dosyasını satır sayısına göre bölme komutu


16

Durum:

Yaklaşık 1,5 GB 4000000satırları içeren bir metin dosyası var .

Bunu almak istiyorum Libreoffice calcve u bildiğiniz gibi çok sayıda satır ile bu büyük dosyayı alamazsınız (maksimum 65000 satır olduğunu düşünüyorum).

Neyse ne ihtiyacım her dosya <65000 satırındaki satır sayısı ile daha küçük dosyalara bu dosyayı bölmek basit bir komuttur.


@hakermania: bitti.
Tarun

Yanıtlar:


19

splitKomutu kullanabilirsiniz :

split -l N /path-to-file

Burada N , bir dosyada bulunabilecek maksimum satır sayısıdır.

Bu komut, dosyayı her biri N satırlı daha küçük dosyalara böler .

man splitDaha fazla bilgi için kullanın .


3

Bölme kullanırsanız ve birden çok dosya oluşturursanız, bir sonraki sorununuz Calc'in tüm bu dosyalardaki tüm verileri işlemek için nasıl kullanılacağı olacaktır. Ve bu bir problemi diğerine yığmaktır. 65000 satır ile bu 62 (!) Sayfa olacaktır.

Sadece yanlış aracı kullanıyorsunuz. Verileri içe aktarmak için Libreoffice Base veya MySQL kullanın ve ardından bu veriler üzerinde hesaplama ve / veya manipülasyon yapmak için Libreoffice Calc kullanın.

Sınırlarla ilgili olarak bu, kullandığınız Libreofficevionion'a bağlıdır:

  • 3.3.3 öncesi: sınır 65536 satır
  • 3.3.3 ve üstü: 1.048576 satır (1M)

İsterseniz 4 sayfa ile 3.3.3+ ile 4m kayıtları yapabilirsiniz, ancak LibreOffice'in Temel modülü, yeterli değilse, neredeyse hiç satır sınırı olmadan içe aktarabilir. İşte bunun nasıl yapılacağı hakkında bir giriş ve burada içe aktarma dosyası ile örnek bir veritabanı . Base'deki verilerin işlenmesi kolay ve hızlıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.