«large-files» etiketlenmiş sorular

6
cat line X büyük bir dosyada Y'ye
Diyelim ki çok büyük bir metin dosyasına sahibim (> 2GB) ve sadece catsatırlara Xgitmek istiyorum Y(örneğin 57890000 - 57890010). Anladığım kadarıyla ben boru yapabilirsiniz headiçine tailyani ya viceversa head -A /path/to/file | tail -B Veya alternatif olarak tail -C /path/to/file | head -D burada A, B, Cve Ddosya satır sayısı …
132 tail  cat  large-files  head 

14
Dizeyi büyük (70GB), tek satırlı, metin dosyasında değiştirin
Büyük bir (70GB), bir satır , metin dosyasına sahibim ve içindeki bir dizgiyi (token) değiştirmek istiyorum. Belirteci <unk>, başka bir sahte belirteçle değiştirmek istiyorum ( eldiven sorunu ). Denedim sed: sed 's/<unk>/<raw_unk>/g' < corpus.txt > corpus.txt.new ancak çıktı dosyasının corpus.txt.newsıfır baytı var! Perl kullanarak da denedim: perl -pe 's/<unk>/<raw_unk>/g' < …

9
Bir metin dosyasının içindeki yinelenen satırlar nasıl kaldırılır?
Çok büyük (en fazla 2 GiB) metin dosyası, içindeki her satırın yaklaşık 100 tam kopyasını içeriyor (benim durumumda, dosya CSV benzeri bir veri tablosu olduğu için işe yaramaz). İhtiyacım olan, orijinal sıra sırasını koruyarak (tercihen, ancak önemli bir performans artışı için feda edilebilir) tüm tekrarları kaldırmak. Sonuçta her satır benzersiz …

11
Yerinde bir dosyayı değiştirmenin bir yolu var mı?
Oldukça büyük bir dosyaya (35Gb) sahibim ve bu dosyayı yerinde filtrelemek istiyorum (yani başka bir dosya için yeterli disk alanım yok), özellikle bazı kalıpları alıp yok saymak istiyorum - bir yol var bunu başka bir dosya kullanmadan mı yapabilirsin? Diyelim ki içerdiği tüm satırları filtrelemek istiyorum foo:...


3
Büyük (8 GB) dosyaları ssh üzerinden aktarma
SCP ile denedim, ancak "Olumsuz dosya boyutu" yazıyor. >scp matlab.iso xxx@xxx:/matlab.iso matlab.iso: Negative file size Ayrıca SFTP kullanmayı denedi, 2 GB dosya aktarılana kadar iyi çalıştı, sonra durdu: sftp> put matlab.iso Uploading matlab.iso to /home/x/matlab.iso matlab.iso -298% 2021MB -16651.-8KB/s 00:5d o_upload: offset < 0 Sorunun ne olduğu hakkında bir fikrin …
27 scp  sftp  large-files 


2
Bir ext4 birimindeki bu dosyalar neden parçalanmış?
ext4Kusurları ve kötü sektörleri olmayan (manyetik) bir sabit sürücüde 900GB'lık bir bölümüm var . Boş bir lost+founddizin dışında bölüm tamamen boş . Ayrılmış dosya sistemi bloklarının sayısını% 1 olarak ayarlamam dışında bölüm varsayılan parametreler kullanılarak biçimlendirildi. ~ 900MB dosyasını xubuntu-15.04-desktop-amd64.isokullanarak bölümün bağlama noktası dizinine indirdim wget. İndirme tamamlandığında, dosyanın dört …

1
Dizin başına dosya sayısı
Ben yaklaşık 100000 küçük dosyaları (her dosya 1-3 satır, her dosya bir metin dosyası) ile bir dizin var. Boyut olarak dizin çok büyük değil (<2GB). Bu veriler profesyonel olarak yönetilen bir NFS sunucusunda yaşar. Sunucu Linux çalıştırıyor. Dosya sisteminin ext3 olduğunu düşünüyorum, ama emin değilim. Ayrıca, sunucuya kök erişimim yok. …


2
dosya sistemi oluşturmada büyük dosya özelliği
Video ve ses gibi büyük dosyaları flac biçiminde olan bir bölüm için bir dosya sistemi oluştururken -T büyük dosya bayrağı kullanmak yararlı mıdır ? Aynı bölümü bu bayrakla ve onsuz test ettim ve tune2fs -l [bölüm] kullanarak , her ikisinde de "büyük_dosya" etkinleştirilmiş olan "Dosya sistemi özellikleri" ni kontrol ettim. …


2
Büyük tek satırlı dosyada temel sed komutu: belleği yeniden ayıramadı
250 MB'lık bir metin dosyam var, hepsi tek satırda. Bu dosyada akarakterleri bkarakterlerle değiştirmek istiyorum : sed -e "s/a/b/g" < one-line-250-mb.txt Başarısız: sed: couldn't re-allocate memory Bana öyle geliyor ki, bu tür bir görev çok fazla bellek ayırmadan satır içinde gerçekleştirilebiliyor. İş için daha iyi bir araç veya daha iyi …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.