«csv» etiketlenmiş sorular

Veri içeren dosyalar bir tabloda, genellikle virgülle (dolayısıyla Virgülle Ayrılmış Değerler) düzenlenir ve sütunları ayırır. Satırlar satır satırları ile ayrılır (ancak satır satırları satır satırlarını içerecek şekilde alıntılanabildiğinden satır satırları satır satır ayırıcıları değildir. Bu etiketi satır başına bir kaydın daha basit veya tamamen tırnaksız olarak değil, tam teşekküllü CSV verileri için kullanın (csv-simple kullanın) bu tür veriler için).



6
Başka bir dosyada bulunan satırlara bağlı olarak dosyadaki satırları kaldırma
File1.txt dosyası aşağıdaki gibi satırlar içerir: /api/purchase/<hash>/index.html Örneğin: /api/purchase/12ab09f46/index.html File2.csv dosyası aşağıdaki gibi satırlar içerir: <hash>,timestamp,ip_address Örneğin: 12ab09f46,20150812235200,22.231.113.64 a77b3ff22,20150812235959,194.66.82.11 Ben has2 değeri file1.txt de mevcut olduğu tüm satırları kaldırarak file2.csv filtre istiyorum. Bu demek oluyor ki: cat file1.txt | extract <hash> | sed '/<hash>/d' file2.csv ya da bunun gibi bir …

2
Büyük bir CSV dosyasını yeniden dizine ekleme
Bu yararlı iş parçacığında cevaplar geçti , ama benim sorunum (en azından ile sed) iyi cevap düşünemiyorum yeterince farklı görünüyor . Aşağıdaki gibi görünen satırları ile büyük bir CSV dosyası (200+ GB) var: <alphanumerical_identifier>,<number> Burada <alphanumerical_identifier>tüm dosyada benzersizdir. İlk sütunu bir dizinle değiştiren ayrı bir dosya oluşturmak istiyorum , yani …
11 files  sed  awk  csv 

3
Boşluk olmadan 'ps' komut çıktısını biçimlendirme
psBazı özellikleri ile birlikte çalışan tüm işlemlerin belirli özelliklerini almak için aşağıdaki komutu var : ps --no-headers -exo "uname,ppid,pid,etime,%cpu,%mem,args" Ayrıştırmak için CSV biçiminde biçimlendirilmesini istiyorum. Not Ayrıştırma işlemini kolaylaştırmak için argümanları sonuna koydum; ,Diğer sütunların hiçbirinde bir var olacağını düşünmüyorum - yanlışsam lütfen düzelt beni. Boşluğu nasıl kaldırabilirim?
11 csv  ps 


4
Yalnızca çift tırnak içindeki virgülleri kaldırın
Bir metin dosyasında ,(virgül) ve ayrıca "(tırnak işaretleri) kaldırmak istiyorum (yalnızca çift tırnak işaretleri virgülle ayrılmış sayılar içeriyorsa). 56,72,"12,34,54",x,y,"foo,a,b,bar" Beklenen çıkış 56,72,123454,x,y,"foo,a,b,bar" Not: Yukarıdaki satırı örnek olarak göstereceğim. Metin dosyamda yukarıdaki gibi birçok satır var ve çift tırnak işaretleri arasında yer alan virgüllerle ayrılmış sayılar değişmelidir. Yani, 56,72,"12,34,54",x,y,"foo,a,b,bar" 56,92,"12,34",x,y,"foo,a,b,bar" 56,72,"12,34,54,78,76,54,67",x,y,"foo,a,b,bar" …

5
Sınırlandırılmış bir metin dosyasını bash içinde komut bağımsız değişkenleri olarak ayrıştırma
Ben böyle bölünmüş bir metin dosyası var: field1,field2,field3 xield1,xield2,xield3 dield1,dield2,dield3 gield1,gield2,gield3 Bu sütunların her biri bir programa parametre olacak ve her satır için programın çağrılmasını istiyorum Bir döngü umuyordum, şöyle bir şey: for $i in file command $field2 -x $field3 -PN -$field1 >> output done Bash'da böyle bir şeyi başarmanın …

1
awk, dizeden beklenmedik şekilde nokta kaldırır
Bir .csvdosyaya bir sütun (2. sıra) eklemek istiyorum ve ben bu sütunun değerleri dizeleri ve alıntı olmak istiyorum; Aşağıdaki komut sütunu ekler, ancak tırnak işaretleri olmadan: awk -F"," 'BEGIN { OFS = "," } {$2="2.4.0"; print}' test.csv > output.csv Aşağıdaki yaklaşım, tırnak işaretlerini içerir, ancak bir nedenden dolayı son .(nokta) …
9 awk  csv 

1
N. Sütunu mth sütunu içeren satırlar nasıl edinilir
Ben böyle bir etki alanları ve webmails içeren bir CSV dosyası var: site1.com,mail.site1.com site2.com,testmail.com site3.com,mx.site3.com site4.com,smtp.site4.com site5.com,foomail.com site6.com,barmail.com site7.com,webmail.site7.com site8.com,01mx.site8.com site9.com,foobarmail.com site10.com,mx-smtp222.site10.com Webmails sütunu aynı satırın etki alanları sütununu içeren satırları almak istiyorum. Yukarıdaki örnek için çıktı şu şekilde olmalıdır: site1.com,mail.site1.com site3.com,mx.site3.com site4.com,smtp.site4.com site7.com,webmail.site7.com site8.com,01mx.site8.com site10.com,mx-smtp222.site10.com

7
Yalnızca tam sayıda sınırlayıcı içeren satırları sakla
Virgülle ayrılmış 10 alanlı büyük bir csv dosyam var. Ne yazık ki, bazı satırlar hatalı biçimlendirilmiş ve tam olarak 10 virgül içermiyor (dosyayı R'ye okumak istediğimde bazı sorunlara neden oluyor). Yalnızca tam olarak 10 virgül içeren satırları nasıl filtreleyebilirim?
9 csv  filter 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.