Ben aşağıdaki gibi aynı biçimde, hiçbir ayırıcı karakter ile URL çok uzun bir dizi var:
http://example.comhttp://example.nethttp://example.orghttp://etc...
Her URL'nin yeni bir satırda olmasını istiyorum. Sed kullanarak "http: //" tüm örneklerini "\ nhttp: //" ile değiştirerek yapmaya çalıştım
sed 's_http://_\nhttp://_g' urls.txt
ancak bir segmentasyon hatası oluşur (bellek ihlali). Ben sadece dosya büyüklüğü (100GB üzerinde) sed bazı sınırı aşmasına neden olduğunu tahmin edebilirsiniz.
Dosyayı işlenmek üzere birkaç küçük dosyaya bölebilirim, ancak tüm "http: //" örneklerinin sağlam kalması gerekir.
Bunu yapmanın daha iyi bir yolu var mı?